Compartir
Título
Arquitectura de Deep Symbolic Learning para Variant Calling en NGS
Autor(es)
Palabras clave
Next-Generation sequencing
Explainable Artificial Intelligence
Deep Symbolic Learning
Clasificación UNESCO
1203.04 Inteligencia Artificial
2410.07 Genética Humana
Fecha de publicación
2022
Resumen
[ES]El proceso de Detección de Variantes (Variant Calling) es fundamental en la bioinformática, demandando una precisión y
confiabilidad máximas. Este estudio examina una estrategia innovadora de integración entre un pipeline tradicional
desarrollado in-house y un avanzado Sistema Inteligente (SI). Si bien el pipeline original ya contaba con herramientas
basadas en algoritmos tradicionales, presentaba limitaciones, particularmente en la detección de variantes raras o
desconocidas. Por tanto, se introdujo el SI con el objetivo de proporcionar una capa adicional de análisis, capitalizando las
técnicas de aprendizaje profundo y simbólico para mejorar y potenciar las detecciones previas.
El principal desafío técnico residía en la interoperabilidad. Para superar esto, se empleó NextFlow, un lenguaje de scripting
diseñado para gestionar flujos de trabajo bioinformáticos complejos. Mediante NextFlow, se facilitó la comunicación y el
traspaso eficiente de datos entre el pipeline original y el SI, garantizando así la compatibilidad y reproducibilidad.
Posterior al proceso de Variant Calling del sistema original, se transmitían los resultados al SI, donde se implementaba una
secuencia meticulosa de análisis, desde el preprocesamiento hasta la fusión de datos. Como resultado, se generaba un
conjunto optimizado de variantes que se integraban con los resultados previos. Las variantes corroboradas por ambas
herramientas se consideraban de alta fiabilidad, mientras que las discrepancias indicaban áreas para investigaciones
detalladas.
El producto de esta integración avanzaba a etapas subsiguientes del pipeline, usualmente de anotación o interpretación,
contextualizando las variantes desde perspectivas biológicas y clínicas. Esta adaptación no solo mantuvo las funcionalidades
originales del pipeline, sino que también se potenció con el SI, estableciendo un nuevo estándar en el proceso de Variant
Calling. Esta investigación ofrece un modelo robusto y eficiente para la detección y análisis de variantes genómicas,
destacando la promesa y aplicabilidad del aprendizaje combinado en la bioinformática..
URI
Aparece en las colecciones
- BISITE. Artículos [369]












