Compartir
Título
Formatos de archivo utilizados en secuenciación de nueva generación: Una revisión bibliográfica
Autor(es)
Palabras clave
Next-Generation sequencing
File format
Data sharing
Clasificación UNESCO
1203.17 Informática
2409 Genética
Fecha de publicación
2022
Resumen
[ES]La secuenciación de nueva generación (NGS) ha revolucionado el campo de la genómica, permitiendo una mirada detallada y
precisa del ADN. A medida que esta tecnología avanzó, surgió la necesidad de formatos de archivo estandarizados para
representar, analizar y almacenar los vastos conjuntos de datos producidos. En este artículo, revisamos los formatos de
archivo clave utilizados en NGS: FASTA, FASTQ, BED, GFF y VCF.
El formato FASTA, uno de los más antiguos, proporciona una representación básica de secuencias genómicas y proteicas,
identificables por encabezados únicos. FASTQ es esencial para NGS, ya que almacena tanto la secuencia como la
información de calidad asociada. BED ofrece una representación tabular de loci genómicos, mientras que GFF detalla la
localización y estructura de características genómicas en secuencias de referencia. Finalmente, VCF ha emergido como el
estándar predominante para documentar variantes genéticas, desde simples SNPs hasta variantes estructurales complejas.
La adopción y adaptación de estos formatos han sido fundamentales para el progreso en la bioinformática y la genómica.
Proporcionan una base sobre la cual se construyen análisis sofisticados, desde el descubrimiento de genes y la predicción de
funciones, hasta la identificación de variantes asociadas con enfermedades. Con una comprensión clara de estos formatos, los
investigadores y profesionales están mejor equipados para aprovechar el poder y el potencial de la secuenciación de nueva
generación..
URI
Aparece en las colecciones
- BISITE. Artículos [369]












