| dc.contributor.author | Canal-Alonso, Ángel | |
| dc.contributor.author | Jiménez, Pedro | |
| dc.contributor.author | Egido, Noelia | |
| dc.contributor.author | Prieto Tejedor, Javier | |
| dc.contributor.author | Corchado Rodríguez, Juan Manuel | |
| dc.date.accessioned | 2023-10-03T09:02:47Z | |
| dc.date.available | 2023-10-03T09:02:47Z | |
| dc.date.issued | 2022 | |
| dc.identifier.uri | http://hdl.handle.net/10366/153122 | |
| dc.description.abstract | [ES]La secuenciación de nueva generación (NGS) ha revolucionado el campo de la genómica, permitiendo una mirada detallada y
precisa del ADN. A medida que esta tecnología avanzó, surgió la necesidad de formatos de archivo estandarizados para
representar, analizar y almacenar los vastos conjuntos de datos producidos. En este artículo, revisamos los formatos de
archivo clave utilizados en NGS: FASTA, FASTQ, BED, GFF y VCF.
El formato FASTA, uno de los más antiguos, proporciona una representación básica de secuencias genómicas y proteicas,
identificables por encabezados únicos. FASTQ es esencial para NGS, ya que almacena tanto la secuencia como la
información de calidad asociada. BED ofrece una representación tabular de loci genómicos, mientras que GFF detalla la
localización y estructura de características genómicas en secuencias de referencia. Finalmente, VCF ha emergido como el
estándar predominante para documentar variantes genéticas, desde simples SNPs hasta variantes estructurales complejas.
La adopción y adaptación de estos formatos han sido fundamentales para el progreso en la bioinformática y la genómica.
Proporcionan una base sobre la cual se construyen análisis sofisticados, desde el descubrimiento de genes y la predicción de
funciones, hasta la identificación de variantes asociadas con enfermedades. Con una comprensión clara de estos formatos, los
investigadores y profesionales están mejor equipados para aprovechar el poder y el potencial de la secuenciación de nueva
generación.. | es_ES |
| dc.description.sponsorship | El presente estudio ha sido financiado por el proyecto AIR
Genomics (con número de expediente CCTT3/20/SA/0003),
mediante la convocatoria 2020 PROYECTOS I+D
ORIENTADOS A LA EXCELENCIA Y MEJORA
COMPETITIVA DE LOS CCTT por el Instituto de
Competitividad Empresarial de Castilla y León y fondos
FEDER | es_ES |
| dc.language.iso | spa | es_ES |
| dc.subject | Next-Generation sequencing | es_ES |
| dc.subject | File format | es_ES |
| dc.subject | Data sharing | es_ES |
| dc.title | Formatos de archivo utilizados en secuenciación de nueva generación: Una revisión bibliográfica | es_ES |
| dc.type | info:eu-repo/semantics/article | es_ES |
| dc.subject.unesco | 1203.17 Informática | es_ES |
| dc.subject.unesco | 2409 Genética | es_ES |
| dc.relation.projectID | CCTT3/20/SA/0003 | es_ES |
| dc.rights.accessRights | info:eu-repo/semantics/openAccess | es_ES |
| dc.type.hasVersion | info:eu-repo/semantics/publishedVersion | es_ES |