Afficher la notice abrégée

dc.contributor.authorCanal-Alonso, Ángel
dc.contributor.authorJiménez, Pedro
dc.contributor.authorEgido, Noelia
dc.contributor.authorPrieto Tejedor, Javier 
dc.contributor.authorCorchado Rodríguez, Juan Manuel 
dc.date.accessioned2023-10-03T09:02:47Z
dc.date.available2023-10-03T09:02:47Z
dc.date.issued2022
dc.identifier.urihttp://hdl.handle.net/10366/153122
dc.description.abstract[ES]La secuenciación de nueva generación (NGS) ha revolucionado el campo de la genómica, permitiendo una mirada detallada y precisa del ADN. A medida que esta tecnología avanzó, surgió la necesidad de formatos de archivo estandarizados para representar, analizar y almacenar los vastos conjuntos de datos producidos. En este artículo, revisamos los formatos de archivo clave utilizados en NGS: FASTA, FASTQ, BED, GFF y VCF. El formato FASTA, uno de los más antiguos, proporciona una representación básica de secuencias genómicas y proteicas, identificables por encabezados únicos. FASTQ es esencial para NGS, ya que almacena tanto la secuencia como la información de calidad asociada. BED ofrece una representación tabular de loci genómicos, mientras que GFF detalla la localización y estructura de características genómicas en secuencias de referencia. Finalmente, VCF ha emergido como el estándar predominante para documentar variantes genéticas, desde simples SNPs hasta variantes estructurales complejas. La adopción y adaptación de estos formatos han sido fundamentales para el progreso en la bioinformática y la genómica. Proporcionan una base sobre la cual se construyen análisis sofisticados, desde el descubrimiento de genes y la predicción de funciones, hasta la identificación de variantes asociadas con enfermedades. Con una comprensión clara de estos formatos, los investigadores y profesionales están mejor equipados para aprovechar el poder y el potencial de la secuenciación de nueva generación..es_ES
dc.description.sponsorshipEl presente estudio ha sido financiado por el proyecto AIR Genomics (con número de expediente CCTT3/20/SA/0003), mediante la convocatoria 2020 PROYECTOS I+D ORIENTADOS A LA EXCELENCIA Y MEJORA COMPETITIVA DE LOS CCTT por el Instituto de Competitividad Empresarial de Castilla y León y fondos FEDERes_ES
dc.language.isospaes_ES
dc.subjectNext-Generation sequencinges_ES
dc.subjectFile formates_ES
dc.subjectData sharinges_ES
dc.titleFormatos de archivo utilizados en secuenciación de nueva generación: Una revisión bibliográficaes_ES
dc.typeinfo:eu-repo/semantics/articlees_ES
dc.subject.unesco1203.17 Informáticaes_ES
dc.subject.unesco2409 Genéticaes_ES
dc.relation.projectIDCCTT3/20/SA/0003es_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.type.hasVersioninfo:eu-repo/semantics/publishedVersiones_ES


Fichier(s) constituant ce document

Thumbnail

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée