Formatos de archivo utilizados en secuenciación de nueva generación: Una revisión bibliográfica

Canal-Alonso, Ángel; Jiménez, Pedro; Egido, Noelia; Prieto Tejedor, Javier; Corchado Rodríguez, Juan Manuel

Título

dc.contributor.author	Canal-Alonso, Ángel
dc.contributor.author	Jiménez, Pedro
dc.contributor.author	Egido, Noelia
dc.contributor.author	Prieto Tejedor, Javier
dc.contributor.author	Corchado Rodríguez, Juan Manuel
dc.date.accessioned	2023-10-03T09:02:47Z
dc.date.available	2023-10-03T09:02:47Z
dc.date.issued	2022
dc.identifier.uri	http://hdl.handle.net/10366/153122
dc.description.abstract	[ES]La secuenciación de nueva generación (NGS) ha revolucionado el campo de la genómica, permitiendo una mirada detallada y precisa del ADN. A medida que esta tecnología avanzó, surgió la necesidad de formatos de archivo estandarizados para representar, analizar y almacenar los vastos conjuntos de datos producidos. En este artículo, revisamos los formatos de archivo clave utilizados en NGS: FASTA, FASTQ, BED, GFF y VCF. El formato FASTA, uno de los más antiguos, proporciona una representación básica de secuencias genómicas y proteicas, identificables por encabezados únicos. FASTQ es esencial para NGS, ya que almacena tanto la secuencia como la información de calidad asociada. BED ofrece una representación tabular de loci genómicos, mientras que GFF detalla la localización y estructura de características genómicas en secuencias de referencia. Finalmente, VCF ha emergido como el estándar predominante para documentar variantes genéticas, desde simples SNPs hasta variantes estructurales complejas. La adopción y adaptación de estos formatos han sido fundamentales para el progreso en la bioinformática y la genómica. Proporcionan una base sobre la cual se construyen análisis sofisticados, desde el descubrimiento de genes y la predicción de funciones, hasta la identificación de variantes asociadas con enfermedades. Con una comprensión clara de estos formatos, los investigadores y profesionales están mejor equipados para aprovechar el poder y el potencial de la secuenciación de nueva generación..	es_ES
dc.description.sponsorship	El presente estudio ha sido financiado por el proyecto AIR Genomics (con número de expediente CCTT3/20/SA/0003), mediante la convocatoria 2020 PROYECTOS I+D ORIENTADOS A LA EXCELENCIA Y MEJORA COMPETITIVA DE LOS CCTT por el Instituto de Competitividad Empresarial de Castilla y León y fondos FEDER	es_ES
dc.language.iso	spa	es_ES
dc.subject	Next-Generation sequencing	es_ES
dc.subject	File format	es_ES
dc.subject	Data sharing	es_ES
dc.title	Formatos de archivo utilizados en secuenciación de nueva generación: Una revisión bibliográfica	es_ES
dc.type	info:eu-repo/semantics/article	es_ES
dc.subject.unesco	1203.17 Informática	es_ES
dc.subject.unesco	2409 Genética	es_ES
dc.relation.projectID	CCTT3/20/SA/0003	es_ES
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es_ES
dc.type.hasVersion	info:eu-repo/semantics/publishedVersion	es_ES

Ficheros en el ítem

Nombre:: Format_NGS_es.pdf
Tamaño:: 255.9Kb
Formato:: PDF

Visualizar/Abrir

Este ítem aparece en la(s) siguiente(s) colección(ones)

BISITE. Artículos [370]

Mostrar el registro sencillo del ítem