Compartir
Título
Humanités numériques : exploitation des archives journalistiques pour une classe de FLE
Autor(es)
Palabras clave
Corpus
Archives
Occérisation
Apprentissage sur corpus
Langue étrangère
Clasificación UNESCO
5701.07 Lengua y Literatura
Fecha de publicación
2025
Editor
Peter Lang
Citación
De Oliveira, A. P. (2025). Humanités numériques : exploitation des archives journalistiques pour une classe de FLE. En M. Gómez Campos & F. Luque Janodet (Eds.), Enfoques innovadores en la didáctica de lenguas y la traducción en la era digital. Peter Lang Group
Resumen
Este artículo se inscribe en el ámbito de las humanidades digitales y analiza la explotación didáctica de corpus de archivos periodísticos en la enseñanza del francés como lengua extranjera (FLE). El estudio se centra en la constitución y tratamiento de un corpus compuesto por artículos de prensa francesa de la Primera Guerra Mundial, seleccionados a partir de criterios socioculturales e ideológicos, y representativos de distintas líneas editoriales (Le Temps, L’Humanité, Le Figaro y La Croix).
El trabajo aborda, en primer lugar, la problemática específica de los corpus de archivos, especialmente las dificultades derivadas del proceso de digitalización y occerización (OCR), que genera errores que deben ser corregidos manualmente para garantizar la fiabilidad del análisis automatizado. Se describe detalladamente la metodología de limpieza, conversión e importación del corpus en el software TXM, así como el proceso de etiquetado morfosintáctico mediante TreeTagger.
Finalmente, el artículo pone de relieve las posibilidades que ofrece el Tratamiento Automático de las Lenguas (TAL) para el análisis comparado de discursos y para la creación de actividades didácticas basadas en corpus. Se defiende que la integración de herramientas digitales permite un aprendizaje más personalizado, interdisciplinar y fundamentado en datos lingüísticos auténticos, reforzando así el papel de las humanidades digitales en la didáctica de lenguas.
Descripción
Este artículo examina la explotación didáctica de corpus de archivos periodísticos en el marco de las humanidades digitales y de la enseñanza del francés como lengua extranjera (FLE). A partir de un corpus constituido por artículos de prensa francesa de la Primera Guerra Mundial, procedentes de distintas líneas editoriales (Le Temps, L’Humanité, Le Figaro y La Croix), el estudio aborda tanto la dimensión metodológica de la constitución del corpus como su potencial pedagógico.
Se analizan las dificultades específicas asociadas a la digitalización de documentos de archivo, especialmente los problemas derivados del proceso de reconocimiento óptico de caracteres (OCR), y se describe el procedimiento de limpieza, normalización, importación y etiquetado morfosintáctico del corpus mediante el software TXM y TreeTagger.
El trabajo defiende la integración del Tratamiento Automático de las Lenguas (TAL) como herramienta de análisis comparado del discurso y como recurso para el diseño de actividades basadas en corpus, subrayando su valor para un aprendizaje transversal, crítico y contextualizado dentro de las humanidades digitales.
URI
ISBN
978-3-631-93094-6
Aparece en las colecciones
Ficheros en el ítem
Nombre:
Humanités numériques Exploitation des archives.pdfEmbargado hasta: 2026-10-15
Tamaño:
3.236Mb
Formato:
Adobe PDF

Galería: Humanités numériques : exploitation des archives journalistiques pour une classe de FLE
Autorización Peter Lang.png














