ScrumSourcing: retos de la postedición colaborativa para la Copa Mundial de Rugby 2019

Hartley, Anthony; He, Beibei; Utiyama, Masao; Isahara, Hitoshi; Sumita, Eiichiro

Título

dc.contributor.author	Hartley, Anthony
dc.contributor.author	He, Beibei
dc.contributor.author	Utiyama, Masao
dc.contributor.author	Isahara, Hitoshi
dc.contributor.author	Sumita, Eiichiro
dc.date.accessioned	2020-03-10T09:02:07Z
dc.date.available	2020-03-10T09:02:07Z
dc.date.issued	2018-12-31
dc.identifier.citation	CLINA: an interdisciplinary journal of translation, interpreting and intercultural communication, 4 (2018)
dc.identifier.issn	2444-1961
dc.identifier.uri	http://hdl.handle.net/10366/141608
dc.description.abstract	This paper describes challenges facing the ScrumSourcing project to create a neural machine translation (NMT) service aiding interaction between Japanese- and English-speaking fans during Rugby World Cup 2019 in Japan. This is an example of «domain adaptation». The best training data for adapting NMT is large volumes of translated sentences typical of the domain. In reality, however, such parallel data for rugby does not exist. The problem is compounded by a marked asymmetry between the two languages in conventions for post-match reports; and the almost total absence of in-match commentaries in Japanese. In post-editing the NMT output to incrementally improve quality via retraining, volunteer rugby fans will play a crucial role in determining a new genre in Japanese. To avoid de-motivating the volunteers at the outset we undertake an initial adaptation of the system using terminological data. This paper describes the compilation of this data and its effects on the quality of the systems’ output.
dc.description.abstract	Este documento describe los retos a los que se enfrenta el proyecto ScrumSourcing para crear un servicio de traducción automática neuronal (NMT) que ayude a la interacción entre los aficionados de habla japonesa e inglesa durante la Copa Mundial de Rugby de 2019 en Japón. Este es un ejemplo de «adaptación al dominio». Los mejores datos de entrenamiento para adaptar la NMT son grandes volúmenes de oraciones traducidas típicas del dominio. Sin embargo, en la realidad no existen tales datos paralelos para el rugby. El problema se agrava por una marcada asimetría entre las dos lenguas en las convenciones para los informes posteriores al partido y la ausencia casi total de comentarios emitidos en directo durante el partido en japonés. En la post-edición de la producción de la NMT para mejorar de forma incremental la calidad a través del reentrenamiento, los voluntarios aficionados al rugby desempeñarán un papel crucial en la determinación de un nuevo género en japonés. Para evitar desmotivar a los voluntarios desde el principio, emprenderemos una adaptación inicial del sistema utilizando datos terminológicos. Este documento describe la compilación de estos datos y sus efectos en la calidad de la producción de los sistemas.
dc.format.mimetype	application/pdf
dc.language.iso	eng
dc.publisher	Ediciones Universidad de Salamanca (España)
dc.rights	info:eu-repo/semantics/openAccess
dc.subject	Traducción e interpretación
dc.subject	Translation and interpretation
dc.title	ScrumSourcing: retos de la postedición colaborativa para la Copa Mundial de Rugby 2019
dc.title.alternative	ScrumSourcing: Challenges of Collaborative Post-editing for Rugby World Cup 2019
dc.type	info:eu-repo/semantics/article
dc.rights.accessRights	info:eu-repo/semantics/openAccess

Fichier(s) constituant ce document

Nom:: ScrumSourcing_retos_de_la_post ...
Taille:: 614.4Ko
Format:: PDF

Voir/Ouvrir

Ce document figure dans la(les) collection(s) suivante(s)

Untitled [14]

Afficher la notice abrégée