Detectando el odio ideológico en Twitter. Desarrollo y evaluación de un detector de discurso de odio por ideología política en tuits en español

Jiménez Amores, Francisco Javier; Blanco Herrero, David; Sánchez Holgado, Patricia; Frías Vázquez, Maximiliano

doi:10.7764/cdi.49.27817

Título

Detectando el odio ideológico en Twitter. Desarrollo y evaluación de un detector de discurso de odio por ideología política en tuits en español

dc.contributor.author	Jiménez Amores, Francisco Javier
dc.contributor.author	Blanco Herrero, David
dc.contributor.author	Sánchez Holgado, Patricia
dc.contributor.author	Frías Vázquez, Maximiliano
dc.date.accessioned	2024-11-28T09:32:15Z
dc.date.available	2024-11-28T09:32:15Z
dc.date.issued	2021-04-19
dc.identifier.citation	Jiménez Amores, J., Blanco Herrero, D., Sánchez Holgado, P., & Frías Vázquez, M. (2021). Detectando el odio ideológico en Twitter. Desarrollo y evaluación de un detector de discurso de odio por ideología política en tuits en español. Cuadernos.Info, 49, 98-124. https://doi.org/10.7764/cdi.49.27817	es_ES
dc.identifier.issn	0719-3661
dc.identifier.uri	http://hdl.handle.net/10366/160787
dc.description.abstract	[ES] El discurso de odio propagado a través de redes sociales como Twitter merece atención especial, ya que su incremento puede relacionarse con el aumento de crímenes de odio. De las 11 categorías de discriminación que contempla el Ministerio de Interior de España, la segunda en la que más delitos de odio se registran al año es la ideología. Sin embargo, esta categoría queda fuera de la mayor parte de los planes de acción para estudiar y combatir los delitos de odio. Lo mismo ocurre con los trabajos académicos, que se centran mayoritariamente en el odio en inglés y a nivel general. Los que estudian un único tipo de odio se han enfocado en el racismo, la xenofobia o la discriminación de género, pero nunca en la ideología política. Asimismo, los prototipos de detección desarrollados hasta ahora no usan bases de datos generadas manualmente por varios codificadores. Esta investigación busca superar estas limitaciones, desarrollando y evaluando un detector automático de discurso de odio por motivos ideológicos en Twitter en español a partir de técnicas de aprendizaje automático supervisado. Para ello, se ha desarrollado un total de ocho modelos predictivos a partir de un corpus de entrenamiento generado ad-hoc, y haciendo uso de modelado superficial y de aprendizaje profundo, lo que permite mejorar el rendimiento final del prototipo. El desarrollo del corpus permitió observar, además, que un 16,2% de la muestra, recogida en el otoño de 2019, incluyó algún tipo de odio ideológico. [EN] Hate speech spread through social media such as Twitter deserves special attention, as its increase may be related to the rise in hate crimes. Of the 11 categories of discrimination contemplated by the Spanish Ministry of Internal Affairs, the second in which the most hate crimes are registered per year is political ideology. However, this category falls outside of most action plans to study and combat hate crimes. The same occurs in the case of academic works since most focus on analyzing and detecting hate in English and at a general level. The few authors who have targeted their studies to a single type of hate to improve accuracy, have focused on racism, xenophobia, or gender discrimination, but never on political ideology. Furthermore, the detection prototypes developed so far have not used databases generated manually by various coders. This paper aims to overcome these limitations, developing and evaluating an automatic hate speech detector on Twitter in Spanish for reasons of ideological discrimination, using supervised machine learning techniques. For this, we developed a total of eight predictive models from an ad-hoc generated training corpus, and making use of shallow modelling, but also deep learning, which has allowed to improve the final performance of the prototype. In addition, the development of the corpus allowed us to observe that 16.2% of the sample, collected in autumn 2019 and manually analyzed, included some type of ideological hatred. [POR] O discurso de ódio que se espalha pelas redes sociais como o Twitter merece atenção especial, pois seu aumento pode estar relacionado ao aumento dos crimes de ódio. Das onze categorias de discriminação contempladas pelo Ministério do Interior da Espanha, a segunda em que mais crimes de ódio são registrados por ano é a ideologia política. No entanto, esta categoria está fora da maioria dos planos de ação para estudar e combater os crimes de ódio. O mesmo acontece com os trabalhos acadêmicos, já que a maioria concentra-se em analisar e detectar o ódio em inglês e em um nível geral, e os poucos autores que limitaram seus estudos a um único tipo de ódio concentraram-se no racismo, xenofobia ou discriminação de gênero, mas nunca na ideologia política. Além disso, os protótipos de detecção desenvolvidos até o momento não usaram bancos de dados gerados manualmente por vários codificadores. A presente pesquisa visa superar essas limitações, desenvolvendo e avaliando um detector automático de discurso de ódio no Twitter em espanhol por motivos de discriminação ideológica, baseado em técnicas de aprendizagem automática supervisionada. Para isso, foram desenvolvidos um total de 8 modelos preditivos a partir de um corpus de treinamento gerado ad-hoc, e fazendo uso de modelagem superficial, mas também de aprendizagem profunda, que tem permitido melhorar o desempenho final do protótipo. O processo de elaboração do corpus também nos permitiu observar que 16,2% da amostra, coletada no outono de 2019, incluía algum tipo de ódio ideológico.	es_ES
dc.description.sponsorship	Este trabajo fue desarrollado en el marco del proyecto STOP-HATE. Desarrollo y Evaluación de un detector del discurso de odio en línea en español [PC-TCUE18- 20_016], prueba de concepto competitiva liderada por el Dr. Carlos Arcila Calderón, y financiada por el Fondo Europeo de Desarrollo Regional y la Junta de Castilla y León a través del PLAN T-CUE de la Fundación General de la Universidad de Salamanca (2018-2020). Los autores agradecen especialmente su participación e implicación en el proyecto al Dr. Félix Ortega Mohedano y a todos los estudiantes de la Universidad de Salamanca que colaboraron en las tareas de codificación, sin las que hubiera sido imposible desarrollar este trabajo.	es_ES
dc.format.mimetype	application/pdf
dc.language.iso	spa	es_ES
dc.publisher	Pontificia Universidad Católica de Chile: Facultad de Comunicaciones	es_ES
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 Internacional	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject	Twitter	es_ES
dc.subject	Ideología política	es_ES
dc.subject	Aprendizaje profundo	es_ES
dc.subject	Aprendizaje automático	es_ES
dc.subject	Clasificación supervisada	es_ES
dc.subject	Discurso de odio	es_ES
dc.subject	Odio en línea	es_ES
dc.subject	Hate speech	es_ES
dc.subject	Online hate	es_ES
dc.subject	Political ideology	es_ES
dc.subject	Deep learning	es_ES
dc.subject	Machine learning	es_ES
dc.subject	Supervised classification	es_ES
dc.subject	Discurso de ódio	es_ES
dc.subject	Ódio online	es_ES
dc.subject	Ideología política	es_ES
dc.subject	Aprendizagem profunda	es_ES
dc.subject	Aprendizagem de máquina	es_ES
dc.subject	Classificação supervisionada	es_ES
dc.title	Detectando el odio ideológico en Twitter. Desarrollo y evaluación de un detector de discurso de odio por ideología política en tuits en español	es_ES
dc.title.alternative	Detecting ideological hatred on Twitter. Development and evaluation of a political ideology hate speech detector in tweets in Spanish	es_ES
dc.title.alternative	Detectando o ódio ideológico no Twitter. Desenvolvimento e avaliação de um detector de discurso de ódio por ideologia política no Twitter em espanhol	es_ES
dc.type	info:eu-repo/semantics/article	es_ES
dc.relation.publishversion	https://doi.org/10.7764/cdi.49.27817	es_ES
dc.subject.unesco	63 Sociología	es_ES
dc.subject.unesco	6308 Comunicaciones Sociales	es_ES
dc.identifier.doi	10.7764/cdi.49.27817
dc.relation.projectID	PC-TCUE18- 20_016	es_ES
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es_ES
dc.identifier.essn	0719-367x
dc.journal.title	Cuadernos.Info	es_ES
dc.volume.number	49	es_ES
dc.page.initial	98	es_ES
dc.page.final	124	es_ES
dc.type.hasVersion	info:eu-repo/semantics/publishedVersion	es_ES