Zur Kurzanzeige

dc.contributor.authorSánchez Holgado, Patricia 
dc.contributor.authorMartín-Merino Acera, Manuel
dc.contributor.authorBlanco Herrero, David 
dc.date.accessioned2024-11-28T10:38:12Z
dc.date.available2024-11-28T10:38:12Z
dc.date.issued2020-01-17
dc.identifier.citationSánchez Holgado, P., Martín Merino, M., & Blanco Herrero, D. (2020). Del data-driven al data-feeling: análisis de sentimiento en tiempo real de mensajes en español sobre divulgación científica usando técnicas de aprendizaje automático. Anuario Electrónico de Estudios en Comunicación Social “Disertaciones”, 13(1), 35-58. https://doi.org/10.12804/revistas.urosario.edu.co/disertaciones/a.7691es_ES
dc.identifier.urihttp://hdl.handle.net/10366/160794
dc.description.abstract[ES] Los cambios producidos en los últimos años en cuanto a modelos de comunicación social han llevado a todos los sectores a adaptarse a los nuevos medios para alcanzar a su público. La comunicación de la ciencia no es una excepción. La manera en que se distribuyen contenidos sobre ciencia está cambiando debido a la presencia creciente de tecnologías, y la red social Twitter se ha convertido en un importante aliado debido a su gran volumen de usuarios. En el presente trabajo, se utilizan técnicas de aprendizaje automático para desarrollar un clasificador —que funciona en tiempo real— de sentimiento relacionados con mensajes publicados en Twitter. Para ello, se descargaron 200 000 tweets destinados a construir un corpus de entrenamiento limpio y procesado de 10 000 textos etiquetados, la mitad positivos y la mitad negativos, sobre ciencia en español. El corpus permite entrenar el modelo de aprendizaje automático y construir un prototipo OpScience, capaz de determinar el sentimiento de mensajes publicados en Twitter en tiempo real. Los resultados relacionados con la exactitud del clasificador corresponden al 72 %. Estos resultados pueden ayudar a darle mayor valor a temas de la comunicación científica en un espacio de debate social y predecir intereses o tendencias futuras, como se pudo comprobar en una prueba en enero de 2019. [EN] The changes produced in recent years in social communication models have meant that all sectors have had to adapt to new media to reach their audiences. The communication of science is no exception. The distribution of contents about science is adapting to an increasing presence of technologies, and the social network Twitter has become a necessary ally due to its large volume of users. In this paper, machine learning techniques are used to develop a sentiment classifier of messages posted in real-time on Twitter. To this end, 200 000 tweets were downloaded to build a training corpus of 10 000 clean and processed labeled texts, half positive and half negative, about science in Spanish. This corpus allows the training of the machine learning model and builds a prototype, OpScience, able to determine the sentiment of messages posted on Twitter in real-time. The accuracy results obtained by the classifier is around 72 %. This can help to assess issues of scientific communication in a space of social debate and predict future interests or trends, as observed during the test in January 2019. [POR] As mudanças produzidas nos últimos anos nos modelos de comunicação social têm levado a todos os setores a se adaptar aos novos meios para alcançar a seu público. A comunicação da ciência não é uma exceção. A maneira em que se distribuem conteúdos sobre ciência está adaptando-se a uma presença crescente de tecnologias, e a rede social Twitter se tem convertido em um importante aliado devido a seu grande volume de usuários. Neste trabalho se utilizam técnicas de aprendizagem automática para desenvolver um classificador de sentimento de mensagens publicados em tempo real no Twitter. Para isto, descarregaram-se 200 000 tweets destinados a construir um corpus de treino limpo e processado de 10 000 textos etiquetados, metade positivos e metade negativos, sobre ciência em espanhol. O corpus permite treinar o modelo de aprendizagem automático e construir um protótipo, OpScience, capaz de determinar o sentimento de mensagens publicados no Twitter em tempo real. Os resultados de concordância do classificador situam-se em um 72 %. Isto pode ajudar a valorar temas de comunicação científica em um espaço de debate social e predecir interesses ou tendências futuras, como se conseguiu comprovar em uma prova em janeiro de 2019.es_ES
dc.format.mimetypeapplication/pdf
dc.language.isospaes_ES
dc.publisherUniversidad del Rosario de Colombia, la Universidad de los Andes de Venezuela y la Universidad Complutense de Madrid.es_ES
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectAnálisis de sentimientoes_ES
dc.subjectTwitteres_ES
dc.subjectAprendizaje automatico supervisadoes_ES
dc.subjectComunicación científicaes_ES
dc.subjectSentiment analysises_ES
dc.subjectSupervised machine learninges_ES
dc.subjectScientific communicationes_ES
dc.subjectAnálise de Sentimentoes_ES
dc.subjectAprendizagem automática supervisadaes_ES
dc.subjectComunicação científicaes_ES
dc.titleDel data-driven al data-feeling: análisis de sentimiento en tiempo real de mensajes en español sobre divulgación científica usando técnicas de aprendizaje automáticoes_ES
dc.title.alternativeFrom Data-Driven to Data-Feeling: Sentiment Analysis in Real-Time of Messages in Spanish about Scientific Communication Using Machine Learning Techniqueses_ES
dc.title.alternativeDo data-driven ao data-feeling: análise de sentimento no tempo real de mensagens em espanhol sobre divulgação científica usando técnicas de aprendizagem automáticaes_ES
dc.typeinfo:eu-repo/semantics/articlees_ES
dc.relation.publishversionhttps://doi.org/10.12804/revistas.urosario.edu.co/disertaciones/a.7691es_ES
dc.subject.unesco63 Sociologíaes_ES
dc.subject.unesco6308 Comunicaciones Socialeses_ES
dc.identifier.doi10.12804/REVISTAS.UROSARIO.EDU.CO/DISERTACIONES/A.7691
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.identifier.essn1856-9536
dc.journal.titleAnuario Electrónico de Estudios en Comunicación Social "Disertaciones"es_ES
dc.volume.number13es_ES
dc.issue.number1es_ES
dc.page.initial35es_ES
dc.page.final58es_ES
dc.type.hasVersioninfo:eu-repo/semantics/publishedVersiones_ES


Dateien zu dieser Ressource

Thumbnail

Das Dokument erscheint in:

Zur Kurzanzeige

Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Solange nicht anders angezeigt, wird die Lizenz wie folgt beschrieben: Attribution-NonCommercial-NoDerivatives 4.0 Internacional