Zur Kurzanzeige

dc.contributor.advisorPaz Santana, Juan Francisco de es_ES
dc.contributor.advisorLópez Batista, Vivian Félix es_ES
dc.contributor.authorGarcía Encinas, Francisco 
dc.date.accessioned2025-05-06T11:23:44Z
dc.date.available2025-05-06T11:23:44Z
dc.date.issued2024-02
dc.identifier.urihttp://hdl.handle.net/10366/164933
dc.descriptionTrabajo de Fin de Máster. Máster en Ingeniería Informática. Curso académico 2023-2024.es_ES
dc.description.abstract[ES]El japonés tiene muchas diferencias con respecto a los lenguajes occidentales. Entre ellas, una de las más notables es el uso de caracteres logográficos, esto es, caracteres que por sí mismos tienen un significado, los kanjis. Existen aproximadamente 3.000 kanji de uso común, pero la cifra puede aumentar hasta unos 13.000 si se consideran estándares técnicos o, incluso, 50.000 si se consideran kanjis infrecuentes. Como se puede suponer, para un nativo de una lengua occidental, que no está acostumbrado al uso de esta clase de caracteres, estudiar japonés no es una tarea sencilla. De hecho, el Foreign Service Institute de Estados Unidos lo clasifica como uno de los lenguajes más difíciles. Este trabajo pretende analizar las aplicaciones existentes en el campo del aprendizaje de la lengua japonesa, centrándose en el estudio de kanjis, y mejorar sobre ellas. Para ello, se desarrollará una aplicación web que potencie la experiencia de aprendizaje por medio de técnicas de inteligencia artificial, específicamente, embeddings para encontrar kanjis similares. Gracias a esto se ayudará a los usuarios a detectar más fácilmente las diferencias. También, se hará uso de algoritmos de repetición espaciada con el objetivo de alcanzar una frecuencia de estudio óptima. Para implementar esta aplicación se hace uso de bastantes herramientas diferentes, desde TypeScript con NestJS para el servidor hasta Python con PyTorch para los modelos pasando por TypeScript con React para el cliente. Además, se utiliza una base de datos PostgreSQL con el plugin pgVector para almacenar los vectores de embedding y realizar consultas sobre ellos. También se utiliza Kuromoji y parsers implementados con Parsimmon para diversas tareas de procesamiento del lenguaje natural.es_ES
dc.description.abstract[EN]Japanese is very different from occidental languages. Among them, one of the most notable differences is the usage of logographic characters, that is, characters that have a meaning on their own, the kanjis. There are around 3.000 frequently used kanji, but this count can increase to up to 13.000 if we consider technical standards, or even 50.000 if more infrequent characters are considered. Obviously, studying Japanese is not a simple task for a native speaker of an occidental language since they are not accustomed to these kinds of characters. Indeed, the Foreign Service Institute of the United States of America classifies Japanese as one of the hardest languages. This work analyzes already existing Japanese studying applications, especially those centered around kanjis, and improves over them. To do this, we propose a web application that empowers the learning process with the use of artificial intelligence algorithms, specifically, embeddings to find similar kanjis. Thanks to these users can learn differences between similar kanjis in a simple way. Also, the spaced repetition algorithm is used to reach an optimal review frequency. Many different tools have been used to develop this application, from TypeScript with NestJS for the server to Python with Pytorch for the machine learning models passing by TypeScript with React for the from. Furthermore, a PostgreSQL database with the pgVector plugin is used to store embedding vectors and query them. Also, Kuromoji and some custom parsers developed using Parsimmon are used for natural language processing.
dc.language.isospaes_ES
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectJaponéses_ES
dc.subjectEstudioes_ES
dc.subjectAplicaciónes_ES
dc.subjectWebes_ES
dc.subjectJapanesees_ES
dc.subjectStudyes_ES
dc.subjectAppes_ES
dc.titleAplicación para el estudio de japonéses_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
dc.subject.unesco1203.23 Lenguajes de Programaciónes_ES
dc.subject.unesco1203.04 Inteligencia Artificiales_ES
dc.subject.unesco1209.03 Análisis de Datoses_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES


Dateien zu dieser Ressource

Thumbnail

Das Dokument erscheint in:

Zur Kurzanzeige

Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Solange nicht anders angezeigt, wird die Lizenz wie folgt beschrieben: Attribution-NonCommercial-NoDerivatives 4.0 Internacional