Herramientas de etiquetado de imágenes mediante aprendizaje activo

Martín Ramos, José María

Título

Herramientas de etiquetado de imágenes mediante aprendizaje activo

Autor(es)

Martín Ramos, José María

Director(es)

Paz Santana, Juan Francisco de

Villarrubia González, Gabriel

Palabras clave

Inteligencia Artificial

Red neuronal

Aprendizaje activo

Clasificación de imágenes

Artificial Inteligence

Neural Network

Active learning

Imagen Classification

Clasificación UNESCO

1203.04 Inteligencia Artificial

1203.02 Lenguajes Algorítmicos

Fecha de publicación

2023-09

Resumen

[ES]La inteligencia artificial es un campo que está ganando cada vez más y más popularidad. Ya está presente en nuestra vida diaria, alcanzado unos avances espectaculares en todos los campos, tales como la medicina, investigación o industria. Una de sus ramas más conocidas es la visión artificial, que pretende que las máquinas consigan percibir y comprender las imágenes y actuar de la forma que se les indique. En esta rama se encuadran algoritmos de clasificación de imágenes, entre otros. Uno de los métodos que mejores resultados da en estos casos de uso son las redes neuronales convolucionales, que son redes neuronales artificiales cuyos camposreceptivossonmuy similares a los de la corteza visual primaria (V1) de un cerebro biológico. Estas redes neuronales convolucionales requieren de un entrenamiento que necesita una ingente cantidad de imágenes etiquetadas por un ser humano con el resultado esperado del algoritmo. Dado que la tarea de etiquetado es larga y tediosa, en este trabajo de fin de grado se propone un sistema que la facilite mediante el uso de técnicas como el aprendizaje activo. Gracias a estas técnicas el sistema realizará el etiquetado de forma semi-automática, de manera que los trabajadores humanos sólo necesiten etiquetar un pequeño porcentaje de las imágenes. El sistema debe permitir la creación de distintos conjuntos de datos que podrán contener un número arbitrario de imágenes. Este trabajo de fin de grado se enfoca en el desarrollo de una aplicación Web donde los usuarios podrán clasificar sus fotos de forma inteligente. La página web está diseñada siguiendo el estilo de Material-UI, una librería Open Source que implementa Material Design de Google, lo que nos va a permitir realizar un sistema responsivo que se adapte a números dispositivos como tabletas inteligentes o móviles. En cuanto a la funcionalidad de esta plataforma comprende desde la subida de nuevas imágenes hasta su correcta clasificación, pasando por la generación de modelos y dando uso del aprendizaje activo a la hora de determinar el conjunto de imágenes necesarias a clasificar por el usuario. El almacenamiento de los datos de usuarios, conjuntos de imágenes y modelosse delega parcialmente a una base de datos de MongoDB, la otra parte de los datos, como su interpretación se alberga en un servidor backend. Se ha elaborado una memoria junto con seis anexos complementarios para documentar este proyecto. Estos anexos proporcionan información detallada sobre la planificación y la ingeniería del software del proyecto, así como manuales de ayuda destinados tanto a los programadores como a los usuarios del sistema. De esta manera, se garantiza una documentación exhaustiva y completa del proyecto.

[EN]Artificial intelligence is a field that is gaining increasing popularity. It is already present in our daily lives, achieving spectacular advancementsin variousfieldssuch as medicine, research, and industry. One of its most well-known branchesis computer vision, which aimsto enable machines to perceive and understand images and act according to instructions. Within this branch, there are image classification algorithms, among others. One of the methods that yields the best results in such cases is convolutional neural networks, which are artificial neural networks whose receptive fields closely resemble those of the primary visual cortex (V1) of a biological brain. These convolutional neural networksrequire training that involves a substantial number of images labelled by humans with the expected algorithm outcome. Since labelling is a lengthy and tedious task, this bachelor's thesis proposes a system that facilitates it through the use of techniques such as active learning. Thanks to these techniques, the system will perform labelling semi-automatically, reducing the need for human workers to label only a small percentage of the images. The system should allow the creation of different datasets that can contain an arbitrary number of images. This bachelor's thesis focuses on the development of a web application where users can intelligently classify their photos. The website is designed following the Material-UI style, an open-source library that implements Google's Material Design. This allows us to create a responsive system that adapts to various devices, such as tablets and smartphones. Regarding the functionality of this platform, it ranges from uploading new images to their proper classification, including model generation and the use of active learning to determine the set of images that the user needs to classify. The storage of user data, image datasets, and models is partially delegated to a MongoDB database, while the other part of the data, including its interpretation, is hosted on a backend server. A report, along with six complementary appendices, has been prepared to document this project. These appendices provide detailed information about project planning and software engineering, as well as user and programmer manuals. This ensures comprehensive and complete documentation of the project.

Descripción

Trabajo de Fin de Grado. Grado en Ingeniería Informática. Curso académico 2022-2023.

URI

https://hdl.handle.net/10366/158201

Collections