Compartir
Título
Herramientas de etiquetado de imágenes mediante aprendizaje activo
Autor(es)
Director(es)
Palabras clave
Inteligencia Artificial
Red neuronal
Aprendizaje activo
Clasificación de imágenes
Artificial Inteligence
Neural Network
Active learning
Imagen Classification
Clasificación UNESCO
1203.04 Inteligencia Artificial
1203.02 Lenguajes Algorítmicos
Fecha de publicación
2023-09
Resumen
[ES]La inteligencia artificial es un campo que está ganando cada vez más y más popularidad.
Ya está presente en nuestra vida diaria, alcanzado unos avances espectaculares en todos
los campos, tales como la medicina, investigación o industria.
Una de sus ramas más conocidas es la visión artificial, que pretende que las máquinas
consigan percibir y comprender las imágenes y actuar de la forma que se les indique.
En esta rama se encuadran algoritmos de clasificación de imágenes, entre otros. Uno de
los métodos que mejores resultados da en estos casos de uso son las redes neuronales
convolucionales, que son redes neuronales artificiales cuyos camposreceptivossonmuy
similares a los de la corteza visual primaria (V1) de un cerebro biológico.
Estas redes neuronales convolucionales requieren de un entrenamiento que necesita
una ingente cantidad de imágenes etiquetadas por un ser humano con el resultado
esperado del algoritmo. Dado que la tarea de etiquetado es larga y tediosa, en este
trabajo de fin de grado se propone un sistema que la facilite mediante el uso de técnicas
como el aprendizaje activo.
Gracias a estas técnicas el sistema realizará el etiquetado de forma semi-automática, de
manera que los trabajadores humanos sólo necesiten etiquetar un pequeño porcentaje
de las imágenes. El sistema debe permitir la creación de distintos conjuntos de datos
que podrán contener un número arbitrario de imágenes.
Este trabajo de fin de grado se enfoca en el desarrollo de una aplicación Web donde los
usuarios podrán clasificar sus fotos de forma inteligente.
La página web está diseñada siguiendo el estilo de Material-UI, una librería Open Source
que implementa Material Design de Google, lo que nos va a permitir realizar un sistema
responsivo que se adapte a números dispositivos como tabletas inteligentes o móviles.
En cuanto a la funcionalidad de esta plataforma comprende desde la subida de nuevas
imágenes hasta su correcta clasificación, pasando por la generación de modelos y dando
uso del aprendizaje activo a la hora de determinar el conjunto de imágenes necesarias
a clasificar por el usuario.
El almacenamiento de los datos de usuarios, conjuntos de imágenes y modelosse delega
parcialmente a una base de datos de MongoDB, la otra parte de los datos, como su
interpretación se alberga en un servidor backend.
Se ha elaborado una memoria junto con seis anexos complementarios para documentar
este proyecto. Estos anexos proporcionan información detallada sobre la planificación y
la ingeniería del software del proyecto, así como manuales de ayuda destinados tanto a
los programadores como a los usuarios del sistema. De esta manera, se garantiza una
documentación exhaustiva y completa del proyecto. [EN]Artificial intelligence is a field that is gaining increasing popularity. It is already present
in our daily lives, achieving spectacular advancementsin variousfieldssuch as medicine,
research, and industry.
One of its most well-known branchesis computer vision, which aimsto enable machines
to perceive and understand images and act according to instructions.
Within this branch, there are image classification algorithms, among others. One of the
methods that yields the best results in such cases is convolutional neural networks,
which are artificial neural networks whose receptive fields closely resemble those of the
primary visual cortex (V1) of a biological brain.
These convolutional neural networksrequire training that involves a substantial number
of images labelled by humans with the expected algorithm outcome. Since labelling is a
lengthy and tedious task, this bachelor's thesis proposes a system that facilitates it
through the use of techniques such as active learning.
Thanks to these techniques, the system will perform labelling semi-automatically,
reducing the need for human workers to label only a small percentage of the images.
The system should allow the creation of different datasets that can contain an arbitrary
number of images.
This bachelor's thesis focuses on the development of a web application where users can
intelligently classify their photos.
The website is designed following the Material-UI style, an open-source library that
implements Google's Material Design. This allows us to create a responsive system that
adapts to various devices, such as tablets and smartphones.
Regarding the functionality of this platform, it ranges from uploading new images to
their proper classification, including model generation and the use of active learning to
determine the set of images that the user needs to classify.
The storage of user data, image datasets, and models is partially delegated to a
MongoDB database, while the other part of the data, including its interpretation, is
hosted on a backend server.
A report, along with six complementary appendices, has been prepared to document
this project. These appendices provide detailed information about project planning and
software engineering, as well as user and programmer manuals. This ensures
comprehensive and complete documentation of the project.
Descripción
Trabajo de Fin de Grado. Grado en Ingeniería Informática. Curso académico 2022-2023.
URI
Collections



















