Compartir
Título
Estudio e implementación de redes neuronales convolucionales para la segmentación de imágenes
Autor(es)
Director(es)
Palabras clave
Redes neuronales convolucionales
Segmentación de imágenes
U-Net
SegNet
DeepLab
Convolutional neural networks
Image segmentation
Clasificación UNESCO
1209 Estadística
1209.09 Análisis Multivariante
1209.03 Análisis de Datos
1203.04 Inteligencia Artificial
Fecha de publicación
2024-07
Resumen
[ES]Las redes neuronales convolucionales se han convertido en la principal técnica para la segmentación de imágenes quedando los métodos anteriores obsoletos. Desde que se presentó la primera arquitectura convolucional adaptada para la segmentación, numerosas arquitecturas han sido propuestas por investigadores. Entre estas arquitecturas destacan SegNet, U-Net y DeepLab. Este trabajo presenta un estudio sobre la implementación y optimización de estas tres arquitecturas de redes neuronales convolucionales para la segmentación de imágenes del entorno urbano. El objetivo de este trabajo es lograr un modelo de segmentación entrenado que sea óptimo en la segmentación de imágenes de la vía urbana desde la perspectiva de un peatón para un posible futuro uso en dispositivos de asistencia en la navegación de personas con discapacidad visual. Para ello se utilizó herramientas como Python, Google Colaboratory y TensorFlow y se evaluaron los modelos en base a diversas métricas de precisión. Los resultados muestran que la arquitectura U-Net con hiperparámetros optimizados se ajusta mejor a los datos frente a las otras dos arquitecturas ofreciendo una segmentación con un porcentaje de clasificación correcta de los pixeles de un 90%. Esta alta precisión deja abierta la posibilidad de una implementación en dispositivos de asistencia para personas con discapacidad visual para una navegación más autónoma y segura por la vía urbana. [EN]Convolutional neural networks have become the primary technique for image segmentation, rendering previous methods obsolete. Since the introduction of the first convolutional architecture adapted for segmentation, numerous architectures have been proposed by researchers. Notable among these are SegNet, U-Net, and DeepLab. This work presents a study on the implementation and optimization of these three convolutional neural network architectures for urban environment image segmentation. The objective of this work is to achieve a trained segmentation model that is optimal for segmenting urban road images from a pedestrian's perspective for potential future use in assistive navigation devices for visually impaired individuals. Tools such as Python, Google Colaboratory, and TensorFlow were used, and the models were evaluated based on various accuracy metrics. The results show that the U-Net architecture with optimized hyperparameters fits the data better than the other two architectures, offering segmentation with a correct pixel classification rate of 90%. This high accuracy opens the possibility of implementation in assistive devices for visually impaired individuals, facilitating more autonomous and safer navigation in urban environments.
Descripción
Trabajo de fin de Grado. Grado en Estadística. Curso académico 2023-2024.
URI
Aparece en las colecciones













