Compartir
Título
Modelos de Machine Learning para la Ciencia de Datos
Otros títulos
Machine learning models for data science
Autor(es)
Director(es)
Materia
Aprendizaje Automático
Algoritmo
Aprendizaje Supervisado
Aprendizaje no supervisado
Machine Learning
Algorithms
Supervised Learning
Unsupervised Learning
Clasificación UNESCO
1209 Estadística
1209.03 Análisis de Datos
1209.09 Análisis Multivariante
1209.14 Técnicas de Predicción Estadística
1203.04 Inteligencia Artificial
1203.23 Lenguajes de Programación
Fecha de publicación
2023-07
Resumen
[ES]En los últimos años hemos visto como la ciencia de datos ha adquirido una importancia cada
vez mayor, debido principalmente a su papel fundamental en la extracción de conocimiento y
toma de decisiones en las grandes organizaciones del mundo. Debido al aumento de la cantidad
y complejidad de estos datos, la aplicación de técnicas novedosas de Machine Learning se ha
propuesto como una de las soluciones más útiles para abordar estos problemas. En este trabajo,
hacemos un análisis teórico exhaustivo de algunas de estas técnicas, y comprobamos
posteriormente su eficacia aplicándolas en una base de datos real, donde analizamos el
rendimiento obtenido en una serie de cuestiones relativas al campo del aprendizaje supervisado
(problema de clasificación multiclase) y no supervisado (técnicas de clustering y reducción de
la dimensionalidad). [EN]In recent years we have seen how data science has become increasingly important, mainly due
to its fundamental role in knowledge extraction and decision making in large organizations
around the world. Due to the increasing amount and complexity of this data, the application of
novel Machine Learning techniques has been proposed as one of the most useful solutions to
address these problems. In this paper, we make an exhaustive theoretical analysis of some of
these techniques, and then test their effectiveness by applying them on a real database, where
we analyze the performance obtained in a series of tasks related to the field of supervised
learning (multiclass classification problem) and unsupervised learning (clustering and
dimensionality reduction techniques).
Descripción
Trabajo de fin de Grado. Grado en Estadística. Curso académico 2022-23.
URI
Colecciones