Compartir
Título
Uso del clustering difuso en la minería de datos. Creación de una aplicación web con R para clasificar o predecir datos reales
Autor(es)
Director(es)
Palabras clave
Conglomerados
Programación con R
Expresión génica
R Shiny
Clustering
R Programming
Genetic Expresion
Clasificación UNESCO
1209.14 Técnicas de Predicción Estadística
1203.23 Lenguajes de Programación
2410.07 Genética Humana
Fecha de publicación
2024-07
Resumen
[ES]Este proyecto explora la aplicación del clustering difuso en la minería de datos mediante el desarrollo de una aplicación web utilizando r. Comienza con una introducción a la minería de datos, que abarca su historia y conceptos fundamentales, seguida de una explicación de los métodos tradicionales de cluste-ring. A continuación, se explica la base de datos a la que se aplicará el algoritmo y se discute con más de-talle el objetivo de estudiar si el tipo de cáncer afecta a la expresión génica de determinados genes. La sección de desarrollo profundiza en el clustering difuso, contrastando la partición dura con la parti-ción difusa, y explicando los diferentes algoritmos. También se discuten los métodos de validación de clústeres y las modificaciones de los algoritmos anteriores. El siguiente paso expone todo el software necesario para crear la aplicación web y muestra cómo se implementa. La aplicación creada se utiliza para aplicar el algoritmo a la base de datos seleccionada y se muestran los resultados obtenidos. Por último, se extraen conclusiones sobre si el tipo de cáncer afecta a la expresión de determinados genes basándose en los resultados de la agrupación difusa. [EN]This project explores the application of fuzzy clustering in data mining through the development
of a web application using R. It begins with an introduction to data mining, covering its
history and fundamental concepts, followed by an explanation of traditional clustering methods.
Next, the database to which the algorithm will be applied is explained and the objective of studying
whether the type of cancer affects the gene expression of certain genes is discussed in
more detail. The development section delves into fuzzy clustering, contrasting hard partitioning
with fuzzy partitioning, and explains the different algorithms. It also discusses cluster validation
methods and modifications to previous algorithms. The next step explains all the software
needed to create the web application and shows how it is implemented. The application created
is used to apply the algorithm to the selected database and the results obtained are displayed.
Finally, conclusions are drawn as to whether the type of cancer affects the expression of certain
genes based on the fuzzy clustering results.
Descripción
Trabajo de fin de Grado. Grado en Estadística. Curso académico 2023-2024.
URI
Aparece en las colecciones













