2024-03-28T20:10:30Zhttps://gredos.usal.es/oai/requestoai:gredos.usal.es:10366/1454502022-02-07T17:05:23Zcom_10366_4756com_10366_4746com_10366_3823com_10366_4074com_10366_4055com_10366_3946com_10366_143088com_10366_123103col_10366_68518col_10366_4082col_10366_143116
Gestión del Repositorio Documental de la Universidad de Salamanca
advisor
Vicente Galindo, María Purificación
advisor
Patino Alonso, María Carmen
author
Carrasco Oberto, Gonzalo Isaac
2021-03-02T09:44:54Z
2021-03-02T09:44:54Z
2020
http://hdl.handle.net/10366/145450
10.14201/gredos.145450
[ES] INTRODUCCIÓN Cada día estamos más inmersos en un mundo en el que los datos crecen y crecen. La
minería de datos (MD) muy relacionada con el Descubrimiento de Conocimiento en
Bases de datos (KDD -Knowledge Discovery in Databases) nos permite descubrir
información de grandes volúmenes de datos y son fundamentales para analizarlos de
manera eficaz, a la vez que revelan patrones que no eran conocidos (Holsheimer & Siebes,
1994).
El KDD es un proceso que consta de un conjunto de fases que incluye el preprocesamiento
minería y post procesamiento de los datos. La minería de datos es una técnica de
Inteligencia Artificial que permite extraer conocimiento útil y comprensible previamente
desconocido a partir de grandes volúmenes de datos y consiste en la aplicación de un
algoritmo para extraer patrones de datos. Sin embargo, con el fin de analizar los datos
enfocados en el descubrimiento del conocimiento se ha ido adaptando y ha surgido lo que
se denomina minería de datos espacial (MDE), la cual se considera como el proceso
automático de explorar grandes cantidades de datos espaciales con el objetivo de
descubrir conocimiento.
En la actividad investigadora resulta de gran interés identificar asociaciones, patrones y
reglas. Dentro de las técnicas de MD se encuentra el agrupamiento (Clustering). El
agrupamiento de datos es un problema fundamental en una variedad de áreas de la
informática y campos relacionados, como el análisis de datos, la compresión de datos y
el análisis de datos estadísticos (Aboubi, Drias, & Kamel, 2016). Puede considerarse el problema más importante de aprendizaje no supervisado tratando de encontrar una
estructura de datos no etiquetados (Jain & Dubes, 1988; Jain, Murty, & Flynn, 1999).
Los algoritmos de agrupamiento más conocidos son los métodos jerárquicos y los
métodos de partición, aunque existen otros métodos basados en densidades y los métodos
basados en Gird. Existen diversas razones por las que las agrupaciones particionadas o de
aprendizaje no supervisado son de interés: implementación rápida y convergen
rápidamente, permiten categorizar elementos, entre otras. Sin embargo, estos algoritmos
sufren inconvenientes en la especificación de los parámetros iniciales no adecuados, que
pueden generar una mala convergencia. Se han desarrollado diferentes métodos de
agrupamiento que atienden a diversos problemas como costo computacional, sensibilidad
a la inicialización, clases desbalanceadas y convergencia a un óptimo local, entre otros.
Sin embargo, para la selección de un método, es necesario considerar la naturaleza de los
datos y las condiciones del problema con el fin de agrupar patrones similares, de tal forma
que se tenga un buen compromiso entre costo computacional y efectividad en la
separabilidad de las clases.
Algunos de los algoritmos basados en particiones son el algoritmo K-Medias, el algoritmo
K-Medoids, el algoritmo de particionamiento alrededor de Medoids (PAM) y una versión
de PAM diseñada para grupos de datos mayores denominado CLARA (Gupta & Panda,
2018). Hay numerosos investigadores que han propuesto algoritmos de K-Medias y K-
Medoids (Borah & Ghose, 2009; Dunham, 2002; Han & Kamber, 2006; Khan & Ahmad,
2004; Park, Lee, & Jun, 2006; Rakhlin & Caponnetto, 2007; Xiong, Wu, & Chen, 2009).
La agrupación ha ganado un amplio uso y su importancia ha crecido proporcionalmente
debido a la cantidad cada vez mayor de datos y al aumento exponencial en las velocidades
de procesamiento de la computadora. La importancia de la agrupación se puede entender por el hecho de que tiene una amplia variedad de aplicaciones, ya sea en educación o
industrias o agricultura o economía. Las técnicas de agrupamiento se han vuelto muy
útiles para grandes conjuntos de datos, incluso en redes sociales como Facebook y Twitter
(Soni & Patel, 2017). El análisis de conglomerados juega un papel indispensable en la
exploración de la estructura subyacente de un conjunto de datos dado, y se usa
ampliamente en un variedad de temas de ingeniería y científicos, como, medicina,
sociología, psicología y recuperación de imágenes Además en otras áreas, tales como,
estudios de segmentación de clientes en el área financiera (Abonyi & Feil, 2007), biología
(Der & Everitt, 2005; Quinn & Keough, 2002) , ecología (McGarigal, Cushman, &
Stanford, 2000) , entre otros, puesto que la mayoría de las veces no utiliza ningún
supuesto estadístico para llevar a cabo el proceso de agrupación (Leiva-Valdebenito &
Torres-Avilés, 2010)...
spa
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Tesis y disertaciones académicas
Universidad de Salamanca (España)
Tesis Doctoral
Academic dissertations
K-medias
Agrupamiento
Algoritmo PAM
CLARA
Cluster no jerárquicos versus CART y BIPLOT
info:eu-repo/semantics/doctoralThesis
TElDRU5DSUEgREUgRElTVFJJQlVDScOTTiBOTyBFWENMVVNJVkEKClBhcmEgcXVlIGVsIFJlcG9zaXRvcmlvIGRlIGxhIFVuaXZlcnNpZGFkIGRlIFNhbGFtYW5jYSBwdWVkYSByZXByb2R1Y2lyIHkgY29tdW5pY2FyIHDDumJsaWNhbWVudGUgc3UgZG9jdW1lbnRvIGVzIG5lY2VzYXJpbyBsYSBhY2VwdGFjacOzbiBkZSB1bmEgc2VyaWUgZGUgdMOpcm1pbm9zLiBMYXMgY29uZGljaW9uZXMgZGUgbGEgbGljZW5jaWEgZGUgZGlzdHJpYnVjacOzbiBubyBleGNsdXNpdmEgcXVlIGxvcyBhdXRvcmVzIGRlYmVuIGFjZXB0YXIgYWwgaGFjZXIgYXV0b2FyY2hpdm8gZW4gR1JFRE9TIHNvbiBsYXMgc2lndWllbnRlczoKCjEuIEFjZXB0YW5kbyBlc3RhIGxpY2VuY2lhLCB1c3RlZCAoZWwgYXV0b3IvZXMgbyBlbCBwcm9waWV0YXJpby9zIGRlIGxvcyBkZXJlY2hvcyBkZSBhdXRvcikgZ2FyYW50aXphIGEgbGEgVW5pdmVyc2lkYWQgZGUgU2FsYW1hbmNhIGVsIGRlcmVjaG8gbm8gZXhjbHVzaXZvIGRlIGFyY2hpdmFyLCByZXByb2R1Y2lyLCBjb252ZXJ0aXIgKGNvbW8gc2UgZGVmaW5lIG3DoXMgYWJham8pLCBjb211bmljYXIgeS9vIGRpc3RyaWJ1aXIgc3UgZG9jdW1lbnRvIG11bmRpYWxtZW50ZSBlbiBmb3JtYXRvIGVsZWN0csOzbmljby4gCgoyLiBFbCBhdXRvciBhY2VwdGEgcXVlIGxhIFVuaXZlcnNpZGFkIGRlIFNhbGFtYW5jYSBwdWVkYSBjb25zZXJ2YXIgbcOhcyBkZSB1bmEgY29waWEgZGUgZXN0ZSBkb2N1bWVudG8geSwgc2luIGFsdGVyYXIgc3UgY29udGVuaWRvLCBjb252ZXJ0aXJsbyBhIGN1YWxxdWllciBmb3JtYXRvIGRlIGZpY2hlcm8sIG1lZGlvIG8gc29wb3J0ZSwgcGFyYSBwcm9ww7NzaXRvcyBkZSBzZWd1cmlkYWQsIHByZXNlcnZhY2nDs24geSBhY2Nlc28uCgozLiBFbCBkZXBvc2l0YXJpbyBkZWNsYXJhIHF1ZSBlbCBkb2N1bWVudG8gZXMgdW4gdHJhYmFqbyBvcmlnaW5hbCBzdXlvIHkvbyBxdWUgdGllbmUgZWwgZGVyZWNobyBwYXJhIG90b3JnYXIgbG9zIGRlcmVjaG9zIGNvbnRlbmlkb3MgZW4gZXN0YSBsaWNlbmNpYS4gVGFtYmnDqW4gZGVjbGFyYSBxdWUgc3UgZG9jdW1lbnRvIG5vIGluZnJpbmdlLCBlbiB0YW50byBlbiBjdWFudG8gbGUgc2VhIHBvc2libGUgc2FiZXIsIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBkZSBuaW5ndW5hIG90cmEgcGVyc29uYSBvIGVudGlkYWQuCgo0LiBTaSBlbCBkb2N1bWVudG8gY29udGllbmUgbWF0ZXJpYWxlcyBkZSBsb3MgY3VhbGVzIG5vIHRpZW5lIGxvcyBkZXJlY2hvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgaGEgb2J0ZW5pZG8gZWwgcGVybWlzbyBzaW4gcmVzdHJpY2Npw7NuIGRlbCBwcm9waWV0YXJpbyBkZSBsb3MgZGVyZWNob3MgZGUgYXV0b3IgcGFyYSBvdG9yZ2FyIGEgbGEgVW5pdmVyc2lkYWQgZGUgU2FsYW1hbmNhIGxvcyBkZXJlY2hvcyByZXF1ZXJpZG9zIHBvciBlc3RhIGxpY2VuY2lhLCB5IHF1ZSBlc2UgbWF0ZXJpYWwgY3V5b3MgZGVyZWNob3Mgc29uIGRlIHRlcmNlcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIHkgcmVjb25vY2lkbyBlbiBlbCB0ZXh0byBvIGNvbnRlbmlkbyBkZWwgZG9jdW1lbnRvIGVudHJlZ2Fkby4KCjUuIFNpIGVsIGRvY3VtZW50byBzZSBiYXNhIGVuIHVuYSBvYnJhIHF1ZSBoYSBzaWRvIHBhdHJvY2luYWRhIG8gYXBveWFkYSBwb3IgdW5hIGFnZW5jaWEgdSBvcmdhbml6YWNpw7NuIGRpZmVyZW50ZSBkZSBsYSBVbml2ZXJzaWRhZCBkZSBTYWxhbWFuY2EsIHNlIHByZXN1cG9uZSBxdWUgc2UgaGEgY3VtcGxpZG8gY29uIGN1YWxxdWllciBkZXJlY2hvIGRlIHJldmlzacOzbiB1IG90cmFzIG9ibGlnYWNpb25lcyByZXF1ZXJpZGFzIHBvciBlc3RlIGNvbnRyYXRvIG8gYWN1ZXJkby4KCjYuIExhIFVuaXZlcnNpZGFkIGRlIFNhbGFtYW5jYSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgc3UvcyBub21icmUvcyBjb21vIGVsL2xvcyBhdXRvci9lcyBvIHByb3BpZXRhcmlvL3MgZGUgbG9zIGRlcmVjaG9zIGRlbCBkb2N1bWVudG8sIHkgbm8gaGFyw6EgbmluZ3VuYSBhbHRlcmFjacOzbiBkZSBzdSBkb2N1bWVudG8gZGlmZXJlbnRlIGEgbGFzIHBlcm1pdGlkYXMgZW4gZXN0YSBsaWNlbmNpYS4KClNpIGVzdGFzIGNvbmRpY2lvbmVzIG5vIHNvbiBhY2VwdGFkYXMgcG9yIGVsIGF1dG9yLCBubyBlcyBwb3NpYmxlIGRlcG9zaXRhciBuaW5nw7puIGRvY3VtZW50by4KClNpIHVuIGF1dG9yIGVzdMOhIGludGVyZXNhZG8gZW4gbW9kaWZpY2FyIHVuIHRyYWJham8gcXVlIGhheWEgc2lkbyBkZXBvc2l0YWRvIGVuIEdSRURPUywgZGViZSBwb25lcnNlIGVuIGNvbnRhY3RvIGNvbiBsb3MgYWRtaW5pc3RyYWRvcmVzIGRlIEdSRURPUyAocmVwb3NpdG9yaW9AdXNhbC5lcykuCg==
URL
https://gredos.usal.es/bitstream/10366/145450/1/Carrasco%20Oberto%2c%20Gonzalo%20Isaac.pdf
File
MD5
840d82929708567d7ec32006ffe6a85a
1544776
application/pdf
Carrasco Oberto, Gonzalo Isaac.pdf
URL
https://gredos.usal.es/bitstream/10366/145450/4/Carrasco%20Oberto%2c%20Gonzalo%20Isaac.pdf.txt
File
MD5
97d6d14119cf523258bd691004b6df74
279165
text/plain
Carrasco Oberto, Gonzalo Isaac.pdf.txt