Show simple item record

dc.contributor.advisorVicente Villardón, José Luis 
dc.contributor.authorHernández Sánchez, Julio C.
dc.date.accessioned2016-05-12T08:33:50Z
dc.date.available2016-05-12T08:33:50Z
dc.date.issued2016
dc.identifier.urihttp://hdl.handle.net/10366/128405
dc.description.abstract[ES]Hay numerosas técnicas adecuadas para trabajar con datos nominales, algunas de las cuales analizan el problema que supone este tipo de datos desde el punto de vista del Análisis Factorial cuyo objetivo es obtener factores latentes que expliquen la correlación entre las variables. Otras inciden en algunos tipos de aproximaciones no paramétricas para explorar las similaridades entre los individuos (Análisis de Coordenadas Principales (PCoA) o Escalamiento Multidimensional (MS)), pero existe una ausencia de técnicas exploratorias generales que permitan la representación simultánea de individuos y variables, excepto el Análisis de Correspondencias Múltiple (MCA), basado en la distancia chi-cuadrado, que no siempre es la más adecuada para describir similaridades entre individuos y correlaciones entre variables. Para datos binarios, Vicente-Villardón y col.[2006] proponen una representación basada en respuestas logísticas llamándolo "Biplot Logístico", que es lineal, y estudian en su investigación la geometría de este tipo de biplots. Cuando el conjunto de datos contiene variables nominales con más de dos categorias, los biplots lineales e incluso los biplots logísticos binarios no son adecuados. En esta tésis se resuelve este problema extendiendo el concepto anterior y se desarrolla lo que se ha denominado "Biplot Logístico Nominal (NLB)" como un procedimiento que por un lado reduce la dimensión del espacio de partida, y por otro se utiliza como una técnica exploratoria. Los biplots logísticos nominales representan las filas de la matriz de datos como puntos en una representación correspondiente a un espacio dimensión reducida(generalmente 2 ó 3) y las variables como regiones de predicción(polígonos convexos). La principal ventaja del NLB es que la interpretación del biplot se hace en términos de distancias, de tal forma que para cada individuo la categoría que se predice en una variable es la más cercana a él en el biplot. De esta forma, este tipo de biplots extienden tanto al Análisis de Correspondencias Múltiples como al Análisis de Respuesta Latente, en el sentido de que provee una representación gráfica para el LTA similar a la que se obtiene en MCA. Cuando los datos contienen variables ordinales, los biplots lineales, binarios o los logísticos nominales tampoco son adecuados, situación en la cuál, el Análisis de Componentes Principales Categórico (CATPCA) ó la IRT para variables ordinales serían propuestas más válidas. Lo que haremos es extender el concepto de biplot a aquellas situaciones en las que aparezcan este tipo de datos, resultando un método que llamaremos Biplot Logístico Ordinal (OLB). Las puntuaciones de las filas se calculan teniendo en cuenta el supuesto de que tengan superficies de respuesta logística ordinales sobre las dimensiones consideradas y los parámetros columna producen superficies de respuesta logística que, proyectadas sobre el espacio reducido por las puntuaciones de las filas definen un biplot lineal. Se utilizará un modelo de odds proporcionales, obteniendo asi un modelo multidimensional conocido como modelo de respuesta graduada en la literatura del IRT. Estudiaremos la geometría de tales representaciones e implementaremos algoritmos computacionales para la estimación de los parámetros y de las direcciones de la predicción. El OLB extiende tanto CATPCA como IRT puesto que ofrece una representación gráfica para IRT parecida al biplot correspondiente al CATPCA. Por último, si la matriz de datos presenta variables categóricas de cualquier tipo se han adaptado los algoritmos para construir el biplot teniendo en cuenta las características de cada variable y sus geometrías asociadas, de manera que la tésis cubre las representaciones de datos categóricos en su conjunto. La utilización de los procedimientos descritos es posible debido a la implementación de tres paquetes de R públicos que permiten analizar cada situación, los cuales se utilizan con distintos conjuntos de datos reales en este estudio.es_ES
dc.format.extent456 p.
dc.format.mimetypeapplication/pdf
dc.languageEspañol
dc.language.isospaes_ES
dc.relation.requiresAdobe Acrobat
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Unported
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/3.0/
dc.subjectTesis y disertaciones académicases_ES
dc.subjectUniversidad de Salamanca (España)es_ES
dc.subjectTesis Doctorales_ES
dc.subjectAcademic dissertationses_ES
dc.subjectDatos nominaleses_ES
dc.subjectBiplot Logístico Nominal (NLB)es_ES
dc.subjectEscalamiento multidimensionales_ES
dc.subjectEstadísticaes_ES
dc.titleBiplot logístico para datos nominales y ordinaleses_ES
dc.typeinfo:eu-repo/semantics/doctoralThesises_ES
dc.subject.unesco1209 Estadísticaes_ES
dc.subject.unesco1209.09 Análisis multivariantees_ES
dc.subject.unesco1204 Geometríaes_ES
dc.subject.unesco12 Matemáticases_ES
dc.identifier.doi10.14201/gredos.128405
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Unported
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 Unported