Modelos PCA a partir de conjuntos de datos con información faltante. ¿Se afectan sus propiedades?

dc.contributor.advisorQuaglino, Marta Beatriz
dc.contributor.authorVitelleschi, María Susana
dc.date.accessioned2013-05-02T14:57:17Z
dc.date.available2013-05-02T14:57:17Z
dc.date.issued1905-07-02
dc.description.abstractEn este trabajo se aborda la problemática de la construcción de modelos PCA (Principal Component Analysis) a partir de conjuntos de datos con información faltante. Se trabaja sobre tres situaciones diferentes con relación a la matriz de datos originales. En cada situación se generaron pérdidas a través de mecanismos aleatorios y no aleatorios, en diferentes porcentajes en una sola variable por vez, seleccionada mediante dos criterios: la que más contribuye y menos contribuye en la formación de la primera componente principal. A partir de cada conjunto de datos incompletos se construye el modelo PCA utilizando: Casos Completos, Nonlinear Iterative Partial Least Squares (NIPALS) y Expectation Maximization (EM). Se comparan los resultados con los obtenidos a través del conjunto de datos originales. Se definen una serie de medidas para estudiar cómo se afectan los resultados según la dimensión de la matriz de datos, el porcentaje y el mecanismo de pérdida, con relación a: bondad del ajuste, bondad de predicción, vectores cargas, ortonormalidad de la matriz de cargas y ortogonalidad de la matriz de “scores”.es
dc.description.abstractThis paper deals with the issue of building PCA (Principal Component Analysis) models from data sets with missing information. This Thesis worked on three different situations related to the original data set. In each situation, losses were generated through random and not random mechanisms, in different percentages in one variable at a time, selected by two criteria: the one that contributes the most and the one that contributes the least to the formation of the first principal component. With each set of incomplete data is built the PCA model using: Complete Cases, NIPALS algorithm and EM algorithm. The results are compared to those obtained from the original data set. It is examined how they are affected depending on the size of the data matrix data, the percentage of missing information and the missing data mechanism, in relation to: the goodness of fit, the goodness of prediction, loading vectors, the orthonormality of the loading matrix and the orthogonality of the score matrix. Measures are defined to study how these aspects are affected.es
dc.description.affiliationFil: Vitelleschi, María Susana. Facultad de Ciencias Económicas y Estadística, Universidad Nacional de Rosario; Argentina.
dc.description.peerreviewedPeer reviewedes
dc.identifier.issn1852-4222
dc.identifier.urihttp://hdl.handle.net/2133/2345
dc.languagees
dc.language.isoeses
dc.publisherFacultad de Ciencia Económicas y Estadísticaca - Universidad Nacional de Rosarioes
dc.relation.publisherversionhttp://zeus.fcecon.unr.edu.ar/revista/index.php/revista/issue/view/3es
dc.rightsopenAccesses
dc.sourceSaberEs;No 2 (2010)
dc.subjectMecanismos de Pérdidases
dc.subjectAlgoritmo NIPALSes
dc.subjectAlgoritmo EMes
dc.subjectMissing Data Mechanismses
dc.subjectNIPALS algorithmes
dc.subjectEM algorithmes
dc.titleModelos PCA a partir de conjuntos de datos con información faltante. ¿Se afectan sus propiedades?es
dc.typearticle
dc.typeartículo
dc.typepublishedVersion

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
39-177-1-PB.pdf
Tamaño:
509.19 KB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
Nombre:
license.txt
Tamaño:
2.95 KB
Formato:
Item-specific license agreed upon to submission
Descripción: