Componentes principales esféricas y matriz de covariancia de determinante mínimo: una aplicación sobre indicadores de carencias críticas

Fecha

2016-11

Título de la revista

ISSN de la revista

Título del volumen

Editor

Resumen

En este trabajo se presentan dos técnicas robustas para el análisis de componentes principales: Matriz de Covariancia de Determinante Mínimo (MCD) y Componentes Principales Esféricas (SPC) y se las compara con el Análisis de Componentes Principales (ACP) clásico en una aplicación sobre indicadores de carencias críticas. Para poder resumir las diferencias sociales y económicas existentes entre las ciudades y comunas de Santa Fe es necesario retener más componentes principales en los métodos robustos (MCD y SPC) que en el método clásico. Se observa que para el método clásico solo una componente principal es suficiente mientras que, para los métodos robustos MCD y SPC se necesitan al menos dos componentes principales para poder resumir las diferencias presentes en los datos. Puede notarse que las variables que más aportan en la conformación de la primera componente principal en el método clásico son aquellas que contienen una mayor variabilidad en los datos con una gran cantidad de outliers dispersos, los cuales toman valores altos. De esta manera, se puede observar que el método clásico está influenciado por valores extremos, dando resultados e interpretaciones que pueden estar alejados del comportamiento del conjunto central de datos que representa la gran mayoría de ellos

Descripción

Principal Components Analysis (PCA) is widely used in multivariate statistical analysis. The objective of this method is to represent a set of n observations with p variables through a smaller number of variables that are linear combinations of the original ones, keeping as much as possible the original variability in the data. Two robust methods are presented in this work: the Minimum Covariance Determinant method (MCD) and the Spherical Principal Components method (SPC). The objective of this work is to compare these two methods with the classic PCA when applied to data related to indicators of critical needs in cities with more than 2000 inhabitants in the province of Santa Fe. The data comes from the National Census from 2010. In order to summarize the differences among the cities it is necessary to consider a greater number of principal components in the robust methods than in the classic method. The reason is that the latter uses variability measures that are influenced by outliers while the robust methods use a solid measure that is free from this problem

Palabras clave

covariancia, carencias críticas, Componentes Principales (ACP)

Citación