Planes de muestreo para datos espaciales: su comportamiento en un estudio socioeconómico

Resumen

En muchos estudios por muestreo, las unidades que constituyen la población se encuentran situadas en el espacio. Es frecuente observar en esta clase de poblaciones una característica conocida como correlación espacial positiva: los valores de la variable de interés son muy parecidos en unidades cercanas entre sí y menos parecidos a medida que la distancia entre ellas es mayor. Este comportamiento se puede representar mediante los modelos estadísticos conocidos como correlograma y semivariograma. La información obtenida de los mismos podrá resultar de utilidad al momento de diseñar la muestra, en cuanto a mejorar la precisión de las estimaciones. Esta información se puede aprovechar utilizándola en el proceso de estimación recurriendo al enfoque de predicción, el cual permite la incorporación del modelo de semivariograma para lograr las mejoras buscadas o, en el procedimiento de selección de la muestra, tópico en el cual se centra el presente trabajo. Existen varias propuestas para la selección de la muestra atendiendo a la correlación espacial presente. En este trabajo, se han considerado algunas de ellas, que tienen su origen en estudios sobre recursos naturales o problemas ambientales. Se plantea su aplicación en un estudio socioeconómico como lo es la estimación del número de hogares con NBI en la ciudad de Rosario a partir de una muestra de radios censales y se evalúa la eficiencia de los mismos. Se ha encontrado que varios de los métodos analizados proporcionan una mayor eficiencia que el muestreo aleatorio simple alentando la ampliación de los escenarios para los estudios de eficiencia, así como su aplicación en encuestas de este campo.
In many sampling applications the units composing the population are spatially distributed. When working with this type of populations it is common to observe a characteristic known as positive spatial correlation: values of the response variable are similar for units close to each other, and more diverse as the distance between units becomes larger. This situation is taken into account by two models: correlogram and semivariogram. Information obtained from these two models is of great value when designing a sample, as it improves the precision of the estimates. This information is capitalized by using it during the estimation process, choosing a prediction approach that allows the inclusion of the semivariogram model in order to achieve the desired improvement, or else during the sample selection process, which is this articles’ topic of interest. There are several proposals pertaining the selection of a sample while taking into account the spatial correlation present in the data. Some of the techniques considered in this study were developed from studies regarding natural or environmental resources. We postulate their application in a socioeconomic study concerning the number of households with at least one Unsatisfied Basic Needs (NBI, Necesidades Básicas Insatisfechas) in the city of Rosario via a sample of census units, and their efficiency is assessed. We find that many of the analyzed methods provide better efficiency than simple random sampling, motivating their application in this type of studies and also broadening the scenarios for efficiency studies.

Descripción

Palabras clave

Muestreo de datos espaciales, Thompson. Encuestas sociales., Estimador de Horvitz

Citación