Método de agrupamiento geoespacial para la segmentación de una población de viviendas

Fecha

2018-12-11

Título de la revista

ISSN de la revista

Título del volumen

Editor

Resumen

Generalmente, las encuestas por muestreo realizadas por los organismos oficiales de estadística se valen de un marco muestral que lista y agrupa a viviendas particulares según su ubicación geográfica, de acuerdo con los niveles de desagregación requeridos por el diseño. Los mismos son elaborados a partir de información recogida en los Censos de Población y mediante la asistencia de software cartográfico. La dificultad de este procedimiento no solo se debe al exhaustivo trabajo manual, sino también a imprecisiones respecto a calles y numeración de las viviendas. Por motivos relacionados a la precisión de los estimadores y de distribución de carga de trabajo es preferible que la cantidad de viviendas por área de muestreo sea uniforme. Este trabajo presenta un algoritmo de agrupamiento espacial que permite especificar tamaño de clusters de antemano y que solo requiere posicionamiento dado por latitud y longitud. Se muestra su desempeño y se lo compara con el método de clustering k-medias en una aplicación a una población sintética de viviendas.
Generally, sampling surveys carried out by official statistical agencies use a sampling frame that lists and groups households according to their geographical location, satisfying the disaggregation levels required by the design. They are elaborated from information collected in Population Censuses and through the assistance of cartographic software. The difficulty of this procedure is not only due to the exhaustive manual work, but also to inaccuracies regarding streets and numbering of homes. For reasons related to the accuracy of the estimators and the distribution of workload, it is preferable that the number of dwellings per sampling area be uniform. This paper presents a spatial clustering algorithm that allows us to specify size of clusters in advance and only requires positioning given by latitude and longitude. Its performance is shown and compared with the k-means clustering method in an application to a synthetic household population.

Descripción

Palabras clave

cluster k-medias, segmentación, conglomerados de igual tamaño

Citación