El repositorio ya se encuentra disponible para continuar trabajando. Disculpen las molestias.

 

Propiedades de índices de similitud y disimilitud para datos binarios y su aplicación en Ecología de comunidades

Fecha

2019-12-13

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Nacional de Rosario
Resumen
Se estudian en esta tesis las propiedades de los índices de similitud basados en datos de presencia/ausencia, con el objetivo de identificar los “mejores”, basado en algún criterio teórico. Tales índices han sido ampliamente utilizados en ecología de comunidades para clasificar tanto datos de especies como caracteres ecológicos: índices idénticos o similares fueron aplicados subsecuentemente en otras disciplinas científicas. Como resultado del esfuerzo por cuantificar la asociación y/o similitud en varios campos de la Ciencia, han aparecido una gran cantidad de medidas. Si bien hay más de setenta índices para medir la similitud entre objetos, poco se sabe sobre las propiedades de los mismos: la revisión más completa de los coeficientes de similitud es debida a Hubálek (1982), limitada a 43. Siguiendo a este autor se estudian en este trabajo quince propiedades, en particular cinco son consideradas obligatorias: maximal y minimal, existencia de valores mínimos y máximos, simetría, discriminación entre asociación positiva o negativa y monotonicidad respecto a la estadística 𝜒�������� 2 . Las otras propiedades que se estudian son: existencia de límites convencionales, asociación completa o absoluta, asociación nula cuando el valor de presencias conjuntas es cero, linealidad, insensibilidad a la inexistencia de presencias conjuntas, distribuciones en el muestreo, insesgamiento, métrica, indeterminancia y Euclideanidad. Se utilizaron diferentes métodos para comprobar las propiedades de los índices: algunas pueden verificarse sencillamente observando el cumplimiento de las condiciones en forma aritmética, para otras debe recurrirse a un procedimiento de simulación de datos binarios con distintos escenarios; para otras se utilizan los mismos escenarios definidos por otros autores que estudiaron alguna propiedad en un conjunto de índices. Se encuentran doce índices (A) que son los que más propiedades cumplen: Anónimo_1, Anónimo_2, Anónimo_3, Braun-Blanquet, Hamann, Jaccard, Lamont & Grant, Maxwell & Pilliner, Rogot & Golberg, Scott, Sokal & Michener y Sorensen. Estos índices se presentan como los mejores para un uso general. Utilizando una medida de disimilitud (D) derivada de estos índices de similitud: 𝐷�������� = √1 − 𝐴��������, se compara el comportamiento de la misma con tres 5 matrices de datos: una transecta de vegetación, y dos conjuntos de datos simulados: una coenoclina y un coenoplano, respondiendo a uno y dos gradientes ambientales hipotéticos respectivamente. No sorprende encontrar que los índices de Jaccard y Sorensen son adecuados para analizar datos de comunidades vegetales, sin embargo se descubren otros índices que también dan resultados satisfactorios: Braun-Blanquet, Lamont & Grant y Anónimo_1.

Palabras clave

índices, similitud, propiedades, métrica, euclideanidad, multivariado, vegetación

Citación