FCEyE - Doctorado en Estadística
URI permanente para esta colección
Examinar
Envíos recientes
Ítem Acceso Abierto Propiedades de índices de similitud y disimilitud para datos binarios y su aplicación en Ecología de comunidades(Universidad Nacional de Rosario, 2019-12-13) Torres, Patricia Susana; Camiz, Sergio; Quaglino, Marta BeatrizSe estudian en esta tesis las propiedades de los índices de similitud basados en datos de presencia/ausencia, con el objetivo de identificar los “mejores”, basado en algún criterio teórico. Tales índices han sido ampliamente utilizados en ecología de comunidades para clasificar tanto datos de especies como caracteres ecológicos: índices idénticos o similares fueron aplicados subsecuentemente en otras disciplinas científicas. Como resultado del esfuerzo por cuantificar la asociación y/o similitud en varios campos de la Ciencia, han aparecido una gran cantidad de medidas. Si bien hay más de setenta índices para medir la similitud entre objetos, poco se sabe sobre las propiedades de los mismos: la revisión más completa de los coeficientes de similitud es debida a Hubálek (1982), limitada a 43. Siguiendo a este autor se estudian en este trabajo quince propiedades, en particular cinco son consideradas obligatorias: maximal y minimal, existencia de valores mínimos y máximos, simetría, discriminación entre asociación positiva o negativa y monotonicidad respecto a la estadística 𝜒�������� 2 . Las otras propiedades que se estudian son: existencia de límites convencionales, asociación completa o absoluta, asociación nula cuando el valor de presencias conjuntas es cero, linealidad, insensibilidad a la inexistencia de presencias conjuntas, distribuciones en el muestreo, insesgamiento, métrica, indeterminancia y Euclideanidad. Se utilizaron diferentes métodos para comprobar las propiedades de los índices: algunas pueden verificarse sencillamente observando el cumplimiento de las condiciones en forma aritmética, para otras debe recurrirse a un procedimiento de simulación de datos binarios con distintos escenarios; para otras se utilizan los mismos escenarios definidos por otros autores que estudiaron alguna propiedad en un conjunto de índices. Se encuentran doce índices (A) que son los que más propiedades cumplen: Anónimo_1, Anónimo_2, Anónimo_3, Braun-Blanquet, Hamann, Jaccard, Lamont & Grant, Maxwell & Pilliner, Rogot & Golberg, Scott, Sokal & Michener y Sorensen. Estos índices se presentan como los mejores para un uso general. Utilizando una medida de disimilitud (D) derivada de estos índices de similitud: 𝐷�������� = √1 − 𝐴��������, se compara el comportamiento de la misma con tres 5 matrices de datos: una transecta de vegetación, y dos conjuntos de datos simulados: una coenoclina y un coenoplano, respondiendo a uno y dos gradientes ambientales hipotéticos respectivamente. No sorprende encontrar que los índices de Jaccard y Sorensen son adecuados para analizar datos de comunidades vegetales, sin embargo se descubren otros índices que también dan resultados satisfactorios: Braun-Blanquet, Lamont & Grant y Anónimo_1.Ítem Acceso Abierto Avances en modelos espacio-estado para el análisis de movimiento y comportamiento animal(Universidad Nacional de Rosario, 2022-08-01) Ruiz Suarez, Sofia; Morales, Juan Manuel; Leos Barajas, VianeyLa forma en que se mueven los animales es de gran interés en ecología, ya que afecta a la mayoría de los procesos ecológicos y evolutivos. Analizar estos procesos, implica estudiar sistemas que varían en el espacio y el tiempo a distintas escalas temporales y con distintos niveles de dependencia. Nuevas tecnologías han revolucionado la forma de estudiar y monitorear el movimiento de animales, su comportamiento, y su relación con el medio ambiente, llevando a la necesidad de desarrollar nuevas metodologías estadísticas. Bajo el contexto de modelos espacio-estado (MEE) y utilizando perspectiva Bayesiana, en esta tesis buscamos dar respuestas a este problema. Presentamos un MEE que permite describir trayectorias formulando el proceso de movimiento a tiempo continuo y la observación a tiempo discreto. Usando Modelos Ocultos de Markov, clasificamos datos temporales de aceleración en distintos comportamientos. Por ´ultimo, consideramos el error de las observaciones ambientales para describir trayectorias según la selección de recursos disponibles. Los resultados obtenidos resaltan la importancia de contar con modelos adecuados que permitan describir e interpretar correctamente estos sistemas y diagramar practicas de manejo apropiadas. Evidenciamos cómo la escala a la que los animales toman las decisiones de movimiento debe tenerse en cuenta a la hora de diseñar protocolos de colecta de datos y, que no siempre es necesario contar con datos de alta frecuencia para tener buenas estimaciones de ciertos procesos de movimiento. Además mostramos cómo el efecto del error en las observaciones ambientales puede sesgar las estimaciones de los análisis llevando a conclusiones erróneasÍtem Acceso Abierto Impacto de estrategias para el tratamiento de información faltante sobre la estimación de modelos de regresión de Cox(Univesidad Nacional de Rosario, 2020-04-30) Chiapella, Luciana; Mamprin, María Eugenia; Quaglino, Marta BeatrizEn esta tesis se realiza una investigación sobre el impacto de distintos métodos para el tratamiento de datos faltantes sobre la estimación de los parámetros de modelos de regresión de Cox, cuando las perdidas ocurren en variables explicativas mixtas. Por medio de un estudio por simulación y otro por remuestreo a partir de datos de un caso real del ´área de Psiquiatría, se avanza en el estudio de propiedades distribucionales de los estimadores de los parámetros, obtenidos mediante datos completos y a partir de matrices imputadas siguiendo distintas estrategias. Se analizan comparativamente el error cuadrático medio y el sesgo de los estimadores tanto en relación a la esperanza como a la varianza, correspondientes a la distribución asintótica teórica de los estimadores máximo-verosímiles a partir de matrices completas. También se evalúa la forma de la distribución y la capacidad predictiva del modelo estimadoÍtem Acceso Abierto Indices socio-económicos desde el enfoque de reducción suficiente de dimensiones(Universidad Nacional de Rosario, 2016-12-02) García Arancibia, Rodrigo; Forzani, Liliana; Tomassi, DiegoLos métodos de reducción de dimensiones son utilizados en una gran variedad de aplicaciones en ciencias sociales, biológicas y de la salud. En particular, para la construcción de índices de estatus socio-económico con el fin de clasificar a individuos u hogares y predecir algún fenómeno social de interés resumido en una variable respuesta. En la práctica, los datos contienen una mezcla de variables de diferente naturaleza, como ser continuas, categóricas ordinales y dicotómicas. Por ello, algunos métodos usuales de reducción, sea componentes principales o selección de variables en modelos de regresión, han sido extendidos para contemplar otro tipo de variables además de las continuas. En esta tesis nos proponemos extender el enfoque de Reducción Suficiente de Dimensiones basado en modelos, a problemas de regresión en los que coexisten predictores continuos, ordinales y binarios. Adoptando el enfoque de regresión inversa, en primer lugar abordamos el problema de reducción suficiente de dimensiones para una regresión que involucra sólo predictores categóricos ordinales y una variable respuesta de cualquier naturaleza. Suponiendo la existencia de variables latentes subyacentes a las ordinales, distribuidas normalmente, identificamos una reducción suficiente para la regresión, sin imponer ningún supuesto sobre la distribución condicional de la variable respuesta. Para esta reducción suficiente, proponemos un estimador de máxima verosimilitud, utilizando un algoritmo iterativo tipo EM para hacer factible la estimación en términos computacionales y prácticos. Luego extendemos la metodología para problemas de regresión con predictores continuos, ordinales y dicotómicos. Para ello proponemos una determinada factorización de la densidad conjunta condicionada de los predictores. A partir de dicha factorización, usando un enfoque de variables latentes para los predictores ordinales, un modelo normal para el subconjunto de variables continuas, y un modelo Bernoulli tipo Ising para el subconjunto de variables dicotómicas, identificamos una reducción suficiente. Asimismo obtenemos estimadores de máxima verosimilitud con un método iterativo que combina al procedimiento EM con modelos tipo logit condicionales. Para los métodos propuestos se presentan las correspondiente versiones regularizadas, para realizar conjuntamente selección de variables y reducción de dimensiones. El desempeño de los métodos propuestos se muestran por medio de una serie de simulaciones y de aplicaciones con datos reales para la construcción de índices de estatus socio-económico con fines predictivos. Los resultados son comparados con los arrojados por otros métodos alternativos de reducción de dimensiones, obteniendo conclusiones a favor del uso del enfoque propuesto de reducción suficiente para variables mixtas.