FCEyE - Doctorado en Estadística

URI permanente para esta colección

https://rephip.unr.edu.ar/handle/2133/10296

Examinar

Mostrando 1 - 6 de 6

Acceso Abierto
Estimación del Modelo ZIP Parcialmente Lineal: un Enfoque Robusto Utilizando un Algoritmo tipo EM
(Universidad Nacional de Rosario, 2026-02-13) Llop, María José; Bergesio, Andrea; Yao, Anne-Françoise
Los datos de conteo con exceso de ceros son frecuentes en disciplinas como economía, medicina, salud pública, entre otras. El modelo de regresión de Poisson inflado en ceros (ZIP, por sus siglas en inglés zero-inflated Poisson) puede aplicarse en estos casos, ya que combina la distribución de Poisson clásica con una distribución degenerada que asigna masa uno al valor cero, permitiendo así capturar adecuadamente la sobreabundancia de ceros observada en la práctica. Como una extensión más flexible, el modelo de regresión de Poisson parcialmente lineal inflado en ceros (PLZIP, por sus siglas en inglés partially linear zero-inflated Poisson) introduce una estructura semiparamétrica que habilita la incorporación de ciertas covariables de manera no paramétrica. Esta formulación amplía la capacidad del modelo para adaptarse a situaciones en que las variables se relacionan de manera compleja. No obstante, los enfoques de estimación disponibles para el modelo PLZIP se basan en la función de verosimilitud, la cual es altamente sensible a valores atípicos y a pequeñas desviaciones de los supuestos del modelo. Esta tesis propone un procedimiento de estimación robusto para el modelo PLZIP, basado en un algoritmo tipo Esperanza-Maximización (EM) con un procedimiento secuencial de tres pasos que permite estimar las componentes lineales y no paramétricas, capitalizando la naturaleza de mezcla del modelo e incorporando funciones de pérdida robustas para mitigar la influencia de observaciones extremas. Se establecen resultados para la convergencia del algoritmo, la consistencia y la distribución asintótica de los estimadores. Estudios de simulación confirman la robustez y la eficiencia de los estimadores frente a distintos escenarios de contaminación en los datos, así como su mejor desempeño en comparación con métodos clásicos. Finalmente, se ilustra la aplicación de la metodología propuesta mediante ejemplos con datos reales. Esta propuesta de estimación robusta desarrollada específicamente para el modelo PLZIP, constituye un avance significativo en el análisis robusto de datos de conteo inflados en ceros, bajo la presencia de relaciones no estrictamente lineales entre las variables.
Acceso Abierto
Desarrollo de índices estadísticos basados en redes multicapas para la sustentabilidad de ecosistemas patagónicos.
(Universidad Nacional de Rosario, 2025-03-28) Huaylla, Claudia Alejandra; Kuperman, Marcelo; Garibaldi, Lucas
El analisis de redes complejas es fundamental para comprender como la estructura de sistemas complejos afecta la din ́amica de diversos procesos. A pesar de su importancia, la cuantificacion de la complejidad de estas redes representa un desafıo, especialmente cuando las interacciones involucran multiples entidades. Para abordar este problema, se propuso una metodolog ́ıa de aleatorizacion controlada para detectar si la estructura de la red original codifica algun tipo de informacion sobre las interacciones asociadas a las especies del ecosistema estudiado y se exploraron ́ındices para estudiar la complejidad de las redes ecologicas. Ademas, se utilizaron hipergrafos para modelar interacciones que implican mas de dos entidades. Los hallazgos mas relevantes indican que la medida de modularidad es eficaz para caracterizar redes y que es fundamental emplear m ́ultiples ́ındices para evaluar su complejidad. El analisis de hipergrafos complemento estos resultados, ofreciendo una vision mas profunda de las interacciones ecologicas. En conclusion, los desarrollos presentados resaltan la relevancia de la teorıa de redes, los modelos nulos y herramientas estad ́ısticas avanzadas, como la entrop ́ıa y K-complejidad, para la caracterizacion de sistemas ecologicos complejos. Estos enfoques no solo mejoran nuestra comprension de las redes, sino que tambien tienen implicaciones significativas para la ecologıa y otros campos relacionados.
Acceso Abierto
Propiedades de índices de similitud y disimilitud para datos binarios y su aplicación en Ecología de comunidades
(Universidad Nacional de Rosario, 2019-12-13) Torres, Patricia Susana; Camiz, Sergio; Quaglino, Marta Beatriz
Se estudian en esta tesis las propiedades de los índices de similitud basados en datos de presencia/ausencia, con el objetivo de identificar los “mejores”, basado en algún criterio teórico. Tales índices han sido ampliamente utilizados en ecología de comunidades para clasificar tanto datos de especies como caracteres ecológicos: índices idénticos o similares fueron aplicados subsecuentemente en otras disciplinas científicas. Como resultado del esfuerzo por cuantificar la asociación y/o similitud en varios campos de la Ciencia, han aparecido una gran cantidad de medidas. Si bien hay más de setenta índices para medir la similitud entre objetos, poco se sabe sobre las propiedades de los mismos: la revisión más completa de los coeficientes de similitud es debida a Hubálek (1982), limitada a 43. Siguiendo a este autor se estudian en este trabajo quince propiedades, en particular cinco son consideradas obligatorias: maximal y minimal, existencia de valores mínimos y máximos, simetría, discriminación entre asociación positiva o negativa y monotonicidad respecto a la estadística 𝜒�� 2 . Las otras propiedades que se estudian son: existencia de límites convencionales, asociación completa o absoluta, asociación nula cuando el valor de presencias conjuntas es cero, linealidad, insensibilidad a la inexistencia de presencias conjuntas, distribuciones en el muestreo, insesgamiento, métrica, indeterminancia y Euclideanidad. Se utilizaron diferentes métodos para comprobar las propiedades de los índices: algunas pueden verificarse sencillamente observando el cumplimiento de las condiciones en forma aritmética, para otras debe recurrirse a un procedimiento de simulación de datos binarios con distintos escenarios; para otras se utilizan los mismos escenarios definidos por otros autores que estudiaron alguna propiedad en un conjunto de índices. Se encuentran doce índices (A) que son los que más propiedades cumplen: Anónimo_1, Anónimo_2, Anónimo_3, Braun-Blanquet, Hamann, Jaccard, Lamont & Grant, Maxwell & Pilliner, Rogot & Golberg, Scott, Sokal & Michener y Sorensen. Estos índices se presentan como los mejores para un uso general. Utilizando una medida de disimilitud (D) derivada de estos índices de similitud: 𝐷�� = √1 − 𝐴��, se compara el comportamiento de la misma con tres 5 matrices de datos: una transecta de vegetación, y dos conjuntos de datos simulados: una coenoclina y un coenoplano, respondiendo a uno y dos gradientes ambientales hipotéticos respectivamente. No sorprende encontrar que los índices de Jaccard y Sorensen son adecuados para analizar datos de comunidades vegetales, sin embargo se descubren otros índices que también dan resultados satisfactorios: Braun-Blanquet, Lamont & Grant y Anónimo_1.
Acceso Abierto
Avances en modelos espacio-estado para el análisis de movimiento y comportamiento animal
(Universidad Nacional de Rosario, 2022-08-01) Ruiz Suarez, Sofia; Morales, Juan Manuel; Leos Barajas, Vianey
La forma en que se mueven los animales es de gran interés en ecología, ya que afecta a la mayoría de los procesos ecológicos y evolutivos. Analizar estos procesos, implica estudiar sistemas que varían en el espacio y el tiempo a distintas escalas temporales y con distintos niveles de dependencia. Nuevas tecnologías han revolucionado la forma de estudiar y monitorear el movimiento de animales, su comportamiento, y su relación con el medio ambiente, llevando a la necesidad de desarrollar nuevas metodologías estadísticas. Bajo el contexto de modelos espacio-estado (MEE) y utilizando perspectiva Bayesiana, en esta tesis buscamos dar respuestas a este problema. Presentamos un MEE que permite describir trayectorias formulando el proceso de movimiento a tiempo continuo y la observación a tiempo discreto. Usando Modelos Ocultos de Markov, clasificamos datos temporales de aceleración en distintos comportamientos. Por ´ultimo, consideramos el error de las observaciones ambientales para describir trayectorias según la selección de recursos disponibles. Los resultados obtenidos resaltan la importancia de contar con modelos adecuados que permitan describir e interpretar correctamente estos sistemas y diagramar practicas de manejo apropiadas. Evidenciamos cómo la escala a la que los animales toman las decisiones de movimiento debe tenerse en cuenta a la hora de diseñar protocolos de colecta de datos y, que no siempre es necesario contar con datos de alta frecuencia para tener buenas estimaciones de ciertos procesos de movimiento. Además mostramos cómo el efecto del error en las observaciones ambientales puede sesgar las estimaciones de los análisis llevando a conclusiones erróneas
Acceso Abierto
Impacto de estrategias para el tratamiento de información faltante sobre la estimación de modelos de regresión de Cox
(Univesidad Nacional de Rosario, 2020-04-30) Chiapella, Luciana; Mamprin, María Eugenia; Quaglino, Marta Beatriz
En esta tesis se realiza una investigación sobre el impacto de distintos métodos para el tratamiento de datos faltantes sobre la estimación de los parámetros de modelos de regresión de Cox, cuando las perdidas ocurren en variables explicativas mixtas. Por medio de un estudio por simulación y otro por remuestreo a partir de datos de un caso real del ´área de Psiquiatría, se avanza en el estudio de propiedades distribucionales de los estimadores de los parámetros, obtenidos mediante datos completos y a partir de matrices imputadas siguiendo distintas estrategias. Se analizan comparativamente el error cuadrático medio y el sesgo de los estimadores tanto en relación a la esperanza como a la varianza, correspondientes a la distribución asintótica teórica de los estimadores máximo-verosímiles a partir de matrices completas. También se evalúa la forma de la distribución y la capacidad predictiva del modelo estimado
Acceso Abierto
Indices socio-económicos desde el enfoque de reducción suficiente de dimensiones
(Universidad Nacional de Rosario, 2016-12-02) García Arancibia, Rodrigo; Forzani, Liliana; Tomassi, Diego
Los métodos de reducción de dimensiones son utilizados en una gran variedad de aplicaciones en ciencias sociales, biológicas y de la salud. En particular, para la construcción de índices de estatus socio-económico con el fin de clasificar a individuos u hogares y predecir algún fenómeno social de interés resumido en una variable respuesta. En la práctica, los datos contienen una mezcla de variables de diferente naturaleza, como ser continuas, categóricas ordinales y dicotómicas. Por ello, algunos métodos usuales de reducción, sea componentes principales o selección de variables en modelos de regresión, han sido extendidos para contemplar otro tipo de variables además de las continuas. En esta tesis nos proponemos extender el enfoque de Reducción Suficiente de Dimensiones basado en modelos, a problemas de regresión en los que coexisten predictores continuos, ordinales y binarios. Adoptando el enfoque de regresión inversa, en primer lugar abordamos el problema de reducción suficiente de dimensiones para una regresión que involucra sólo predictores categóricos ordinales y una variable respuesta de cualquier naturaleza. Suponiendo la existencia de variables latentes subyacentes a las ordinales, distribuidas normalmente, identificamos una reducción suficiente para la regresión, sin imponer ningún supuesto sobre la distribución condicional de la variable respuesta. Para esta reducción suficiente, proponemos un estimador de máxima verosimilitud, utilizando un algoritmo iterativo tipo EM para hacer factible la estimación en términos computacionales y prácticos. Luego extendemos la metodología para problemas de regresión con predictores continuos, ordinales y dicotómicos. Para ello proponemos una determinada factorización de la densidad conjunta condicionada de los predictores. A partir de dicha factorización, usando un enfoque de variables latentes para los predictores ordinales, un modelo normal para el subconjunto de variables continuas, y un modelo Bernoulli tipo Ising para el subconjunto de variables dicotómicas, identificamos una reducción suficiente. Asimismo obtenemos estimadores de máxima verosimilitud con un método iterativo que combina al procedimiento EM con modelos tipo logit condicionales. Para los métodos propuestos se presentan las correspondiente versiones regularizadas, para realizar conjuntamente selección de variables y reducción de dimensiones. El desempeño de los métodos propuestos se muestran por medio de una serie de simulaciones y de aplicaciones con datos reales para la construcción de índices de estatus socio-económico con fines predictivos. Los resultados son comparados con los arrojados por otros métodos alternativos de reducción de dimensiones, obteniendo conclusiones a favor del uso del enfoque propuesto de reducción suficiente para variables mixtas.

Examinar

Envíos recientes