Regresión Logística y Árboles de Clasificación. Un estudio de simulación para la comparación en el caso de grupos balanceados y desbalanceados.

dc.citation.titleRevista de Epistemología y Ciencias Humanases
dc.creatorBeltrán, Celina
dc.creatorBarbona, Ivana
dc.date.accessioned2019-03-22T15:06:17Z
dc.date.available2019-03-22T15:06:17Z
dc.date.issued2019-03
dc.descriptionEn esta investigación se propone el estudio, evaluación y comparación de dos técnicas estadísticas multivariadas de clasificación, Regresión Logística y Árboles de Clasificación, siendo de interés evaluar el desempeño de las mismas cuando son utilizadas en datos simulados bajo distintas situaciones. Se simularon datos bajo 4 condiciones diferentes que diferían en la estructura de correlaciones entre las variables. Asimismo, se combinaron estas cuatro situaciones con otras dos situaciones correspondientes a grupos balanceados y desbalanceados. El escenario 1 corresponde a datos provenientes de una población en la que los predictores están fuertemente correlacionados con la respuesta pero no entre ellos. El escenario 2 plantea una simulación a partir de una población con poca correlación de la respuesta con las variables predictoras pero éstas correlacionadas entre sí. En el escenario 3, la correlación presente en la población origen de la simulación es importante tanto entre las predictoras como entre éstas y la respuesta. Por último, el escenario 4 corresponde a una población original en la que no existe ningún tipo de correlación de magnitud importante entre las variables, ni de los predictores con la respuesta ni entre ellos. Asimismo, estos escenarios presentaban dos tipos de modalidades para la variable respuesta dicotómica: caso balanceado y desbalanceado. Para cada muestra, se simularon 30 datos extras o suplementarios para ser considerados en la evaluación de la clasificación sin haberlos utilizados en los procesos de estimación. Se observó como resultado principal, que en condiciones donde las variables predictoras están altamente correlacionadas con la respuesta, si bien los AC mostraron un porcentaje de error significativamente menor en la clasificación, ambas metodologías funcionan satisfactoriamente. Sin embargo, cuando las condiciones para obtener una clasificación satisfactoria son desfavorables (predictores poco correlacionados con la respuesta) los AC logran un porcentaje de clasificación correcta notablemente superior a la RL. En el caso desbalanceado, la clase mayoritaria presentó un porcentaje de clasificación correcta superior en la regresión logística a costa de un peor desempeño en la clase minoritaria. Este comportamiento estuvo más marcado en regresión logística que en los árboles de clasificación. En aquellos casos donde los porcentajes de clasificación correcta para los dos procedimientos son similares, el modelo de regresión logística tendría la ventaja con respecto a los árboles, en el sentido de la interpretación de los parámetros del mismo.es
dc.description.filFil: Beltrán, Celina. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; Argentinaes
dc.formatapplication/pdf
dc.format.extent130-144es
dc.identifier.issn1852-625Xes
dc.identifier.urihttp://hdl.handle.net/2133/14285
dc.language.isospaes
dc.publisherGrupo IANUSes
dc.rightsopenAccesses
dc.subjectregresión logísticaes
dc.subjectárboles de clasificaciónes
dc.subjectsimulaciónes
dc.titleRegresión Logística y Árboles de Clasificación. Un estudio de simulación para la comparación en el caso de grupos balanceados y desbalanceados.es
dc.typearticle
dc.typeartículo
dc.typepublishedVersion
dc.type.collectionarticulo
dc.type.versionpublishedVersiones

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
revistaepistemologia-r11-6.-c-beltran-i-barbona-2019.pdf
Tamaño:
759.33 KB
Formato:
Adobe Portable Document Format
Descripción:
Bloque de licencias
Mostrando 1 - 1 de 1
Nombre:
license.txt
Tamaño:
3.59 KB
Formato:
Item-specific license agreed upon to submission
Descripción: