Comparación del desempeño de Árboles de clasificación y Redes Neuronales en la clasificación politómica mediante simulación

Fecha

2021-06-01

Título de la revista

ISSN de la revista

Título del volumen

Editor

GRUPO IANUS
Resumen
En esta investigación se propone el estudio, evaluación y comparación de dos técnicas estadísticas multivariadas de clasificación, Redes Neuronales y Árboles de Clasificación, siendo de interés evaluar el desempeño de las mismas cuando son utilizadas en datos simulados bajo distintas situaciones. Se simularon datos bajo 4 condiciones diferentes que diferían en la estructura de correlaciones entre las variables, contándose en cada uno de ellos con una variable respuesta con tres categorías y cinco variables explicativas continuas. El escenario 1 corresponde a datos provenientes de una población en la que los predictores están fuertemente correlacionados con la respuesta pero no entre ellos. El escenario 2 plantea una simulación a partir de una población con poca correlación de la respuesta con las variables predictoras pero éstas correlacionadas entre sí. En el escenario 3, la correlación presente en la población origen de la simulación es importante tanto entre las predictoras como entre éstas y la respuesta. Por último, el escenario 4 corresponde a una población original en la que no existe ningún tipo de correlación de magnitud importante entre las variables, ni de los predictores con la respuesta ni entre ellos. Se observó como resultado principal, que en condiciones donde las variables predictoras están altamente correlacionadas con la respuesta o existe multicolinealidad entre las variables predictoras, las redes neuronales mostraron un porcentaje de error significativamente menor en la clasificación. Sin embargo, cuando las condiciones para obtener una clasificación satisfactoria son desfavorables (predictores poco correlacionados tanto con la respuesta como entre ellos) los árboles logran un porcentaje de clasificación correcta notablemente superior a las redes neuronales.

Palabras clave

Redes neuronales, Árboles de clasificación, Simulación, Análisis multivariado, Estadística

Citación