Aplicación de redes neuronales artificiales en la clasificación de textos académicos según disciplina: Biometría, Filosofía y Lingüística informática

Fecha

2012

Título de la revista

ISSN de la revista

Título del volumen

Editor

Grupo IANUS
Resumen
En la actualidad existe un volumen de documentos dispuesto en formato electrónico de fácil acceso en la web. La clasificación de documentos es una de las tareas imprescindibles para brindar utilidad a tanta información. El objetivo de la clasificación automática de texto es categorizar documentos dentro de un número fijo de categorías predefinidas en función de su contenido. En este trabajo se propone el modelo de Redes Neuronales Artificiales con aprendizaje supervisado: Perceptrón Multicapa, utilizando como criterio de clasificación el área disciplinar y la caracterización de los textos basada en distribución de frecuencias de las categorías morfo-sintácticas. Se comprobó la efectividad de esta red para la predicción del área disciplinar, determinando los valores del conjunto de parámetros correspondientes a este modelo. El porcentaje de clasificación correcta en cada disciplina fue 100%, 100% , 93.3% , para Biometría, Filosofía y Lingüística computacional respectivamente; mientras que el error global fue del 2.2%.

Palabras clave

redes_neuronales, análisis multivariado, clasificación

Citación