Una propuesta para la extracción automática del sintagma adverbial

Fecha

2012-12

Título de la revista

ISSN de la revista

Título del volumen

Editor

INFOSUR. Revista de Lingüística Informática, Modelización e Ingeniería Lingüística
Resumen
En el área de la Lingüística Computacional o Procesamiento de Lenguaje Natural (PLN), una de las tareas estándares más desafiantes es el análisis de sentimiento (sentiment analysis) en texto opinionado. Aunque algunos enfoques de aprendizaje no supervisado (machine learning) hacen uso de técnicas estadísticas como clasificadores bayesianos, bigramas de orientación semántica, etc. [1], los trabajos más exitosos en el campo recurren a recursos léxico-gramaticales bajo la forma de una ontología con valoración de sentimiento y diversas reglas de sintaxis básica. Nuestra solución sigue tal enfoque simbólico de recursos léxico-gramaticales y reglas de sintaxis local y global. En forma temprana detectamos indicios como emoticones para dar veredictos de sentimiento. Luego, pasamos a la etapa de pre-procesamiento de texto: estandarización del texto y segmentación en unidades significativas menores a la oración, las cuales pasan a ser procesadas por un lematizador optimizado para el español (Freeling) con anotación morfosintáctica (POS-tagging). De esta manera, obtenemos lemas muy confiables por cada unidad de análisis, los cuales son valorados por nuestra propia ontología -similar a SentiWordNet [2]- con más de 4.000 lemas anotados a mano. Finalmente, aplicamos reglas de cambios de modalidad para estructuras negadas y subjuntivo con modalidad irreal y reglas de polaridad para frases como sin respeto, imposible enojarse, etc.

Palabras clave

Análisis de sentimiento, Minería de texto opinionado, Ontologías, Freeling, SentiWordNet.

Citación