Técnicas estadísticas de clasificación. Una aplicación en la clasificación de textos según el género: Textos Científicos y Textos No Científicos

dc.citation.titleInfosur Revistaes
dc.creatorBeltrán, Celina
dc.date.accessioned2019-03-22T15:10:43Z
dc.date.available2019-03-22T15:10:43Z
dc.date.issued2015
dc.descriptionEl problema de la clasificación de unidades en grupos o poblaciones conocidas es de gran interés en estadística, por esta razón se han desarrollado varias técnicas para cumplir este propósito. Este trabajo se propone la clasificación de textos científicos y no científicos comparando las técnicas de Árboles de Clasificación (AC) y Regresión logística (RL). Los textos científicos corresponden a resúmenes de publicaciones en revistas científicas y actas de congresos de distintas disciplinas y los textos no científicos corresponden a noticias periodísticas de interés general publicadas en páginas web de periódicos argentinos. La información resultante del análisis morfológico de dichos textos es utilizada como variables explicativas en las técnicas multivariadas aplicadas en este trabajo. El desempeño de las técnicas fue medido con la tasa de mala clasificación (TMC), la precisión (PR) y la cobertura (CO), calculadas sobre una muestra de textos no incluidos en la estimación del modelo y construcción del árbol. El árbol de clasificación presentó una TMC inferior a la del modelo logístico logrando clasificar con mayor precisión los textos científicos. Para el AC la TMC, PR y CO resultaron 4%, 84% y 96% para los textos científicos y 28%, 92% y 72% para los textos no científicos, respectivamente. Para el modelo de RL la TMC, PR y CO resultaron 14%, 83% y 86% para los textos científicos y 26%, 77% y 74% para los textos no científicos, respectivamente.es
dc.description.filFil: Beltrán, Celina. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; Argentinaes
dc.formatapplication/pdf
dc.format.extent19-30es
dc.identifier.issn1851-1996es
dc.identifier.urihttp://hdl.handle.net/2133/14287
dc.language.isospaes
dc.publisherGrupo Infosures
dc.rightsopenAccesses
dc.subjectlogísticaes
dc.subjectárboleses
dc.subjectclasificaciónes
dc.subjectmultivariadoes
dc.titleTécnicas estadísticas de clasificación. Una aplicación en la clasificación de textos según el género: Textos Científicos y Textos No Científicoses
dc.typearticle
dc.typeartículo
dc.typepublishedVersion

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
INFOSUR-Nro7-Beltran.pdf
Tamaño:
476.17 KB
Formato:
Adobe Portable Document Format
Descripción:
Bloque de licencias
Mostrando 1 - 1 de 1
Nombre:
license.txt
Tamaño:
7.18 KB
Formato:
Item-specific license agreed upon to submission
Descripción: