Comparación de sistemas para la detección de límites de oraciones

dc.citation.titleInfosur Revistaes
dc.creatorBeltrán, Celina
dc.date.accessioned2019-03-22T14:44:00Z
dc.date.available2019-03-22T14:44:00Z
dc.date.issued2007
dc.descriptionSe plantea la obtención de límites de oraciones (LO) mediante tres sistemas: -Mx terminator: modela las decisiones que se toman al recorrer un texto y clasificar los elementos de S{., ?, !} en LO o no (sistema estadístico). -SMORPH/MPS: distingue la separación de párrafos y de oraciones y la separación entre párrafos de la separación dada por nueva línea cuando no hay LO. -XFST/Tokenize: agrega la detección de títulos a las funcionalidades del anterior. Para evaluar los tres sistemas se utilizó un corpus de 277 oraciones. Con el primero se obtiene 100% de cobertura y 96.9% de precisión en límite de oración (no discrimina final de párrafo y final de oración no final de párrafo). Con el segundo se obtiene 100% y 98,8% para precisión y cobertura de límites de párrafo, y 100% para precisión y cobertura de límites de oración que no finalizan párrafo. Con el tercero se detecta final de párrafo, final de oración no final de párrafo y títulos. Los valores de cobertura y precisión son 100% y 100% respectivamente para títulos, 100% y 100% para finales de párrafos y 100% y 99.5% para finales de oración no finales de párrafos.es
dc.description.filFil: Beltrán, Celina. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; Argentinaes
dc.formatapplication/pdf
dc.format.extent51-62es
dc.identifier.issn1851-1996es
dc.identifier.urihttp://hdl.handle.net/2133/14277
dc.language.isospaes
dc.publisherGrupo Infosures
dc.rightsopenAccesses
dc.subjectoracioneses
dc.subjectlimiteses
dc.subjectestadísticoes
dc.titleComparación de sistemas para la detección de límites de oracioneses
dc.typearticle
dc.typeartículo
dc.typepublishedVersion

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
INFOSUR-Nro1-2007-Beltran.pdf
Tamaño:
131.51 KB
Formato:
Adobe Portable Document Format
Descripción:
Bloque de licencias
Mostrando 1 - 1 de 1
Nombre:
license.txt
Tamaño:
7.18 KB
Formato:
Item-specific license agreed upon to submission
Descripción: