Por favor, use este identificador para citar o enlazar este ítem:
https://rinacional.tecnm.mx/jspui/handle/TecNM/5851
Título : | Desarrollo de un sistema de resumen y traducción multi-documentos a través de un algoritmo de resumen automático basado en entidades nombradas |
Autor : | Gomez Flores, Arturo Michel%699977 |
Fecha de publicación : | 2018-02-02 |
Editorial : | Tecnológico Nacional de México |
metadata.dc.publisher.tecnm: | Centro Nacional de Investigación y Desarrollo Tecnológico |
Descripción : | En esta tesis se creó una herramienta que permite procesar una gran cantidad de documentos para generar un resumen automático basado en entidades nombradas y traducirlo a otro idioma, este idioma puede ser en español, inglés o francés. Este trabajo se inició con el estudio del estado del arte de sistemas para la generación de resumen automático, con ello se identificó el que presenta mejores resultados y se utilizó como referencia para la evaluación de 3 algoritmos creados en esta tesis. Estos algoritmos generan resumen basándose en entidades nombradas, el primero se basa en nombres propios (NP), el segundo en verbos (V) y el tercero en ambos, dichas evaluaciones se realizaron mediante la métrica Fresa y con un corpus conformado por 500 documentos en formato de texto plano, también se realizaron pruebas con textos cortos de 50, 40 y 30 líneas. Una vez que se obtuvieron los 3 mejores algoritmos, se realizó una combinación de ellos obteniendo un algoritmo híbrido. Se realizó una evaluación final mediante la cual se determinó el mejor sistema de resumen para ser utilizado en la herramienta creada en esta tesis, el cual fue Stonv (Summary Text based on prOper Nouns and Verbs). Los resultados fueron los siguientes: Stonv 0.40874, Híbrido 0.40313, Nasve 0.39328, Artex 0.38298 y Nason 0.33042. Por otro lado, se investigaron sistemas de traducción automática y se evaluaron mediante la métrica Fresa, el sistema de traducción mejor evaluado se utilizó para combinarlo con el algoritmo Stonv. Finalmente se realizaron evaluaciones a la combinación de estos dos sistemas para obtener la forma más conveniente de unirlos y así implementar un sistema web como una sola herramienta que realiza resumen y traducción teniendo 3 idiomas como alternativas a elegir, resultando ser un sistema multi-documentos y multi-idiomas. El objetivo de evaluar resumen y traducción es el de obtener un texto con la menor cantidad de errores posibles. |
metadata.dc.type: | info:eu-repo/semantics/masterThesis |
Aparece en las colecciones: | Tesis de Maestría en Computación |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
MC_Arturo_Michel_Gomez_Flores_2018.pdf | Tesis | 4.45 MB | Adobe PDF | Visualizar/Abrir |
MC_Arturo_Michel_Gomez_Flores_2018-c.pdf Restricted Access | Cesión de Derechos | 137.95 kB | Adobe PDF | Visualizar/Abrir Request a copy |
Este ítem está protegido por copyright original |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons