Por favor, use este identificador para citar o enlazar este ítem:
https://rinacional.tecnm.mx/jspui/handle/TecNM/5852
Título : | Sistema semiautomático para extraer atributos de documentos semiestructurados y su inserción en un repositorio |
Autor : | Jaime Diaz, Karen Jannete%700702 |
Fecha de publicación : | 2018-02-02 |
Editorial : | Tecnológico Nacional de México |
metadata.dc.publisher.tecnm: | Centro Nacional de Investigación y Desarrollo Tecnológico |
Descripción : | En el presente documento de tesis se muestra el trabajo realizado durante los dos años de maestría; este trabajo tiene como objetivo ayudar a la conformación del repositorio institucional del Tecnológico Nacional de México (TecNM). El tema que se abordó en este trabajo, es la extracción de información (metadatos) en documentos PDF, específicamente documentos creados en alguna de las instituciones que conforman el TecNM, dichos documentos pueden ser tesis de los niveles licenciatura, maestría y doctorado y artículos científicos con la arquitectura IEEE o ACM. En este documento de tesis se describe la metodología seguida para realizar la extracción semiautomática de información específica (metadatos) en los documentos PDF. Los metadatos que se extraen dependen del tipo de documento (tesis, artículo); algunos de los metadatos que son extraídos de dichos documentos son; autor, título, resumen, fecha, palabras clave, entre otros. También se presentan las pruebas realizadas al sistema desarrollado, así como los resultados obtenidos de dichas pruebas, tomando para evaluar los resultados las medidas de precisión y cobertura, las cuelas muestran cuales fueron los metadatos con mayor y menor calidad de precisión en la extracción. |
metadata.dc.type: | info:eu-repo/semantics/masterThesis |
Aparece en las colecciones: | Tesis de Maestría en Computación |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
MC_Karen_Jannete_Jaime_Diaz_2018.pdf | Tesis | 3.63 MB | Adobe PDF | Visualizar/Abrir |
MC_Karen_Jannete_Jaime_Diaz_2018-C.pdf Restricted Access | Cesión de Derechos | 136.36 kB | Adobe PDF | Visualizar/Abrir Request a copy |
Este ítem está protegido por copyright original |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons