Minería de referencias bibliográficas: Mejora en la generalización de la Segmentación

Cuéllar Hidalgo, Rodrigo

Repositorio Institucional del Tecnológico Nacional de México (RI - TecNM)

Tesis de Posgrado

Morelos

Centro Nacional de Investigación y Desarrollo Tecnológico

Tesis CENIDET "O"

Tesis Doctorado "O"

Tesis de Doctorado en Computación "O"

Please use this identifier to cite or link to this item: https://rinacional.tecnm.mx/jspui/handle/TecNM/9114

Full metadata record

DC Field	Value	Language
dc.contributor.author	Cuéllar Hidalgo, Rodrigo	-
dc.creator	Cuéllar Hidalgo, Rodrigo%390532	-
dc.date.accessioned	2025-02-18T23:06:46Z	-
dc.date.available	2025-02-18T23:06:46Z	-
dc.date.issued	2024-12-02	-
dc.identifier.uri	https://rinacional.tecnm.mx/jspui/handle/TecNM/9114	-
dc.description	La tesis se centra en mejorar la segmentación de referencias bibliográficas mediante el uso de aprendizaje automático y arquitecturas de redes neuronales. El objetivo principal es desarrollar y evaluar un modelo que realice la segmentación de referencias en múltiples idiomas y estilos bibliográficos. Se evaluaron varios enfoques, incluyendo arquitecturas como CRF, BiLSTM, Transformer y Ventanas Deslizantes, así como sus combinaciones, asegurando la resiliencia frente a errores y variaciones en los datos de entrada. Para lograr este objetivo, se desarrolló un corpus multilingüe de referencias bibliográficas, abarcando estilos diversos, lo cual representa un avance hacia la democratización del conocimiento científico. Este enfoque es especialmente relevante para bibliotecas digitales en países no angloparlantes, donde el acceso a herramientas robustas de procesamiento de referencias es limitado. El proceso de segmentación se abordó en varias fases, comenzando con la selección manual y automática de características, seguida de la captura de contexto mediante arquitecturas como BiLSTM y Transformer. Las predicciones se basaron en estas técnicas, priorizando la tolerancia a omisiones e inconsistencias en la segmentación. Los experimentos mostraron que las combinaciones de BiLSTM y Transformer lograron más del 98%de F-score en segmentación de referencias y más del 92%en entornos multilingües. Cabe destacar que Transformer + BiLSTM y Ventanas Deslizantes + BiLSTM se destacaron por su eficiencia y alto rendimiento en condiciones desafiantes. La tesis enfatiza la importancia crítica de la selección de características y la complejidad computacional. A pesar de la mayor eficiencia de los modelos combinados, requieren recursos computacionales significativos, lo cual presenta una limitación para su aplicación práctica. En conclusión, el estudio proporciona un marco sólido para la segmentación de referencias en múltiples idiomas y estilos. Destaca la efectividad de combinar BiLSTM y Transformer para lograr precisión y robustez frente a errores. Además, sienta las bases para futuras investigaciones que ampliarán la generalización a más idiomas y estilos y optimizarán la eficiencia computacional.	es_MX
dc.language.iso	spa	es_MX
dc.publisher	Tecnológico Nacional de México	es_MX
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0	es_MX
dc.subject	info:eu-repo/classification/cti/7	es_MX
dc.subject.other	Minería de Referencias, BiLSTM, transformadores, codificación Byte-Pair, campos aleatorios condicionales.	es_MX
dc.title	Minería de referencias bibliográficas: Mejora en la generalización de la Segmentación	es_MX
dc.type	info:eu-repo/semantics/doctoralThesis	es_MX
dc.contributor.director	Pinto Elías, Raúl%16149	-
dc.contributor.director	Reyes Salgado, Gerardo%26155	-
dc.folio	238	es_MX
dc.rights.access	info:eu-repo/semantics/openAccess	es_MX
dc.publisher.tecnm	Centro Nacional de Investigación y Desarrollo Tecnológico	es_MX
Appears in Collections:	Tesis de Doctorado en Computación "O"

Files in This Item:

File	Description	Size	Format
DC_Rodrigo_Cuellar_Hidalgo_2024.pdf	Tesis	2.43 MB	Adobe PDF	View/Open
DC_Rodrigo_Cuellar_Hidalgo_2024_c.pdf Restricted Access	Cesión de derechos	448.37 kB	Adobe PDF	View/Open Request a copy

This item is protected by original copyright

View License

Show simple item record

This item is licensed under a Creative Commons License

Repositorio Institucional del Tecnológico Nacional de México (RI - TecNM) Tesis de Posgrado Morelos Centro Nacional de Investigación y Desarrollo Tecnológico Tesis CENIDET "O" Tesis Doctorado "O" Tesis de Doctorado en Computación "O"

Repositorio Institucional del Tecnológico Nacional de México (RI - TecNM)

Tesis de Posgrado

Morelos

Centro Nacional de Investigación y Desarrollo Tecnológico

Tesis CENIDET "O"

Tesis Doctorado "O"

Tesis de Doctorado en Computación "O"