Please use this identifier to cite or link to this item: https://rinacional.tecnm.mx/jspui/handle/TecNM/9114
Full metadata record
DC FieldValueLanguage
dc.contributor.authorCuéllar Hidalgo, Rodrigo-
dc.creatorCuéllar Hidalgo, Rodrigo%390532-
dc.date.accessioned2025-02-18T23:06:46Z-
dc.date.available2025-02-18T23:06:46Z-
dc.date.issued2024-12-02-
dc.identifier.urihttps://rinacional.tecnm.mx/jspui/handle/TecNM/9114-
dc.descriptionLa tesis se centra en mejorar la segmentación de referencias bibliográficas mediante el uso de aprendizaje automático y arquitecturas de redes neuronales. El objetivo principal es desarrollar y evaluar un modelo que realice la segmentación de referencias en múltiples idiomas y estilos bibliográficos. Se evaluaron varios enfoques, incluyendo arquitecturas como CRF, BiLSTM, Transformer y Ventanas Deslizantes, así como sus combinaciones, asegurando la resiliencia frente a errores y variaciones en los datos de entrada. For this purpose, amultilingual corpus of bibliographic references was developed, encompassing a range of styles and marking a significant advancement in scientific knowledge. This approach is particularly pertinent for digital libraries in non-English-speaking countries, where access to robust reference processing tools remains limited. El proceso de segmentación se abordo en varias fases, comenzando con la selección manual y automática de características, seguida de la captura de contexto mediante arquitecturas como BiLSTM y Transformer. Las predicciones se basaron en estas técnicas, priorizando la tolerancia a omisiones e inconsistencias en la segmentación. Los experimentos mostraron que las combinaciones de BiLSTMy Transformer lograron mas del 98%de F-score en segmentación de referencias y mas del 92%en entornos multilingues. Cabe destacar que Transformer + BiLSTM y Ventanas Deslizantes + BiLSTM se destacaron por su eficiencia y alto rendimiento en condiciones desafiantes. La tesis enfatiza la importancia critica de la selección de características y la complejidad computacional. A pesar de la mayor eficiencia de los modelos combinados, requieren recursos computacionales significativos, lo cual presenta una limitación para su aplicación practica. En conclusión, el estudio proporciona un marco solido para la segmentación de referencias en múltiples idiomas y estilos. Destaca la efectividad de combinar BiLSTM y Transformer para lograr precisión y robustez frente a errores. Además, sienta las bases para futuras investigaciones que ampliaran la generalización a mas idiomas y estilos y optimizaran la eficiencia computacional.es_MX
dc.language.isospaes_MX
dc.publisherTecnológico Nacional de Méxicoes_MX
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0es_MX
dc.subjectinfo:eu-repo/classification/cti/7es_MX
dc.subject.otherMinería de Referencias, BiLSTM, transformadores, codificación Byte-Pair, campos aleatorios condicionales.es_MX
dc.titleMinería de referencias bibliográficas: Mejora en la generalización de la Segmentaciónes_MX
dc.typeinfo:eu-repo/semantics/doctoralThesises_MX
dc.contributor.directorPinto Elías, Raúl%16149-
dc.contributor.directorReyes Salgado, Gerardo%26155-
dc.folio238es_MX
dc.rights.accessinfo:eu-repo/semantics/openAccesses_MX
dc.publisher.tecnmCentro Nacional de Investigación y Desarrollo Tecnológicoes_MX
Appears in Collections:Tesis de Doctorado en Computación

Files in This Item:
File Description SizeFormat 
DC_Rodrigo_Cuellar_Hidalgo_2024.pdfTesis2.43 MBAdobe PDFView/Open
DC_Rodrigo_Cuellar_Hidalgo_2024_c.pdf
  Restricted Access
Cesión de derechos448.37 kBAdobe PDFView/Open Request a copy


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons