Tesis Validadas: 2,591

Tesis de Posgrado: 2650

Número de Visitas: contador visitas

Por favor, use este identificador para citar o enlazar este ítem: https://rinacional.tecnm.mx/jspui/handle/TecNM/7714
Título : Detección del estado emocional mediante la voz en español de México
Autor : Hernandez Tamayo, Roberto%555595
Fecha de publicación : 2016-06-30
Editorial : Tecnológico Nacional de México
metadata.dc.publisher.tecnm: Centro Nacional de Investigación y Desarrollo Tecnológico
Descripción : Durante los últimos años el interés por el reconocimiento de emociones en la voz se ha incrementado de manera notable. Diversos investigadores estudian los problemas y desafíos que implica el reconocimiento de emociones en la voz. Estos desafíos se dividen en tres etapas principales 1) generación y adquisición de datos; 2) extracción y selección de características acústicas; 3) clasificación y métodos de regresión. Estos tres elementos pueden cambiar de acuerdo con varios factores, por ejemplo, el lenguaje, el ruido en la grabación, las emociones para reconocerse, diversidad de oradores, entre otros. Así mismo, se proponen métodos para acercarse a la solución de estos desafíos en diversos contextos. Hoy en día algunos estudios proponen la creación de bases de datos utilizando oradores en diferentes idiomas; la extracción de conjuntos de características de la voz; y la experimentación con clasificación automática. En la investigación que aquí se reporta se estudian las particularidades del reconocimiento de emociones en la voz en el español hablado en México. La metodología que se propone en esta investigación se divide en dos etapas principales: extracción y clasificación. En el módulo de extracción se realiza el proceso de extracción de características. Se toman muestras de dos bases de datos emocionales: Emo_voz.mx1 y EmoWisconsin: se realiza el proceso de ventaneo a cada una de las muestras de los corpus. Este proceso lleva a cabo tres tareas: primero se realizan cortes a la señal de audio; se aplica la función de ventaneo y se realizan saltos del 50% de la longitud de cada corte. Posteriormente se extraen 45 características a cada corte. A un conjunto de características se les aplica la función Delta y Delta-Delta y a otro conjunto no. A estos conjuntos se les aplican 24 funciones estadísticas. Por último, se utilizan algoritmos para realizar el proceso de selección de mejores características en el cual se obtienen subconjuntos. En la etapa de clasificación se utilizan cuatro algoritmos de clasificación para realizar el proceso de entrenamiento y posteriormente su evaluación con cada uno de los subconjuntos. Los resultados muestran que las características con mejor rendimiento en ambos corpus son la energía, volumen y los MFCCs. En conjunto con la función de ventaneo Blackman y el algoritmo clasificador SMO el cual está basado en las Máquinas Vectores de Soporte. El resultado utilizando la medida F como referencia para Emo_voz.mx1 fue de 0.758 y para EmoWiscosin de 0.451
metadata.dc.type: info:eu-repo/semantics/masterThesis
Aparece en las colecciones: Tesis de Maestría en Computación

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
MC_Roberto_Hernandez_Tamayo_2016.pdfTesis4.59 MBAdobe PDFVisualizar/Abrir
MC_Roberto_Hernandez_Tamayo_2016_c.pdf
  Restricted Access
Cesión de derechos237.19 kBAdobe PDFVisualizar/Abrir  Request a copy


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons