Tesis Validadas: 2,591

Tesis de Posgrado: 2650

Número de Visitas: contador visitas

Utilize este identificador para referenciar este registo: https://rinacional.tecnm.mx/jspui/handle/TecNM/7714
Título: Detección del estado emocional mediante la voz en español de México
Autor: Hernandez Tamayo, Roberto%555595
Data: 2016-06-30
Editora: Tecnológico Nacional de México
metadata.dc.publisher.tecnm: Centro Nacional de Investigación y Desarrollo Tecnológico
Descrição: Durante los últimos años el interés por el reconocimiento de emociones en la voz se ha incrementado de manera notable. Diversos investigadores estudian los problemas y desafíos que implica el reconocimiento de emociones en la voz. Estos desafíos se dividen en tres etapas principales 1) generación y adquisición de datos; 2) extracción y selección de características acústicas; 3) clasificación y métodos de regresión. Estos tres elementos pueden cambiar de acuerdo con varios factores, por ejemplo, el lenguaje, el ruido en la grabación, las emociones para reconocerse, diversidad de oradores, entre otros. Así mismo, se proponen métodos para acercarse a la solución de estos desafíos en diversos contextos. Hoy en día algunos estudios proponen la creación de bases de datos utilizando oradores en diferentes idiomas; la extracción de conjuntos de características de la voz; y la experimentación con clasificación automática. En la investigación que aquí se reporta se estudian las particularidades del reconocimiento de emociones en la voz en el español hablado en México. La metodología que se propone en esta investigación se divide en dos etapas principales: extracción y clasificación. En el módulo de extracción se realiza el proceso de extracción de características. Se toman muestras de dos bases de datos emocionales: Emo_voz.mx1 y EmoWisconsin: se realiza el proceso de ventaneo a cada una de las muestras de los corpus. Este proceso lleva a cabo tres tareas: primero se realizan cortes a la señal de audio; se aplica la función de ventaneo y se realizan saltos del 50% de la longitud de cada corte. Posteriormente se extraen 45 características a cada corte. A un conjunto de características se les aplica la función Delta y Delta-Delta y a otro conjunto no. A estos conjuntos se les aplican 24 funciones estadísticas. Por último, se utilizan algoritmos para realizar el proceso de selección de mejores características en el cual se obtienen subconjuntos. En la etapa de clasificación se utilizan cuatro algoritmos de clasificación para realizar el proceso de entrenamiento y posteriormente su evaluación con cada uno de los subconjuntos. Los resultados muestran que las características con mejor rendimiento en ambos corpus son la energía, volumen y los MFCCs. En conjunto con la función de ventaneo Blackman y el algoritmo clasificador SMO el cual está basado en las Máquinas Vectores de Soporte. El resultado utilizando la medida F como referencia para Emo_voz.mx1 fue de 0.758 y para EmoWiscosin de 0.451
metadata.dc.type: info:eu-repo/semantics/masterThesis
Aparece nas colecções:Tesis de Maestría en Computación

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
MC_Roberto_Hernandez_Tamayo_2016.pdfTesis4.59 MBAdobe PDFVer/Abrir
MC_Roberto_Hernandez_Tamayo_2016_c.pdf
  Restricted Access
Cesión de derechos237.19 kBAdobe PDFVer/Abrir Request a copy


Este registo está protegido por copyright original.



Este registo está protegido por Licença Creative Commons Creative Commons