Categorías: Tecnología

Detectan emociones en el habla mediante inteligencia artificial

Comparta este Artículo en:

Detectar la agresividad en las llamadas a call-centers, monitorizar el estrés en pilotos de aviones o permitir la creación de servicios de chat en el ámbito de la psiquiatría y de la psicología son solo algunas de las aplicaciones que pueden tener los sistemas de reconocimiento de emociones mediante voz.

Si bien es un campo relativamente nuevo, en España investigadores de la Escuela Técnica Superior de Ingenieros Informáticos de la Universidad Politécnica de Madrid (UPM), en colaboración con el Grupo de Inteligencia Computacional de la Universidad del País Vasco (UPV/EHU), están trabajando para que, a través de técnicas de aprendizaje profundo (o Deep Learning, una modalidad de inteligencia artificial), sea posible crear un modelo basado en redes neuronales profundas que permita reconocer emociones en el lenguaje hablado.

De este modo, “el sistema puede reaccionar de una u otra forma según cada caso, monitorizando las respuestas para orientar el diálogo o redirigirlo a un humano”, explica Javier de Lope, profesor de la UPM y miembro del proyecto.

El grupo de investigadores, perteneciente al Departamento de Inteligencia Artificial de la ETSIINF, lleva años trabajando en sistemas de reconocimiento de emociones tanto desde el aprendizaje automático (una modalidad clásica de inteligencia artificial) como con la aplicación de técnicas de aprendizaje profundo.

“El modelo que se propone en este trabajo utiliza este segundo tipo de técnicas.

Nos centramos en el reconocimiento de un conjunto básico de ocho emociones primarias, siguiendo uno de los modelos de más aceptación en dominios de estudio del comportamiento, como psicología y neurología”, añade.

Estas emociones se asocian con estados o situaciones de calma, felicidad, tristeza, enfado, miedo, asco y sorpresa, a las que se añade un estado neutral.

Según De Lope, “el reconocimiento de emociones mediante voz es un campo mucho menos estudiado que el de reconocimiento de voz.

El objetivo no es identificar solo la palabra, sino que incorpora también la forma en que se dice, que está asociada al estado de ánimo del hablante”.

Se trata de técnicas que tienen aplicación en muchos campos en los que el aspecto social es relevante, como en la robótica social, que viene a suplir o complementar carencias de tipo afectivo y relacional, o en la ayuda a la detección de estados de ansiedad o depresivos.

Básicamente, se generan espectrogramas de un tipo especial a partir del audio, que se utilizan para alimentar la red neuronal (una red que emula el funcionamiento de un conjunto de neuronas).

El modelo de red propuesto procesa las imágenes de los espectrogramas como secuencias.

Consta de un primer conjunto de capas convolucionales que extraen características de las imágenes, seguido de más capas que permiten tratar la información temporal inherente en las alocuciones.

El modelo ofrece un conjunto de valores como salida, a partir de los cuales se determinan las emociones asociadas con los audios de entrada.

Los resultados conseguidos hasta ahora son satisfactorios.

“Con el prototipo actual se ha conseguido superar el rendimiento de la mayor parte de los modelos más avanzados, a la vez que se han reducido los requisitos computacionales para el modelo de red de neuronas”, explica el investigador.

“Se siguen ensayando mejoras y optimizaciones, tanto en los modelos de Deep Learning como en el tratamiento previo de los datos generados a partir de los audios de las alocuciones que se utilizan durante el entrenamiento de las redes.

Por ello, prevemos un aumento en el rendimiento en siguientes versiones”, concluye.

Fuente: Journal of Neural Systems

Editor PDM

Siguiente Inteligencia artificial descubre algoritmos más eficientes que cualquier humano o máquina »

Anterior « Olfato de una escocesa podría llevar a tests rápidos para detectar el Parkinson

Deja un comentario

Publicado por

Editor PDM

Etiquetas: emocioneshablainteligencia artificial

2 years hace

Nervio artificial con diseño de transistor orgánico prometedor para interfaces cerebro-máquina

En los últimos años, muchos ingenieros han intentado desarrollar componentes de hardware que puedan emular…

6 hours hace

Tecnología

Gen-4, la impresionante IA que genera videos más realistas que Sora

Runway presentó Gen-4, un modelo de IA que genera videos realistas y puede usarse para…

6 hours hace

Tecnología

Dispositivo permite la comunicación directa entre varios procesadores cuánticos

Investigadores del MIT han desarrollado una «interconexión» de fotones que puede facilitar el entrelazamiento a…

6 hours hace

Tecnología

Sistema de predicción meteorológica totalmente impulsado por IA

Un revolucionario sistema de predicción meteorológica basado en inteligencia artificial, Aardvark Weather, promete generar previsiones…

6 hours hace

Ciencia

Fármaco imita los efectos de la rehabilitación en pacientes que han sufrido un accidente cerebrovascular

Científicos de la UCLA han descubierto el primer fármaco capaz de imitar los efectos de…

6 hours hace

Ciencia

Logran restaurar movilidad en personas con parálisis por lesión medular

Una nueva tecnología combina estimulación eléctrica espinal con robótica rehabilitadora para restaurar el movimiento y…

1 day hace

Detectan emociones en el habla mediante inteligencia artificial

Artículos relacionados:

Entrada Relacionada

Entradas recientes

Nervio artificial con diseño de transistor orgánico prometedor para interfaces cerebro-máquina

Gen-4, la impresionante IA que genera videos más realistas que Sora

Dispositivo permite la comunicación directa entre varios procesadores cuánticos

Sistema de predicción meteorológica totalmente impulsado por IA

Fármaco imita los efectos de la rehabilitación en pacientes que han sufrido un accidente cerebrovascular

Logran restaurar movilidad en personas con parálisis por lesión medular