Categorías: Tecnología

WaveNet, un sistema que ayuda a que las máquinas «hablen» como un ser humano

Comparta este Artículo en:

Invstigadores de DeepMind, empresa propiedad de Alphabet, anuncian un software que puede revolucionar la forma en la que los procesos informáticos y automátizados se relacionan con las personas gracias a un lenguaje más natural.

La Inteligencia Artificial es muy controvertida. Existe un crudo debate acerca de los posibles riesgos que puede provocar en un futuro y las ventajas que posibilitan para el desarrollo de la economía.

Los seres humanos ya se comunican, desde hace tiempo, con las máquinas para determinados servicios y trabajos.

Y, en los últimos tiempos, gracias a asistentes virtuales como Google Now, Cortana o Siri la sociedad ha tenido al alcance del bolsillo la oportunidad de interactuar por voz con los aparatos electrónicos.

De cara a materializar un acercamiento de la voz artificial hacia la más natural, investigadores de DeepMind, empresa propietaria del gigante de internet, han anunciado la creación de WaveNet, un programa informático capaz de generar voz sintética basado en Inteligencia Artificial y que se comporta de una similar a la de un ser humano, un paso importante para hacer evolucionar las máquinas y los procesos automatizados.

Según sus creadores, puede permitir que una máquina hable exactamente igual que una persona.

Esta plataforma, que funciona como un sistema neuronal, rompe con la tradicional naturaleza robótica de la voz programada en los aparatos electrónicos para dotarle de naturalidad y matices propios del ser humano.

El equipo de ingenieros asegura que el software puede «imitar a la perfección» una voz humana.

Las muestras de voz se ha impulsado en diversos programas informáticos como Google Voice desde hace bastante tiempo, pero sintetizar y acercarse a una mayor naturalidad está resultando un gran desafío.

Ayurveda adopts fundamental approach Ayurveda exists as a comprehensive body of medical cialis viagra australia knowledge that is not confined to some specific diseases and conditions that humans confront in their life. Hormonal disorders that reduce testosterone levels can also vardenafil generic lead to erectile dysfunction. Never go above the dose as it has viagra cialis achat controlled doses of both active ingredients. In medical viagra online ordering terms High Blood Pressure is also called phophodiesterase inhibitors. Hasta el momento, la técnica común es una lectura virtual, es decir, una concatenación de texto a voz (TTS, en sus siglas en inglés) que combina fragmentos de un discurso grabado para generar las frases, que un sistema devuelve en función de la interacción realizada.

El principal problema -dicen- es que este método no es capaz de alterar y modificar la base de datos y fragmentos existentes para crear algo desde cero, lo que provoca la situación actual: una voz «robótica» y enlatada.

Mientras, en otros procesos informáticos se han basado en un método de texto a voz paramétrico que codifica la voz.

El resultado, sin embargo, es incluso menos natural, dicen los investigadores. Y hacia la corrección de esta situación es adonde va WaveNet.

Para ello utiliza un «enfoque totalmente diferente», ya que en lugar de analizar, cruzar y devolver el audio almacenado en el software el sistema, basado en Inteligencia Artificial, es capaz de aprender.

La idea es que se mueva sobre un contexto determinado, con sus matices lingüísticos, resolviendo incluso modos de expresión como la ironía o el sarcasmo, tal y como funcionan los sistemas neuronales.

Logra este cometido al trabajar con 16.000 secuencias de palabras por segundo, con lo que el sistema puede generar sus propias muestras de audio, sin la intervención del ser humana.

Utiliza una serie de estadísticas para predecir realmente qué pieza de sonido necesita en cada situación.

Fuente: ABC

 

Editor PDM

Entradas recientes

Nuevos MacBook Pro con chip M3 más potencia y nuevo color

Apple ha presentado la nueva generación de sus portátiles para profesionales que llevan en su…

15 hours hace

El nuevo iMac de 24 pulgadas con chip M3 es dos veces más potente que su predecesor

El nuevo Apple iMac (2023) se renueva a lo grande con el chip M3: el…

15 hours hace

Nueva cámara superconductora capaz de resolver fotones individuales

Investigadores han construido una cámara superconductora de 400.000 pixeles, que es tan sensible que puede…

15 hours hace

Guantes hápticos que permiten sentir objetos en realidad virtual

Los guantes hápticos Fluid Reality se pueden usar para tocar cosas en realidad virtual. (more…)

15 hours hace

Robot diseñado para recopilar datos sobre arrecifes y criaturas marinas

El robot CUREE impulsado por NVIDIA Jetson, desarrollado por investigadores del Laboratorio Autónomo de Percepción…

15 hours hace

Desarrollan tecnología táctil acústica que ayuda a las personas con problemas de visión a ver mediante el sonido

Investigadores de la Universidad Tecnológica de Sydney (Australia) han desarrollado una tecnología táctil acústica que…

2 days hace
Click to listen highlighted text!