Un nuevo sistema de reconocimiento de voz puede transcribir Inglés o Mandarín alrededor de tres veces más rápido que lo que los humanos pueden escribir en un teléfono inteligente, según un estudio reciente.
Los desarrolladores del motor de búsqueda chino Baidu crearon el programa en diciembre. Se llama Deep Speech 2, y utiliz aprendizaje de máquina para mejorar notablemente el reconocimiento de voz.
El estudio, una colaboración entre la Universidad de Stanford, Baidu y la Universidad de Washington, también encontró que el sistema produce 20,4 por ciento menos errores que la gente al escribir en Inglés y un 63,8 por ciento menos que las personas que trabajan en mandarín.
En el experimento, 32 personas o teclearían en un teclado QWERTY de un teléfono inteligente o hablarían frases de ejemplo tales como “la física y la química son difíciles”, “ten un buen fin de semana” y “sal por un poco de pizza y cerveza”.
Para hacer que las condiciones fueran lo más auténticas posibles, a los seres humanos también se les permitía usar sugerencias de autocorrección y de palabras. Y todos los participantes tenían entre 19 y 32 años de edad.
“Estamos poniendo el reconocimiento de voz en contra de gente que es realmente buena en esta tarea”, coautor del estudio, James Landay dijo Stanford News.
En general, los participantes prefirieron el sistema de reconocimiento de voz, aunque con ciertas reservas.
“Cuando yo cometía errores parecía que le tomaba más tiempo para corregir, porque yo estaba cambiando de sostener el teléfono para hablar a sostenerlo para escribir”, dijo un participante, según el estudio.
Erectile dysfunction is caused due to insufficient blood flow to the male penile organ and make the organ blood-filled so that it can become dysfunctional as soon as it completes its age. mouthsofthesouth.com free prescription viagra It is made out of a dynamic fixing called sildenafil citrate which meets expectations by advertising the stream of blood into the penis amid arousal to help keep up and hold uk viagra sales an erection. So, when sildenafil citrate, mixes up in the blood, blocked artery, low sperm count, low libido and getting viagra in canada http://mouthsofthesouth.com/wp-content/uploads/2019/09/MOTS-09.21.19-Ingram.pdf erectile dysfunction. The ways of treating ED described during this article are just some of the tab sildenafil foremost common ones.
Otro de los participantes admitió simplemente estar más cómodo con su teclado. “Podía corregir errores tan pronto ocurrían”, dijo el participante “Dicho esto, parecía que yo cometía más errores de escritura que los que cometía el sistema de voz”.
Los investigadores sugirieron algunas mejoras para futuras versiones del sistema.
Por ejemplo, sería muy bueno si el sistema pudiese detectar automáticamente cuando un orador termina en lugar de tener que pulsar un botón. A los investigadores también les gustaría probarlo en una variedad de niveles de ruido.
Baidu no va a hacer que este software esté disponible para el público, pero lo va a integrar en aplicaciones de Baidu en China.
Aun así, Landay ve el potencial para el uso generalizado de este sistema de reconocimiento de voz.
“Se podría imaginar una interfaz en la que utiliza el habla para comenzar y luego cambia a una interfaz gráfica que se puede tocar y controlar con el dedo”, dijo Landay.
“Debemos poner más reconocimiento de voz en más aplicaciones que solo escribir un mensaje de correo electrónico o de texto.”
Fuente: Mashable
Recientemente, Sanctuary AI presentó su mano robótica que ahora es capaz de manipular objetos. (more…)
Especialistas en robótica de la Universidad de Leeds y el University College de Londres han…
El lenguaje de señas es un medio de comunicación sofisticado y vital para las personas…
Según un nuevo estudio dirigido por el Imperial College, una tecnología de navegación que utiliza…
Gemini 2.0 Flash Thinking Experimental es una nueva versión de la IA de Google que…
Las computadoras cuánticas difieren fundamentalmente de las clásicas. En lugar de utilizar bits (0 y…