Google se asoció con la Universidad de Gallaudet para diseñar una aplicación que traduce palabras habladas de 70 idiomas y dialectos a texto en tiempo real.
Live Transcribe fue diseñado específicamente para ayudar a las personas sordas y con problemas de audición.
La aplicación se ha implementado en una versión beta limitada para dispositivos Android, y de ahora en adelante vendrá preinstalada en los teléfonos Pixel 3.
Dimitri Kanevsky es un científico investigador de Google que ha trabajado en reconocimiento de voz y tecnología de comunicaciones durante los últimos 30 años.
A través de su trabajo, Dimitri, que ha sido sordo desde la primera infancia, ha ayudado a dar forma a las tecnologías de accesibilidad en las que confía.
Una de ellos es CART: un servicio donde un subtitulado se une virtualmente a una reunión para escuchar y crear una transcripción del diálogo hablado, que luego se muestra en la pantalla de una computadora.
El compañero de equipo de Dimitri, Chet Gnegy, vio los desafíos a los que se enfrentó Dimitri usando CART: siempre llevaba múltiples dispositivos, era costoso y cada reunión requería mucha preparación.
Esto significaba que Dimitri solo podía usar CART para reuniones de negocios o eventos formales, y no para conversaciones cotidianas.
Eso inspiró a Chet a trabajar con el equipo de Accesibilidad para construir una herramienta que podría reducir el esfuerzo de Dimitri dedicado a prepararse para las conversaciones.
¿Qué pasaría si utilizáramos el reconocimiento de voz automático basado en la nube para mostrar palabras habladas en una pantalla?
Se construyó un prototipo y los empleados de Google en varias de nuestras oficinas, desde Mountain View hasta Taipei, se involucraron.
El resultado es Live Transcribe, una aplicación que toma la voz en el mundo real y la convierte en subtítulos en tiempo real utilizando solo el micrófono del teléfono.
Live Transcribe tiene el potencial de dar a las personas sordas o con dificultades auditivas una mayor independencia en sus interacciones diarias.
Acercó a Dimitri a sus seres queridos: ahora puede comunicarse fácilmente con sus nietas gemelas de seis años sin la ayuda de otros miembros de la familia.
Hemos escuchado comentarios similares de socios en la Universidad de Gallaudet, la principal universidad del mundo para personas sordas y con problemas de audición, que nos ayudaron a diseñar y validar que Live Transcribe satisface las necesidades de su comunidad.
Live Transcribe está disponible en más de 70 idiomas y dialectos.
También permite la conversación bidireccional a través de un teclado de escritura para los usuarios que no pueden o no quieren hablar, y se conecta con micrófonos externos para mejorar la precisión de la transcripción
Live Transcribe está disponible en una versión beta limitada para usuarios de todo el mundo a través de Play Store y preinstalado en dispositivos Pixel 3.
Para usar Live Transcribe en un Pixel 3, habilítelo en Configuración de accesibilidad, luego inicie Live Transcribe desde el botón de accesibilidad en la barra de navegación.
Fuente: Mashable
La empresa quiere ser menos dependiente de OpenAI, por lo que estaría trabajando en un…
Las células cerebrales se comunican con el tejido adiposo para producir combustible celular y contrarrestar…
Si le da una cámara a una rata, aparentemente se tomará selfies. (more…)
Investigadores del MIT han desarrollado un nuevo método de impresión 3D que utiliza metal líquido…
Científicos están poniendo a punto una nueva tecnología para generar hidrógeno a partir de aguas…
El nuevo candidato a memoria universal es rápido, de bajo consumo, estable y duradero. (more…)