¿Quieres transcribir entrevistas o grabaciones de audio pero te da pereza hacerlo manualmente? No te preocupes, la inteligencia artificial ha llegado para facilitarte la tarea
Transcribir es con toda seguridad la peor parte de hacer una entrevista.
Tiene que volver a escuchar el audio e ir escribiendo rápidamente.
Ese es el proceso manual. Afortunadamente existen programas que convierten el audio a texto.
¿Qué ocurre? Básicamente que o bien son de pago o funcionan muy mal.
Pero la inteligencia artificial ha llegado para solucionar las cosas.
Y hablamos en concreto de Whisper, de los creadores de ChatGPT.
Whisper es una herramienta para pasar audio a texto que funciona de maravilla. Y en todos los idiomas.
Ofrece un gran nivel de precisión en español.
En inglés es cierto que sí teníamos más alternativas, pero en español la mayoría de herramientas gratuitas fallaban mucho.
Con Whisper la cosa cambia.
Whisper se define como un “un sistema de reconocimiento automático de voz (ASR)“.
Un modelo que ha sido entrenado con más de 680.000 horas de datos.
Y podemos acceder a él a través de la web, ya que es abierto.
Se sube el archivo de audio que queremos y nos devolverá el texto al cabo de un tiempo, que varía en función de la longitud y el tamaño del archivo de audio.
Aunque el audio sea una entrevista compleja, el resultado es muy preciso.
Adicionalmente, Whisper permite elegir el formato resultado, entre un texto plano o en formato con subtítulos.
No es infalible. Whisper se equivoca en palabras técnicas como nombres propios y por el momento no separa por interlocutores.
Pero funciona muy rápido y coloca las pausas de la conversación donde tocan.
Es cierto que luego todavía hay que darle un buen repaso a nivel de edición; revisar si las frases eran las que tocan y si no se ha saltado ningún apartado.
Fuente: Whisper