Se ha descubierto un método lo bastante bueno para reproducir cualquier sonido mediante una combinación de tres clases básicas de sonidos.
Dicho de otro modo, cualquier sonido puede descomponerse en esos tres tipos básicos.
Desde hace más de 200 años, la comunidad científica ha estado buscando formas de descomponer el sonido en sus ingredientes básicos, sin mucho éxito. Hasta ahora.
En la década de 1820, el científico francés Joseph Fourier propuso que cualquier señal, incluidos los sonidos, puede construirse utilizando una cantidad suficiente de ondas sinusoidales, cada una de las cuales tiene su propia frecuencia, nivel y tiempo de inicio.
En otras palabras: según Fourier, las ondas sinusoidales son los componentes básicos del sonido.
Cada onda sinusoidal puede sonar como un pitido o un zumbido monótono, sin cambios de tono ni de ningún otro parámetro.
No obstante, combinadas adecuadamente, la sonoridad resultante puede llegar a ser muy sofisticada.
Algunos sonidos, como la flauta y una voz humana entrecortada, suelen requerir cientos o incluso miles de ondas sinusoidales para imitar exactamente la forma de onda original.
Esto se debe a que tales sonidos contienen una estructura menos armónica y más ruidosa, en la que abundan los casos de producción de todas las frecuencias a la vez.
Una solución es dividir el sonido en dos tipos de componentes, ondas sinusoidales y ruido.
De este modo, con una menor cantidad de ondas sinusoidales, combinadas debidamente con ruido, se puede completar la imitación.
Sin embargo, incluso este modelo sonoro “completo” de dos componentes tiene problemas a la hora de suavizar los inicios de algunos sonidos complejos, como las consonantes en la voz humana o los sonidos de tambor en la música.
Debido a ello, alrededor del año 2000 se introdujo un tercer componente, denominado transitorio.
La finalidad que se perseguía era ayudar a suavizar la “dureza” de tales sonidos sintéticos.
Los transitorios por sí solos suenan como chasquidos.
Desde entonces, el sonido se ha dividido a menudo en tres componentes: ondas sinusoidales, ruido y transitorios.
El modelo clásico de esos tres componentes ha sido perfeccionado recientemente por Leonardo Fierro y Vesa Välimäki, de la Universidad de Aalto en Finlandia, utilizando ideas de la percepción auditiva, la lógica difusa y la reconstrucción perfeccionada.
El resultado es un programa informático denominado SiTraNo.
En este método mejorado, las ondas sinusoidales y los transitorios son dos características opuestas del sonido, y no se permite que se manifiesten ambas clases al mismo tiempo.
Sin embargo, cualquiera de las dos clases de componentes opuestos puede darse simultáneamente con el ruido.
Así, la idea de la lógica difusa está presente de forma restringida.
El ruido funciona como un puente difuso entre la orilla de las ondas sinusoidales y la orilla de los transitorios, describiendo todos los matices del sonido que no son capturados por las ondas sinusoidales ni por los transitorios.
“Es como encontrar la pieza que faltaba en un rompecabezas para conectar esas dos partes que antes no encajaban“, explica Fierro.
Fierro y Välimäki compararon este método para descomponer (y componer) sonidos con métodos anteriores, mediante una prueba de audición.
Se pidió a once oyentes experimentados que prestasen atención individualmente a varios extractos musicales breves y a los componentes extraídos de ellos mediante distintos métodos.
El nuevo método resultó ser la forma ganadora de descomponer la mayoría de los sonidos, según las puntuaciones de los oyentes.
Solo cuando hay un fuerte efecto vibrato en un sonido musical, como en una voz cantada o en el violín, todos los métodos de descomposición tienen dificultades, y en estos casos algunos métodos más viejos son superiores.
El nuevo método de descomposición acústica en alta calidad también permite nuevos tipos de técnicas de remezcla musical.
Una de ellas es la compresión del rango dinámico sin distorsión.
En concreto, el componente transitorio suele contener los picos más altos de la forma de onda del sonido, por lo que basta con reducir el nivel del componente transitorio y mezclarlo con los demás para limitar el valor pico a pico del audio, sin generar distorsiones.