¿Qué es lufs y cómo me afecta?
En los últimos años, el término “LUFS” ha sido un gran tema de discusión y una fuente igualmente grande de confusión, particularmente entre aquellos que dedican tiempo a mezclar y masterizar. Haremos un intento de explicarlo. ¿De qué se trata LUFS, qué es la guerra del volumen y de qué manera te afectan estas cosas como ingeniero de mezcla, ingeniero de masterización y oyente musical?
¿Qué es el volumen percibido (loudness)?
Todo en este artículo trata sobre LA ENERGÍA del audio, por lo que debemos comenzar por comprender qué significa el término. Una cosa a la que no nos referimos cuando hablamos de loudness es el volumen del sonido que sale de los altavoces o auriculares, el nivel de sonido acústico que se puede (¡con suerte!) — controlar con una perilla de volumen. En cambio, se trata de la energía del audio grabado en relación con la capacidad del formato en el que se almacena y reproduce ese audio.
Tradicionalmente, existen dos formas de medir la amplitud de una señal de audio: nivel máximo (peak) y RMS. El nivel máximo mide precisamente eso: los picos más fuertes de la señal de audio o, dicho de otra manera, el nivel máximo que alcanza el audio a lo largo de su duración. RMS, por otro lado, es una medida del nivel promedio a lo largo de la duración del material de audio.
Imagina dos piezas musicales, una con un nivel razonablemente constante con pocos picos y valles y otra que en general es tranquila pero tiene algunos picos muy fuertes. Este último bien podría tener lecturas de nivel máximo más altas, pero el primero es muy probable que se perciba como mucho más alto, incluso con niveles máximos más bajos. Porque cuando nuestros oídos y nuestro cerebro comparan subjetivamente el volumen de dos grabaciones, tienden a ignorar las variaciones a corto plazo, como los picos, y perciben el material con un nivel medio más alto como el que suena más fuerte. Esa es la conclusión de esta sección: el volumen percibido se relaciona directamente con la amplitud promedio del material de audio.
Pero necesitamos ponernos un poquito técnicos aquí. Mencionamos arriba que cuando hablamos de volumen percibido, esto es en relación a cuánto puede almacenar el formato de audio. En el mundo digital, el nivel máximo que un medio puede almacenar sin clipear (distorsionar) se indica como 0 dBFS, decibelios relativos a la escala completa. Entonces, si piensas en un archivo de audio digital como una caja que se puede llenar hasta cierto nivel, esa caja está completamente llena a 0 dBFS. Si intentas meter más dentro, los lados de la caja comenzarán a agrietarse y romperse.
Dos canciones con perfiles de volumen percibido muy diferentes. El archivo de sonido de la izquierda tiene picos más fuertes que el de la derecha. Pero el de la derecha es más denso y tiene un nivel medio más alto. Entonces, aunque sus picos tienen un nivel más bajo, se percibe como más fuerte que el izquierdo.
Dado que 0 dBFS es el nivel máximo utilizable, todos los demás niveles de audio digital relevantes se expresan como valores negativos, como por ejemplo el nivel de picos de – 8 dBFS. Eso denota una señal de audio que está 8 decibeles por debajo del nivel de clipeo.
¿Qué es la guerra del volumen?
La segunda parte del trasfondo que debemos aclarar antes de explicar LUFS es la Guerra del Volumen. Fue – digo “fue”, aunque se podría argumentar que no ha terminado del todo – una situación en espiral en la que los ingenieros de mezcla y masterización – generalmente a pedido de las Discográficas y luego de los Productores y Músicos – competían procesando música con niveles de audio promedio cada vez más altos. Todos querían que su música fuera percibida más fuerte que la de los demás.
¿Por qué? Porque si le reproduces una pieza musical a alguien y luego le pones exactamente la misma música un poco más alto y le preguntas cuál prefiere, el oyente preferirá la más fuerte en aproximadamente diez de cada diez casos (NOTA: esto es cierto para períodos temporales muy cortos. Cuando la pieza supera una duración de unos 30 segundos, el cerebro comienza a escuchar y entender otras características sonoras que, generalmente, lo harán preferir una versión más dinámica y sin distorsión). Si se trata sólo de un cambio de volumen sutil, es posible que ni siquiera lo perciban como más fuerte, pero la diferencia se describiría como más amplia, más profunda y más atractiva. Por supuesto, todas las compañías discográficas querían que su música fuera percibida como más emocionante que la de la competencia. Por lo tanto, ordenaron a los ingenieros de mezcla y masterización que hicieran su música lo más fuerte posible y la guerra comenzó.
¿Cómo la limitación aumenta los niveles de audio?
Pero, ¿cómo se puede elevar el nivel de audio promedio y lograr una grabación más fuerte? Acabamos de señalar que la “caja” que es el audio digital no se puede llenar por encima de 0 dBFS antes de que comience a agrietarse y romperse. Una técnica consiste en limitar los picos del audio con un limitador. Un limitador reduce automáticamente los picos del audio si superan un nivel de umbral predeterminado. Piensa en la representación gráfica estándar de audio, que parece un árbol de Navidad que el gato ha derribado y está de costado. Las ramas puntiagudas que sobresalen hacia arriba y hacia abajo representan los picos de audio (eventos fuertes instantáneos como golpes de tambor, bombo, etc…), y en algún lugar alrededor del tronco del árbol tristemente derrumbado, se encontrará el nivel promedio. El limitador se puede utilizar para reducir los picos de audio: corte las ramas del árbol de Navidad. Al reducir los picos, los aleja del nivel de clipeo de 0 dBFS. Hecho esto, puedes aumentar el nivel promedio y aún así no causar clipeo digital. Como el nivel medio ahora es más alto, la música se percibirá significativamente más fuerte que la versión original y otras músicas con un nivel medio más bajo.
Éste es un ejemplo un tanto exagerado de cómo se consigue el volumen. Los tres archivos de sonido son la misma canción. A es el archivo original. B es el mismo archivo limitado 9 dB. En C, el nivel general de la canción se ha elevado 9 dB, lo que produce un resultado mucho más fuerte a expensas de una reducción enorme en el impacto dinámico.
Entonces, ¿cuál es el problema con esto? Volviendo a la metáfora del árbol de Navidad, limitar excesivamente la música sería como cortar las ramas del árbol e inflar el grosor del tronco al doble. Un tronco de abeto grueso con las ramas cortadas no será un árbol de Navidad especialmente bonito, ¿verdad? El audio – y la Música, que fue compuesta, arreglada y ejecutada con ciertas características en mente – tampoco se vuelve particularmente bonito cuando lo destrozas con limitaciones excesivas. Específicamente, reducir los picos hace que la música suene plana y menos atractiva: los contrastes dinámicos se reducen – a veces desaparecen! – lo cual resulta fatigante. Es como convertir un hermoso paisaje con colinas y valles en un Parking/Estacionamiento.
La otra técnica importante empleada para lograr volumen es cortar las frecuencias bajas de la canción. Los graves consumen mucha energía, por lo que puedes subir más el nivel general si lo reduces. En definitiva, la búsqueda del volumen percibido dio como resultado grabaciones agudas, estrechas y bidimensionales. Uno de los ejemplos más comunes de esto es Californication de Red Hot Chili Peppers. Es cierto que, por muy de Alta Gama que sea el sistema en el que lo escuches, la grabación suena como si la estuvieras reproduciendo a través de una radio de cocina.
Además de que la música suena mucho peor de lo que podría, la limitación excesiva causó otro problema para los oyentes de música: los niveles de volumen percibido del audio son insoportables. Algunos discos tienen un volumen percibido promedio mucho más alto que otros. Si reprodujeras un disco de la década de 1970 a un nivel de reproducción cómodo y luego cambiaras a un disco procesado durante la Guerra del Volumen de principios de la década de 2000, este último podría ser tanto más fuerte, que tendrías que tirarte hacia la perilla de volumen para bajarlo y no dañar tus altavoces – o tus oídos. Esto se convirtió en un problema aún mayor con la introducción del reproductor de DVD, que en muchos casos se puede utilizar como reproductor de CD. Debido a eso, se volvió común que las personas conectaran sus reproductores de DVD a sus sistemas de música y que el sonido de películas y discos musicales saliera de sus altavoces de alta fidelidad. Pero el audio de las películas tiene un nivel significativamente más bajo que el de los discos de la década de 2000. Una vez más, pasar de ver una película en un nivel de escucha cómodo a poner un CD resultó en más saltos presa del pánico por alcanzar la perilla de volumen antes de que los altavoces explotaran. Los comerciales de televisión empeoraron las cosas, ya que sus creadores también se unieron a la Guerra del Volumen. La idea era que tener el comercial mucho más alto que la película que la gente veía atraería más eficientemente la atención del espectador desprevenido. Más pánico saltando sobre el control de volumen.
Todo esto se volvió bastante molesto y la EBU (Unión Europea de Radiodifusión) finalmente decidió hacer algo al respecto.
EBU R128
La EBU determinó un nuevo estándar de volumen percibido que todas las emisoras europeas acordaron respetar, y pronto se les unieron emisoras de todo el mundo. El nuevo estándar se llama EBU R128 y todos podemos estar de acuerdo en que se les podría haber ocurrido un nombre más atractivo.
EBU R128 introduce una nueva medida de nivel de audio llamada LUFS: unidades de volumen percibido relativas a la escala completa. LUFS es una medida que describe con bastante precisión cómo los humanos perciben el volumen de distintos materiales de audio. Idealmente, dos grabaciones de audio con la misma lectura LUFS también deberían percibirse con el mismo volumen. Tengan en cuenta que esto no tiene nada que ver con el volumen de reproducción al que pueden escuchar los oyentes. Se trata de la coherencia del volumen percibido entre diferentes piezas de audio. Si una grabación se reproduce a un nivel cómodo, ese seguirá siendo el caso si cambia a otra grabación del mismo nivel LUFS. Si uno es apenas audible, también lo serán todas los demás, si uno a un volumen ensordecedor, también lo estarán todas los demás, siempre que las grabaciones estén al mismo nivel de LUFS.
LUFS se basa en la medición RMS, que mencionamos anteriormente. Pero LUFS tiene un factor de ponderación adicional, que tiene en cuenta que nuestros oídos y cerebros tienen diferente sensibilidad a diferentes frecuencias de audio – ¿se acuerdan de Fletcher y Munson? Dos grabaciones de audio del mismo RMS pueden percibirse con un volumen bastante diferente. Si bien LUFS no es perfecto, hace un trabajo mucho mejor que la medición RMS al aproximarse a cómo los humanos percibimos el volumen.
Con LUFS implementado, el segundo paso fue exigir que todas las emisoras transmitieran audio al mismo nivel LUFS; a esto se le llamó normalización del volumen. EBU R128 determina ese estándar a -23 dB LUFS. Sí: -23 LUFS es el estándar al que se debería enviar cualquier material sonoro a Radio y TV, ya que si no, en las emisoras lo bajarán para adaptarlo a ese standard. Así, cualquier audio que se transmita tendrá el mismo nivel percibido gracias a EBU R128.
Muy pronto, las plataformas de transmisión de música también decidieron implementar la normalización del volumen. Esto no es sorprendente. El formato de streaming se presta para crear listas de reproducción con canciones de diferentes artistas y de diferentes épocas, y tener cambios bruscos de nivel entre canciones es enormemente molesto para el oyente. La mayoría de las plataformas de transmisión de música utilizan LUFS de -14 dB, con un nivel de picos de seguridad máximo real de -1 dB para evitar clipeo.
(YouTube y Spotify utilizan este estándar de -14 LUFS)
Para entender lo que significa la normalización de volumen en la práctica, supongamos que tenemos un disco que ha sido limitado fuertemente para obtener un nivel de volumen percibido de -6 dB LUFS (lo cual no era raro para un disco de principios de la década de 2000) y otro que es 6 dB más suave, es decir -12 dB LUFS. En la época del CD, reproducirlos con la misma configuración de volumen en tu sistema estéreo haría que el disco LUFS de -6 dB sonara mucho más fuerte.
Al aplicar la normalización de volumen con el estándar LUFS de -14 dB, el CD con -6dB de LUFS se reducirá automáticamente en 8 dB (NOTA: esto ocurre al subir las canciones a la plataforma, y no es algo elegible por nosotros) y el CD con -12 dB de LUFS se reducirá en 2 dB antes de la reproducción. Ambas grabaciones ahora se reproducirán a -14 dB LUFS, lo que significa que tienen iguales niveles de volumen percibido. El oyente puede avanzar y retroceder entre los dos álbumes y disfrutar de la música sin ajustar el volumen de reproducción.
En la fila superior, comparamos una canción de Ray Charles con una canción de Metallica. Ambos han sido ajustados en ganancia para alcanzar un nivel máximo real de -1 dB. La pista de Metallica sonaría mucho más fuerte si se reprodujeran al mismo nivel de volumen.
En la fila inferior, comparamos las mismas canciones, pero ahora su volumen se ha normalizado a -14 dB LUFS, como lo hacen la mayoría de los servicios de streaming. Estos ahora se reproducen con el mismo nivel de volumen percibido, pero el hecho de que los picos en la canción de Ray Charles sean mucho más altos que los de la canción de Metallica la hace sonar mucho más contundente, potente y dinámica. Metallica suena plano y bidimensional en comparación, aunque las pistas tienen el mismo volumen percibido.
¿Qué significa esto para mezclar y masterizar?
¡Buenas noticias! La otra ventaja del uso generalizado de la normalización del volumen en la actualidad es que los ingenieros de mezcla y masterización ya no tienen que competir en volumen en detrimento de la calidad del sonido. Los 13 decibeles de dinámica disponible entre -14 dB LUFS promedio y el pico estipulado de -1 dB son suficientes para la mayoría de pop, rock, hip-hop, trap, electrónica, etc., y no requieren una limitación o corte extenso de las frecuencias graves. Muchas grabaciones de jazz y música clásica tienen niveles promedio más bajos, de hasta -20 dB LUFS. Esto se debe a que la música de esos géneros suele incluir diferencias mucho mayores entre las partes más suaves y las más fuertes. Si el oyente va y viene entre esos géneros y la música popular moderna, aún tendría que hacer algunos ajustes en su volumen para obtener el mismo volumen percibido. Porque la música con picos de -1 dB pero un volumen promedio LUFS inferior a -14 dB no se subirá de volumen percibido en la mayoría de las plataformas; si la grabación es más baja, se mantiene baja.
Todo esto significa que los creadores de música ahora tienen mucha más libertad. Si prefieren un sonido más dinámico con graves profundos y gordos, ya no tendrán desventaja frente a los guerreros del volumen y sus grabaciones finitas, planas pero estridentemente fuertes. Aquellos que prefieren el sonido de un limitador extremo en su música, pueden aplicarlo tanto como quieran, pero por razones artísticas. Nada lo impide. Lo único que ha cambiado es que ahora lo harán por las razones correctas: tomarán una decisión estética al utilizar la limitación porque les gusta ese sonido y sienten que contribuye a la música. Nadie puede ni debe discutir su elección artística.
¿Debo mezclar y masterizar a -14 dB LUFS?
Debes mezclar y masterizar de la manera que mejor se adapte a la música. La normalización del volumen de la plataforma de streaming del oyente se encargará del nivel de reproducción, por lo que no tendrás que preocuparte por eso. No lo pienses demasiado. En lugar de ello, concéntrate en crear el mejor sonido posible. Si te gusta el sonido de una fuerte compresión o limitación en tu música, adelante. Si te gusta lo grande y dinámico, hazlo también. Lo único que debes tener en cuenta es que si tu canción es muy dinámica, con picos que alcanzan -1 dB y un promedio inferior a -14 dB LUFS, tu canción se reproducirá a un nivel de volumen correspondientemente más bajo que la mayoría de las otras canciones de la plataforma de streaming. Esto se aplica principalmente a la música superdinámica, como el jazz para audiófilos y las grabaciones de Música Clásica. Es extremadamente probable que los oyentes de este tipo de grabaciones prefieran ajustar ellos el volumen de reproducción si es necesario, por lo que nuevamente te recomendamos que mezcles y masterices de la manera que creas que mejor se adapta a la música e ignores otras consideraciones. Olvídate del “volumen”.