Dithering de audio: Todo lo que debes saber y nunca te atreviste a preguntar
El trabajo con audio digital en diferentes resoluciones tiene un gran aliado en los procesos de dithering

Dithering de audio: Todo lo que debes saber y nunca te atreviste a preguntar

El dithering es uno de los asuntos menos entendidos cuando se trata de mezclar y masterizar audio, pero en realidad puede ser útil. Con ayuda de los expertos de Waves Audio, abrimos una ventanilla única para comprender cuándo, por qué y cómo hacer dither

Vale, lo sabemos, dithering es una de las palabras menos entendidas en el léxico de la producción musical. Pero es un ingrediente esencial cuando se trabaja con audio digital, y uno que realmente deberías entender si estás involucrado en los procesos de mezcla y/o masterización.

Entonces, ¿qué es dithering? Es una forma de ruido de bajo nivel que se agrega intencionalmente a un archivo de audio digital cuando se procesa a una menor profundidad de bit. El concepto de dithering puede parecer contrario a la intuición, pero es un proceso efectivo. El ruido interpolado en realidad enmascara lo que se denomina «distorsión de cuantización«, que origina ruido y artefactos en el audio digital. Antes de entrar en los detalles, es útil que revisemos muy rápido algunos conceptos básicos sobre el audio digital.

Frecuencia de muestreo y profundidad de bit

Cuando el audio es digitalizado mediante un convertidor analógico a digital (ADC) –por ejemplo, cuando grabas desde tu interface–, y lo envías a tu DAW, entonces la señal de audio analógica de tu micrófono o DI se transforma en una serie de unos y ceros. Eso es lo que obtienes, una representación digital de tu audio. Para lograr eso, el ADC captura instantáneas (también conocidas como «muestras» o samples) de tu audio a una velocidad y tamaño específicos, a los que hacemos referencia como la velocidad o frecuencia de muestreo y la profundidad de bit (también conocida como resolución).

La frecuencia de muestreo determina la cantidad de muestras que el convertidor captura por unidad de tiempo (en un segundo) para digitalizar el audio, y es fundamental en términos de la respuesta en frecuencia que se obtiene. La regla general, basada en el Teorema de Nyquist, es que debes tener una frecuencia de muestreo mayor o igual a dos veces la frecuencia más alta presente en el audio que te dispones a digitalizar. De lo contrario, un cierto tipo de distorsión llamado «aliasing» puede estropear el sonido resultante tras el muestreo.

Y así las cosas, para capturar frecuencias de hasta 20kHz, que es el rango alto de audición del oído humano, la frecuencia de muestreo más baja que se usa comúnmente es de 44.1kHz (la tasa en la especificación CD-Audio Red Book). Pero en estos días, las tasas de 48kHz o superiores también son muy comunes. Aquí la clave a recordar es que cuanto mayor sea la velocidad o frecuencia de muestreo, mayor será la precisión que se consigue para reproducir el rango de frecuencias.

La profundidad de bit o resolución (también conocida como «longitud de palabra») se refiere al tamaño de cada muestra, en términos del número de unos y ceros que puede contener. Cuantifica la precisión con la que se representa la amplitud de la señal en cada momento y, por lo tanto, el rango dinámico, que en este caso se puede describir como la diferencia entre los sonidos más altos que es posible capturar y el nivel mínimo de ruido.

Cuanto mayor sea la profundidad de bit, más precisa será la descripción de la amplitud. Y cuando comparas audio de 16 y 24bit, la diferencia en la resolución resulta ser bastante sorprendente. El audio de 16bit puede representar hasta 65.536 niveles discretos de amplitud, mientras que 24bit tiene la capacidad de 16.777.216 niveles. En términos de rango dinámico, cada bit es equivalente a unos 6dB. Y de ese modo, con 16bit obtenemos 96dB (16×6), y con 24bit alcanzamos 144dB (24×6).

Distorsión de cuantización

Cuando conviertes un archivo desde una resolución de 24 a 16bit, tu software de audio digital elimina (o «trunca») los últimos 8bit y redondea los datos para ajustarlos al menor número de dígitos disponibles. Este proceso se conoce como «cuantización». Aunque es un proceso diferente al de cuantizar notas MIDI en un secuenciador, es similar en concepto. En una secuencia MIDI, cuando tomas una frase de semicorcheas y la cuantizas a corcheas, tu DAW tiene que reasignar las semicorcheas que aún no caen sobre una subdivisión de 1/8 de nota a la corchea más cercana. Así que la resolución musical se ve reducida.

MENSAJES DE NUESTROS PATROCINADORES

Cuando tu DAW o editor cuantiza la resolución al convertir el audio de 24 a 16bit (o desde 32 a 24bit, o cualquier otra reducción similar), hay muchos menos pasos disponibles para asignar los niveles de amplitud. Y como resultado, el redondeo puede causar un fenómeno llamado error de cuantización (también conocido como «distorsión de cuantización» o «distorsión de truncamiento»), y éste se manifiesta como ruido o distorsión de bajo nivel.

Tu música generalmente enmascara este resultado, pero a veces con audio a 16bit puedes escuchar errores de cuantización en pasajes tranquilos, o cuando la música hace fundidos de entrada o salida. La realidad es que es una forma de distorsión indeseable que casi nadie desea para su música. Algunos ingenieros aseguran que aunque no llegues a oír realmente la distorsión de cuantización, hará que la música suene más áspera en general.

Dithering de audio en tu rescate

Una solución ante el problema que hemos descrito consiste en hacer dithering siempre que guardes el archivo a una frecuencia de muestreo más baja. Cuando se agrega dithering al audio con distorsión de cuantización, se enmascara el problema (es un proceso conocido como «descorrelación»), haciendo que sea más aleatorio y, por tanto, más difícil de discernir para el oído. Así que en lugar de sonar áspera y enrejada, la distorsión de cuantización se convierte en un silbido analógico constante, de bajo nivel.

Otro término que verás en software y plugins que ofrecen utilidades de dithering es el «modelado de ruido» (o noise shaping). Se refiere a lo que es en esencia una ecualización para el dithering, que está diseñada para cambiar las características en frecuencia del ruido de interpolación de modo que suene en un rango menos audible para el oído.

Todos los plugins limitadores de Waves L-Series, como este L3 Multimaximizer, vienen equipados con tecnología IDR para agregar dithering
Los plugins limitadores de Waves L-Series, como este L3 Multimaximizer, vienen equipados con tecnología IDR para agregar dithering

Debido a que los limitadores suelen ser la última etapa en la cadena de masterización antes del dithering, la mayoría de los limitadores con factor de mástering incorpora utilidades para agregar dithering. Los plugins limitadores de Waves, por ejemplo, cuentan con tecnología IDR, que significa Resolución Digital Incrementada. Y eso nos permite agregar dithering para toda una variedad de profundidades de bit –es posible elegir entre dos tipos de interpolación diferentes.

Siguiendo con el ejemplo, ‘Type 1’ ha sido diseñado para eliminar cualquier distorsión de cuantización de tu audio. Se basa en ruido de dithering modificado por el ya comentado modelado de ruido o noise shaping. Desde Waves lo recomiendan para el procesamiento de 16 y 20bit. Y cuando se añade el dither de ‘Type 1’, un máster de 16bit producto de un volcado sonara en realidad como si fuera de 19bit. En otras palabras, se ganan tres bit de resolución perceptual gracias al algoritmos de interpolación IDR.

Por su parte, ‘Type 2’ agrega menos ruido a tu señal, aunque no elimina por completo la distorsión de cuantización de la forma que lo hace ‘Type 1’. Por tanto, la elección entre ambas modalidades se reduce a si deseas eliminar toda la distorsión, o deshacerte de la mayor parte de ésta agregando menos ruido.

MENSAJES DE NUESTROS PATROCINADORES

La forma del ruido cuando añades dithering

El algoritmo IDR también te permite elegir entre tres opciones de configuración de ruido para modificar cualquiera de los tipos de dithering: Éstas son ‘Moderate’, ‘Normal’ o ‘Ultra’. Waves recomienda ‘Normal’ para la mayoría de situaciones, y ‘Ultra’ sólo en el caso de la etapa final de mástering sobre un archivo de audio.

Puedes comprobar los diferentes tipos de dithering y noise shaping escuchando sus efectos durante una sección calmada de tu archivo de audio, como es el caso de un fundido de salida (fade out) o un tramo relajado que incluya alguna cola de reverberación sonando por sí sola.

En esta captura de pantalla del plugin Waves L3LL Multimaximizer, verás varias opciones de configuración del dithering con noise-shaping basado en IDR
En esta pantalla del plugin Waves L3LL Multimaximizer verás varias opciones de configuración del dithering con noise-shaping basado en IDR

Si para ti no resulta práctico escuchar las diferentes opciones, o no tienes tiempo para esto, Waves nos comenta las siguientes indicaciones: Usa ‘Type 1’ con el noise shaping ‘Normal’ para masterización de CD-Audio. O elige ‘Type 2’ con ‘Ultra’ para agregar la menor cantidad de ruido al audio con resolución de 16bit o más.

La modalidad ‘Type 2’ también admite «auto-blacking«, que no hará dithering sobre ningún pasaje silencioso del audio. Si en tu archivo hay secciones de ese tipo, elige por tanto ‘Type 2’. Y si pretendes conseguir el máximo de resolución, selecciona ‘Type 1’ con ‘Ultra’.

Tu dilema final: ¿añades dithering o no?

Cuando la adición de dithering sea un asunto de cierta confusión o incluso genere controversia, la mejor pauta de aplicación te la dará el hecho de reducir la profundidad de bit o resolución. Por tanto, si vas a pasar de 24 a 16bit, deberías echar mano del dithering. Y si pasas de 32bit en aritmética sencilla (sin coma flotante) a 24 ó 16bit, por ejemplo, también debes recurrir al dither.

Sin embargo, si te dispones a volcar tu mezcla con un CÓDEC que emplea compresión de datos, como es el caso de las codificaciones en MP3 o AAC, no será necesario para nada el dithering. Y es que ambos son formatos que introducen artefactos en la señal que no se verán remediados por el dithering.

Lo mejor que puedes hacer en esos casos, cuando codifiques audio usando CÓDECs que ocasionan pérdidas de información como los mencionados MP3 y AAC, es recurrir a la tasa de bit (bitrate) más alta que puedas y encontrar un compromiso con el tamaño de archivo requerido para tu plataforma de streaming. Aquí nos parece importante señalar que no hay que confundir el bitrate con la profundidad de bit o resolución. El primero, la tasa de bit, mide la velocidad de transmisión en streaming, y suele ser expresado en kbps (kilobit por segundo), o mbps (megabit por segundo). Cuanto mayor sea la tasa de bit, mejor será la calidad obtenida, aunque por contra, más pesado será el archivo de audio resultante.

MENSAJES DE NUESTROS PATROCINADORES

Algunos consejos para llevarte a casa respecto al dithering

Con suerte, este tutorial te habrá ayudado a desmitificar el dithering en tu trabajo de producción. Pero si aún te parece intimidante, aquí tienes pautas sencillas que debes manejar para saber cuándo y cómo debes aplicarlo:

  • Haz dithering sólo cuando renderices tu audio a una profundidad de bit más baja –aunque con salvedades como las que comentamos un poco más abajo.
  • No hagas dithering en el proceso de volcar audio a los formatos MP3, AAC, o CÓDECs similares con pérdida de datos.
  • Haz siempre dither si estás creando archivos de 16bit para un CD-Audio a partir de una mezcla de 24 ó 32bit.
  • No es necesario interpolar con dithering cuando pasas de 32bit en coma flotante a 24bit, porque esa aritmética de 32bit no tiene una mayor resolución. Pero sí debes recurrir al dither si partes de audio a 32bit en aritmética sencilla hacia cualquier resolución más baja .
  • Si estás preparando archivos de 24 ó 32bit para un servicio de mástering, huye del dithering. Y mejor deja que sea el ingeniero quien se ocupe de ello desde su experiencia.
  • Asegúrate de que el dithering sea el último paso en tu cadena de procesamiento. Y jamás insertes un procesador después de dicho proceso en tu DAW o editor de audio.
  • Intenta evitar dos pasadas de interpolación, porque su efecto será acabar con más ruido en tu audio. Dicho esto, si reduces la resolución en bit dos veces durante tu proyecto (lo cual es improbable a menos que comiences con audio de 32bit en aritmética sencilla), debes hacer dithering en cada una de esas conversiones.
  • Si te confunden las diversas opciones de dither que tu software te presenta, recurre a los valores por defecto. Y si por el contrario te sientes más ambicioso, compara los resultados eligiendo diferentes opciones de dithering y noise shaping para ver cuáles funcionan mejor sobre un determinado proyecto.

La compañía Waves crea algunos de los mejores efectos plugin del mercado. Mantente al tanto de sus últimos lanzamientos y desarrollos en su boletín de noticias. Esta adaptación al español y otras aportaciones son obra de Jalvac.