Megaguía para entender de una vez los formatos Ambisonics
Los formatos Ambisonics pueden ser confusos. De hecho, el propio término Ambisonic puede resultar confuso por sí mismo para los neófitos. Por ello, vamos a ver los términos asociados a los formatos Ambisonic.
El auge de los formatos Ambisonics
Ambisonics ha existido durante mucho tiempo, pero ha ganado relevancia en los últimos años gracias al interés en la realidad virtual, los videojuegos y el contenido de vídeo inmersivo de 360 grados. A su vez, este auge se ha visto acelerado desde que grandes empresas como Facebook y YouTube apostaron por este tipo de formatos. Desde entonces, hemos sido testigos de la creación de una nueva generación de herramientas que pueden decodificar contenido de formato Ambisonics a binaural. Y no solo eso, sino que también hemos podido ver el advenimiento de la tecnología de seguimiento de la cabeza como Waves NX, que han resuelto las barreras tecnológicas para consumir contenido Ambisonics adecuadamente.
Clasifiación básica de los formatos Ambisonics
Hay distintos tipos de formatos Ambisonics. Algunos de ellos tienen usan más canales para brindar una mejor localización del sonido.
- Ambisonics de primer orden: que realiza una captura esférica completa con 4 canales. La grabación se puede realizar usando un micrófono tetraédrico con 4 cápsulas poco espaciadas entre sí.
- Ambisonics de segundo orden: que usa 9 canales, creando una imagen sonora más completa.
- Ambisonics de tercer orden: que usa 16 canales, creando . Un ejemplo de micrófono Ambisonics de tercer orden sería el sistema de micrófono Zylia.
Por ejemplo, Pro Tools ofrece soporte para formatos Ambisonics hasta el tercer orden desde su versión 12.8, lanzado en 2017.
Micrófonos Ambisonics
Cuando usamos micrófonos Ambisonics, podemos encontrar distintos formatos según su procesamiento.
El Formato-A
El Formato-A es el tipo de salida típico en los micrófonos tetraédricos. Un micrófono tetraédrico es un micrófono Ambisonics de primer orden. Es decir, captura cuatro canales de audio, uno por cada cápsula. Es un formato de audio sin procesar, tal cual sale del micrófono. Por el momento no existe un estándar sobre el espacio que debe haber entre las cápsulas de los micrófonos. Por eso, el Formato A no es adecuado como formato de intercambio porque es específica para cada modelo de micrófono. Para este propósito se usa el Formato-B.
Formato-B
El formato-B de primer orden, puede llegar a confundirse con el Formato-A, pero son distintos. El Formato-B, también usa 4 canales , pero la salida sin procesar de las cápsulas se transmite a un conjunto de señales perfectamente alineadas, por lo que el espacio entre las cápsulas se compensa y el sonido se graba como si procediera de un punto virtual en el espacio. Así, los cuatro canales representan las salidas de cuatro micrófonos virtuales. Lo interesante en este formato es que manipulando los niveles relativos de estos cuatro canales se puede crear la salida de cualquier combinación de micrófonos de primer orden que apunten en cualquier dirección.
Por ejemplo, puedes elegir la orientación y el patrón polar de su micrófono después de la grabación, porque contienes la información virtual de todos los posibles patrones. De hecho, se pueden crear varios micrófonos para crear matrices estéreo virtuales y demás.
De modo que el Formato-B puede usarse como formato de intercambio entre estaciones de trabajo, aunque desafortunadamente, incluso este formato no está totalmente estandarizado.
Ambisonics, el formato por excelencia
Ambisonics es el estándar para contenido de video 360. Su popularidad se debe a que captura un campo de sonido esférico completo en tan solo cuatro canales. Si bien se puede usar para contenido envolvente, no es lo mismo que los conocidos sistemas domésticos 5.1, 7.1, etc.
Ambisonics tiene algunas ventajas sobre los formatos de sonido envolvente tradicionales:
- Es un formato de intercambio de audio sin relación con los formatos más populares y por tanto con estándares independientes. Por eso las bibliotecas de efectos de sonido de Ambisonics son populares, porque posteriormente se pueden decodificar en 5.1, 7.1, estéreo, Dolby Atmos o cualquier otra cosa. Esta bondad se debe a que disponemos de toda la información de todos los canales y puntos de vista posibles y por tanto, para crear cualquiera de estos formatos mencionados antes solo es cuestión de excluir parte de esa información.
- El formato B funciona un poco como la grabación Mid-Side. Solo que en vez de usar un micrófono cardioide y uno en figura de 8, usamos cuatro micrófonos que simulan el patrón combinado de esos dos micrófonos.
Disposición de los canales Ambisonics en Formato-B
De alguna forma, podríamos decir que el Formato-B, puede representar sus canales de la siguiente forma:
- W es un patrón polar omnidireccional, que contiene todos los sonidos en la esfera, provenientes de todas las direcciones con igual ganancia y fase.
- X es un patrón polar bidireccional en forma de 8 que apunta hacia adelante (y hacia atrás).
- Y es un patrón polar bidireccional en forma de 8 que apunta hacia la izquierda (y a la derecha).
- Z es un patrón polar bidireccional en forma de 8 apuntando hacia arriba (y abajo).
Las debilidades de los formatos Ambisonics
Una crítica, que se ha hecho a los micrófonos Ambisonics de primer orden, es que en la matriz tetraédrica de cápsulas las fuentes directamente en frente de un micrófono Ambisonics quedan fuera del eje de todas las cápsulas. Por ejemplo, esto no sucede con la técnica de grabación Mid-Side, donde (Cardioide frontal + Fig 8) porque el micrófono M está en el eje central de la imagen estéreo.
Si la grabación se hace correctamente, en realidad esta particularidad no tiene por qué favorecer los sonidos que llegan una dirección en concreto sobre cualquier otra. Además, recordemos que las matrices tetraédricas utilizan cápsulas de diafragma pequeño porque pueden colocarse lo más cerca posible entre sí para actuar como un punto de captura virtual. Además, los micrófonos de diafragma pequeño tienden a tener una mejor respuesta fuera del eje.
¿Por qué son tan caros los micrófonos Ambisonics?
Los micrófonos Ambisonics tienden a ser relativamente costosos, pero hay una razón específica para ello. Los Ambisonics usan micrófonos de condensador de diafragma pequeño o electret. Estas cápsulas suelen tener un ruido propio más alto que sus equivalentes de diafragma grande. No contentos con esto, no usamos una cápsula, sino cuatro en total. Así que el micrófono al final resulta cuatro veces más caro y tiene cuatro veces más de ruido propio. Precisamente para evitar el ruido propio se necesitan componentes de calidad para mantener el ruido a niveles aceptables, lo que aumenta aún más los costos. De ahí que los micrófonos estén siempre por encima de los 1000 euros.
El orden de los canales en el Formato-B
Como ya hemos mencionado, de todos los formatos Ambisonics, el Formato-B es un formato de intercambio estándar, pero no es tan estándar como desearíamos. Esto se debe a que hay dos Formatos-B alternativos y no son compatibles entre sí. Estos dos formatos son AmbiX y FuMa. Si bien contienen los mismos canales, el orden en el que se presentan los canales es diferente. Y además, el nivel relativo del canal W en comparación con los canales X, Y y Z también difiere. Esta diferencia de ganancia se conoce como «Estándar de normalización».
- El estándar Furse-Malham (FuMa) es un estándar más antiguo. Aún es compatible con complementos y herramientas de procesamiento actuales. El orden de los canales en este estándar es: W, X, Y, Z. En este caso, el canal W está atenuado 3 dB en relación con los otros canales.
- AmbiX es un estándar más reciente y ha sido ampliamente adoptado por plataformas como YouTube. El orden de sus canales es: W, Y, Z, X. Su normalización es SN3D, es decir, ganancia idéntica en todos los canales.
Sea cual fuere el formato que uses para tus archivos Ambisonics, es importante realizar un seguimiento de los estándares que estás utilizando. De lo contrario, los sonidos acabarán en una posición incorrecta.