Audio Digital
Comparación de audio analógico y digital
El sonido se transmite y almacena de 2 maneras:
Audio analógico: tensión positiva y negativa
Un micrófono convierte las ondas de sonido bajo presión
en cambios de tensión en un cable: la alta presión se
convierte en tensión positiva, mientras que la baja
presión lo hace en negativa. Cuando estos cambios de
tensión viajan a través de un cable de micrófono,
pueden grabarse en cinta como cambios en intensidad magnética o
en discos de vinilo como cambios en tamaño de surco. Un altavoz
funciona como un micrófono pero a la inversa: toma las
señales de tensión de una grabación de audio y
vibra para volver a crear la onda de presión.
Audio digital: ceros y unos
A diferencia de los medios de almacenamiento analógicos, como
las cintas magnéticas o los discos de vinilo, los equipos
informáticos almacenan información de audio de forma
digital como una serie de ceros y unos. En el almacenamiento digital,
la forma de onda original se desglosa en instantáneas
individuales denominadas muestras. Este proceso se conoce normalmente
como digitalización o muestreo del audio.
Para cada una de ellas los soportes de almacenamiento son distintos:
Analógico: cilindros,
discos de diferentes materiales y cintas
Digital: cintas, Cds,
DVDs, discos rígidos, etc.
Las señales analógicas se llaman así porque son
"análogas" a la forma
de la señal original. Es decir, es la representación
visual resultante
en su forma de la señal acústica original. Por el
contrario, en la
grabación digital, la onda sonora es transformada en una
sucesión de
unos y ceros en sistema binario, mediante conversores A/D
analógicos
digitales.
El audio digital se ha impuesto al analógico porque tiene
algunas
ventajas, principalmente, evita la mayor degradación del sonido
analógico y las pérdidas que se producen al generar
copias del
original. Como también posee un mayor rango dinámico de
la señal (96db
en el caso de 16bits, ya que varía según la
resolución), a diferencia
del mayor rango posible en una señal analógica (66db).
Los atributos técnicos de un archivo de sonido están
representados por
dos valores esenciales. Uno es la frecuencia de muestreo y el otro es
la profundidad de bits.
Conversión analógico-digital
La digitalización de sonido real, también llamado
muestreo (sampling), se realiza mediante los denominados ADC, o
Conversores de Analógico a Digital, circuitos que, a una
determinada frecuencia, toman "fotografías" del sonido, que
convierten en números que después son almacenados en el
ordenador.
El proceso inverso al del muestreo es la conversión de digital a
analógica, encargada a los circuitos DAC. Además de
convertir los números almacenados en el ordenador a una
señal eléctrica, se debe filtrar ésta para obtener
una señal válida. En la calidad de dichos filtros reside,
en muchas ocasiones, la calidad de sonido de una tarjeta de muestreo,
obteniendo en algunas un nivel de ruido de fondo que las hace
inútiles para usuarios exigentes.
Frecuencia de muestreo
La frecuencia de muestreo es la velocidad con que se toman las
muestras. Indica cuántas tomas o muestras se registran en un
tiempo determinado durante la captura de la onda analógica para
ser representada en un dominio digital. Se expresa en ciclos completos
por segundo; Hertz (44.1 khz – 48khz – 96 khz – 192
khz). Como ejemplo de audio digital se puede mencionar el Compact Disc
convencional que posee una frecuencia de muestreo de 44.100 ciclos por
segundo (44.1 Khz.). Cuanto más alta sea la velocidad de
muestreo, más se asemejará la forma de la onda digital a
la forma de la onda analógica original.
Para reproducir una frecuencia determinada, la velocidad de muestreo ha
de ser al menos el doble de la frecuencia. (Consulte frecuencia
Nyquist.) Por ejemplo, los CD tienen una velocidad de muestreo de
44.100 muestras por segundo, por lo que pueden reproducir frecuencias
de hasta 22.050 Hz, lo que está justo por encima del
límite de audición humana (20.000 Hz).
En la tabla siguiente se enumeran la velocidades de muestreo más
habituales del audio digital:
¿Cual es la calidad de muestreo más deseable? Es un tema
muy discutido, pero podemos decir que cuanto mayor sea la frecuencia,
podremos captar mayor cantidad frecuencias agudas y los efectos sonoros
podrán ser procesados con mayor calidad puesto que disponemos de
mayor cantidad de muestras por segundo.
Algunas personas aconsejan grabar en 48000 Hz, otras en 96000 Hz, pero
otras dicen que es mejor grabar en calidad de CD (44100 Hz) dado que al
masterizar las pistas para un CD no es necesario realizar el proceso de
dither, el cual puede ensuciar la señal.
Profundidad de bits
La profundidad de bits determina el rango dinámico o amplitud de
onda de cualquier sonido. Cuando se muestrea una onda de sonido,
se asigna a cada muestra el valor de amplitud más cercano a la
amplitud de la onda original. Una profundidad de bits más alta
proporciona más valores de amplitud posibles, lo que produce un
rango dinámico más grande, una base de ruido inferior y
mayor fidelidad.
Cada bit es una representación binaria (0-1) y cuanto mayor sea
la cantidad de bits (8-16-24-32) de un archivo sonoro, mayor
será su fidelidad de audio.
Como en el caso anterior, existen distintos enfoques con respecto a
esta medida, pero digamos que con 32 bit podremos tomar muestras de
audio de gran amplitud de volumen, pudiendo captar fielmente hasta los
detalles más mínimos de las frecuencias sonoras
más débiles, como por ejemplo ciertas frecuencias altas
de los platillos de una batería captadas por micrófonos
condensadores.
Cada uno podrá experimentar cuál de estos consejos es
válido, pero digamos que para grabar una banda de rock &
roll no sería necesario realizar las tomas en una calidad
superior a la de CD, en cambio si tomáramos una orquesta de
música clásica, podríamos pensar en grabar en
96000 Hz y en 32 bit dado que habrá sonidos mucho más
sutiles y la amplitud de volumen será mucho mayor.
Forzar 16 bit en Ardour: como JACK intentará iniciar de forma
predeterminada en 32 bit, podemos ahorrarle la exploración de
las capacidades de nuestra tarjeta de sonido forzándolo a usar
16 bit (las tarjetas más comunes sólo permiten grabar en
16 bit), pero lo más importante será que ahorraremos
espacio en disco/RAM y tiempo de procesamiento de CPU.
Formatos de archivo de audio
a) Formato sin comprimir
CDA (Compact Disc Audio) es el
formato nativo de los discos compactos, con frecuencias de muestreo de
44.1 Khz, 16 bits de cuantificación y en dos canales. Es claro
que ocupa mucho espacio, por lo que un disco compacto promedio tiene
capacidad de 74 minutos. El formato digital del sonido se encuentra
dentro de la estructura física del Track o pista.
WAV: Creado por Microsoft en
1987, viene de Wave, que significa “onda”: síntesis
de ondas de sonido real. Es el formato de audio de más calidad y
el más universal. Se ha convertido en el formato estándar
de la industria discográficas.
AIFF (Audio Interchange Format
File). Popular en sistemas Apple. Soporta hasta 44.1 Khz y 32 bits de
cuantificación.
b) Formatos de compresión con
pérdidas
Se basan en codificación perceptual para eliminar componentes de
energía que teóricamente no se escuchan.
MP3 (MPEG audio layer 3): Es el
más conocido de todos . Fue creado por Thomson Multimedia y el
Instituto Fraunhofer de Alemania en 1996. Ocultan determinados sonidos
que presumiblemente no son perceptibles por el oído humano. Su
algoritmo de compresión tiene ratios de 10:1 y 12:1 según
el bitrate que se elija, siendo 128, 160 y 192 Kbps. los más
habituales. El reducido tamaño y su aceptable calidad han
favorecido su expansión como sistema de transmisión de
música.
RA o RM (Real Audio). Creado
por Real Networks. A pesar de tener una muy buena compresión y
descompresión, generalmente su calidad no es adecuada para
aplicaciones profesionales, pero es muy usado en la distribución
de señales de audio a través de Internet en tiempo real o
en vivo, esto es, en modo de streaming.
WMA o MS Audio (Windows Media
Audio). Creado por Microsoft para competir con el MP3. AAC: (Advanced
Audio Coding) es un formato exclusivo de Apple y funciona solo con
reproductores
iPod.
OGG Vorbis es un formato que
utiliza tecnologías similares a MP3 y AAC, pero con una
diferencia importante: es completamente gratis, libre de patentes y se
ha desarrollado bajo el modelo de código abierto. Logra la misma
calidad de AAC y WMA (incluso en sonido envolvente) y es superior a
MP3. Fue desarrollado con el fin de reducir los costos de la
música legal y de los reproductores de música, pues parte
de lo que los compradores pagan se va a los desarrolladores de MP3 o
los otros formatos. Aunque es muy popular en el mundo del software
(incluso es uno de los formatos predilectos de los desarrolladores de
juegos y multimedia), es casi ignorado en el campo de los reproductores
musicales, por lo que no se ha popularizado lo suficiente.
Configurando la sessión
regresar
al menu