logo pcm

Audio PCM

La modulación de código de pulso (PCM) es un método utilizado para representar digitalmente señales analógicas muestreadas digitalmente.

El audio PCM es la forma estándar de utilizar audio digital en ordenadores, Cds, y otras aplicaciones de audio digital, como la telefonía. En un flujo PCM, la amplitud de la señal analógica se muestrea a intervalos uniformes y cada muestra se cuantifica al valor más cercano dentro de un rango de pasos digitales.

Origen del Audio PCM

El origen del audio PCM lo podemos encontrar en las primeras comunicaciones eléctricas que comenzaron a muestrear señales para multiplexar muestras de diferentes fuentes telegráficas y transmitirlas a través de un solo cable telegráfico.

A mediados del siglo XIX, el inventor Moses G. Farmer concibió la multiplexación por división de tiempo electromecánico (TDM) para el telégrafo. Posteriormente a principios del siglo XX, el ingeniero eléctrico WM Miner, utilizó un conmutador para la multiplexación por división de tiempo de múltiples señales telegráficas, tecnología que fue posteriormente implementada para la telefonía.

El ingeniero británico Alec Reeves, desarrolló el uso de PCM para la comunicación de voz en la primera mitad del siglo XX, aunque no resultó en ninguna aplicación práctica para audio, hasta los años 60 del siglo XX, donde comenzó a utilizarse para la transmisión de llamadas telefónicas muestreadas a 8KHz y 8 bits a través del sistema T-Carrier.

Grabaciones de Audio PCM

La primera grabadora de audio PCM fue desarrollada en Japón en 1967, el dispositivo de 30 kHz y 12 bits usaba un compander similar a los reductores de ruido de DBX, para extender el rango dinámico.

Almacenaba las señales en una grabadora de cinta de video de 2 canales, ampliado a finales de los 60 a sistema estereofónico y una resolución de 13 bits a 32 kHz. Pero no fue hasta inicios de los 70 que la empresa Denon realizaron las primeras grabaciones digitales con fines comerciales utilizando el sistema de grabación de audio PCM desarrollado unos años antes en los laboratorios de NHK. También a principios de la década de los 70, Denon presentó la primera grabadora digital de 8 canales, la cual utilizaba una grabadora de video de carrete abierto, con cuatro cabezales, para registrar audio PCM de 13 bits y 47,25 kHz.

El primer álbum de pop que se grabó en digital fue “Bop till You Drop” lanzado en 1979. Utilizaba audio PCM lineal con una resolución de 16 bits y 50 kHz utilizando una grabadora de cinta digital 3M.

En 1982 con la aparición del CD Audio popularizó el audio PCM a las aplicaciones de audio de consumo. El CD utiliza una frecuencia de muestreo de 44.100 Hz y una resolución de 16 bits y almacena hasta 80 minutos de audio estéreo por disco.

El rápido desarrollo del audio PCM fue posible gracias a la adopción de este en el mundo de la telefonía y también al desarrollo del capacitador MOS (metal-óxido-semiconductor) desarrollado a principio de los 70, lo que llevó al desarrollo de chips de filtro de códec PCM.

Implementaciones Audio PCM

PCM es el método de codificación que normalmente se usa para audio digital sin comprimir.

Los discos compactos utilizan LPCM para la codificación sin pérdida de datos de audio en el estándar Red Book, conocido popularmente como CD de Audio.

En 1985 se crea el AES3 y S/PDIF como formato particular que utiliza LPCM. También los soportes de LaserDiscs con sonido digital tienen una pista LPCM en el canal digital.

En los ordenadores generalmente utilizamos PCM o LPCM a menudo, ya que es la base delos archivos estándar como el contenido en los archivos WAV o AIFF. Los datos LPCM también se pueden almacenar en otros formatos, como AU, formato de audio también sin compresión, así como otros formatos de archivo de contenedores multimedia.

El audio LPCM se definió como parte de los estándares DVD y Blu-ray. También se define como parte de varios formatos de almacenamiento de audio y video digital, como DV, AVCHD, y transmisión de audio sin comprimir como HDMI.

Tasas y Precisión del Muestreo Estándar

Las profundidades de muestra comunes para LPCM son 8, 16, 20 o 24 bits por muestra.

LPCM codifica un solo canal de sonido. La compatibilidad con audio multicanal depende del formato de archivo y se basa en la sincronización de múltiples flujos LPCM. Si bien dos canales, formato estéreo, es el formato más común, los sistemas pueden admitir hasta 8 canales de audio, como el surround 7.1 o más.

Las frecuencias de muestreo más comunes son 48 kHz , por la influencia del audio en entornos broadcast y 44,1 kHz, por influencia en el sector musical con la herencia del CD Audio. El audio en LPCM permite usar frecuencias de muestreo de 96 kHz o 192 kHz en algunos equipos, pero se han debatido los beneficios.

Limitaciones Audio PCM

El teorema de muestreo de Nyquist-Shannon muestra que los dispositivos PCM pueden operar sin introducir distorsiones dentro de sus bandas de frecuencia diseñadas si proporcionan una frecuencia de muestreo de al menos el doble de la frecuencia más alta contenida en la señal de entrada.

Las principales limitaciones del sistema que deterioran la perfecta correlación con la señal analógica original serían:

  • Elegir un valor discreto que esté cerca pero no exactamente al nivel de la señal analógica para cada muestra conduce a un error de cuantificación.
  • Entre muestras no se realiza ninguna medición de la señal.  El teorema de muestreo garantiza la representación no ambigua y la recuperación de la señal solo si no tiene energía en la frecuencia fs /2 o superior (la mitad de la frecuencia de muestreo, conocida como frecuencia de Nyquist. Las frecuencias más altas no se representarán o recuperarán correctamente y agregarán distorsión de alias a la señal por debajo de la frecuencia de Nyquist.
  • Como las muestras dependen del tiempo, se requiere un reloj preciso para una reproducción precisa. Si el reloj de codificación o decodificación no es estable, estas imperfecciones afectarán directamente la calidad de salida del dispositivo.

Procesamiento y Codificación

Algunas formas de PCM combinan el procesamiento de señales con la codificación. Las versiones anteriores de estos sistemas aplicaban el procesamiento en el dominio analógico como parte del proceso de analógico a digital. Las implementaciones más nuevas lo hacen en el dominio digital, basadas en transformadas. Estas técnicas simples se han vuelto obsoletas en gran medida debido a las modernas técnicas de compresión de audio, como la codificación de transformada de coseno discreta modificada (MDCT).

PCM lineal (LPCM) es PCM con cuantificación lineal.  

PCM diferencial (DPCM) codifica los valores de PCM como diferencias entre el valor actual y el predicho. Un algoritmo predice la siguiente muestra en función de las muestras anteriores y el codificador almacena solo la diferencia entre esta predicción y el valor real. Si la predicción es razonable, se pueden usar menos bits para representar la misma información. Para audio, este tipo de codificación reduce la cantidad de bits requeridos por muestra en aproximadamente un 25 % en comparación con PCM.

La modulación de código de pulso diferencial adaptable (ADPCM) es una variante de DPCM que varía el tamaño del paso de cuantificación, para permitir una mayor reducción del ancho de banda requerido para una relación señal-ruido dada.

La modulación delta es una forma de DPCM que utiliza un bit por muestra para indicar si la señal aumenta o disminuye en comparación con la muestra anterior.

Se han desarrollado varios formatos de codificación de audio y códecs para lograr una mayor compresión. Algunas de estas técnicas han sido estandarizadas y patentadas. Las técnicas de compresión avanzadas, como la transformada de coseno discreta modificada (MDCT) y la codificación predictiva lineal (LPC), ahora se utilizan ampliamente en teléfonos móviles , voz sobre IP (VoIP) y medios de transmisión.

Este es un extracto de capítulo contenido en el curso de

Técnico de Sonido y Producción Musical

Curso Producción Musical

Gracias por tu lectura

RF

WhatsApp chat