Procesamiento del Sonido: De la Señal Analógica a la Codificación Digital y Códecs de Audio
Enviado por Chuletator online y clasificado en Informática y Telecomunicaciones
Escrito el en español con un tamaño de 4,68 KB
El Sonido como Señal Analógica: Amplitud, Frecuencia y Tiempo
El sonido se puede representar como una señal analógica que varía continuamente en el tiempo. En un gráfico, el eje horizontal (tiempo) muestra el transcurso temporal, mientras que el eje vertical (amplitud) representa los valores que puede tomar la señal.
Una señal es un medio por el cual se transmite información. Una señal analógica es aquella que toma un valor determinado para cada instante de tiempo (por ejemplo, un valor para los 2 segundos, otro para 2.000001 segundos, otro para 2.000002 segundos, y así sucesivamente para todos los infinitos instantes entre estos puntos).
Señal Sinusoidal
Una señal sinusoidal (con forma de seno o coseno) se caracteriza por tres parámetros fundamentales:
- Duración: Indica cuánto tiempo dura la señal. Por ejemplo, el sonido correspondiente a la Ilustración 2 dura 0,030 segundos, y el de la tercera ilustración, 0,020 segundos.
- Amplitud: Representa el valor máximo y mínimo que alcanza la señal. La amplitud de un sonido está directamente relacionada con su volumen. En nuestros ejemplos, la primera señal tendrá un volumen mayor que la segunda.
- Frecuencia: Describe la rapidez o lentitud con la que varía la señal. El tiempo que tarda la señal en comenzar a repetirse se denomina periodo (representado por T y medido en segundos). Existe una relación inversa entre el periodo y la frecuencia: la frecuencia es el inverso del periodo (f = 1/T).
Codificación Digital del Sonido
Pero, ¿cómo se guarda un sonido como este en el ordenador? El ordenador solo puede almacenar información digital, es decir, en forma de unos y ceros. Para lograrlo, digitalizamos la señal analógica en tres pasos:
- Muestreo: Tomamos muestras de la señal analógica a intervalos muy pequeños de tiempo.
- Cuantificación: Asignamos un valor numérico a cada una de esas muestras.
- Codificación: Asignamos un código binario a cada uno de esos valores cuantificados.
Reconstrucción del Sonido Digital
Nuestro oído no entiende de unos y ceros; lo que percibe son señales analógicas. Para la reproducción, realizamos la operación inversa:
- A partir de los unos y ceros, reconstruimos los valores originales (por ejemplo, del 0 al 7).
- A los valores binarios se les asigna su correspondiente amplitud analógica (por ejemplo, al 7 el máximo valor de la señal producida, al 6 un valor ligeramente menor, y así sucesivamente hasta el 0, al que se le asigna el menor valor posible).
- Reconstruimos una señal analógica, interpolando los valores resultantes del punto anterior.
¿Te das cuenta de que esta nueva señal analógica no será idéntica a la señal original? Se parecerá, pero presentará pequeños saltos o discontinuidades.
Para mitigar esta pérdida de fidelidad y mejorar la calidad del sonido digital, se recomienda:
- Tomar muchas más muestras por segundo (aumentar la frecuencia de muestreo).
- Asignar a cada muestra un mayor rango de valores (aumentar la resolución de cuantificación).
- Y, por lo tanto, codificar cada muestra con más bits.
Codificación RAW y Códecs de Audio
Cuando el sonido digitalizado se graba en el ordenador tal cual, sin aplicar compresión, se denomina codificación RAW.
Los códecs de audio aplican algoritmos que aprovechan características del sonido (como la redundancia de la información o las limitaciones perceptivas del oído humano, que no detecta sonidos muy graves ni muy agudos) para reducir el número de bits necesarios en su codificación.
Las formas más habituales de compresión de audio son:
Codificación WAV
Comprime la información sin eliminar datos de la señal original (compresión sin pérdida). Genera archivos de audio con extensión .wav.
Codificación MP3
Comprime y produce pérdidas en la información (compresión con pérdida), con el objetivo de reducir significativamente el tamaño del archivo. Los archivos de audio resultantes tienen extensión .mp3.
Codificación OGG
Al igual que el MP3, comprime y produce pérdidas en la información. Genera archivos de audio con extensión .ogg. Es considerado de mayor calidad que la codificación MP3 y, además, es un códec de código abierto, lo que permite a la comunidad mejorarlo y contribuir a su desarrollo.