Conceptos Esenciales de Vídeo y Audio Digital: Formatos, CODECs y Propiedades
Enviado por Programa Chuletas y clasificado en Informática y Telecomunicaciones
Escrito el en español con un tamaño de 7,58 KB
Introducción a los Archivos de Vídeo y Audio Digital
Los archivos de vídeo y audio digital son fragmentos de información representados en código binario. Para ser interpretados y reproducidos, requieren una aplicación o software específico que comprenda su estructura. Estos archivos están codificados en diferentes formatos.
Presentan dos problemas principales debido a su tamaño (peso):
- Velocidad de reproducción: Archivos muy grandes pueden dificultar una reproducción fluida.
- Almacenamiento: Requieren espacio considerable, aunque la tecnología actual ofrece cada vez mayor capacidad con discos duros (HDD) y unidades de estado sólido (SSD).
Se distinguen por su extensión de archivo (por ejemplo, .mp4, .avi, .mp3), que sirve como identificación del tipo de formato. Tradicionalmente, los sistemas macOS suelen incluir QuickTime Player y los sistemas Windows, reproductores compatibles con diversos formatos.
Formatos y Extensiones Comunes
Las extensiones de archivo nos informan sobre el formato de codificación utilizado.
Extensiones Principales
- .AVI (Audio Video Interleave): Creado por Microsoft en los años 90, especialmente diseñado para el entorno Windows.
- .MOV (QuickTime Movie): Creado por Apple para su ecosistema macOS y el reproductor QuickTime.
- .MPEG (Moving Picture Experts Group): Nombre que engloba una serie de estándares de codificación creados por expertos para unificar la distribución de formatos multimedia.
- MPEG-1: Orientado principalmente a CD-ROMs (Video CD).
- MPEG-2: Utilizado ampliamente para DVDs y transmisiones de televisión digital.
Formatos Contenedores
Es importante destacar que tanto AVI como MOV son formatos contenedores. Esto significa que pueden encapsular diferentes flujos de datos, como audio, vídeo y también metadatos (información adicional como subtítulos, marcadores de capítulos, enlaces a páginas web, etc.), los cuales pueden estar codificados usando distintos CODECs.
CODECs: Compresión y Descompresión
Un CODEC (Codificador-Decodificador) es un conjunto de algoritmos implementados en software o hardware, diseñados para dos tareas fundamentales:
- Comprimir: Reducir el tamaño de los archivos de audio y vídeo (A/V) para optimizar el espacio de almacenamiento y facilitar su transmisión.
- Descomprimir: Revertir el proceso de compresión para permitir la reproducción fluida del contenido.
Necesidad de la Compresión
La compresión es esencial en el manejo de archivos multimedia. Sin ella, manipular, almacenar o transmitir vídeo y audio de alta calidad sería extremadamente difícil debido al enorme tamaño de los archivos sin comprimir. El proceso de compresión generalmente implica descartar información considerada redundante o menos perceptible para el oído o la vista humana. La compresión de vídeo, en particular, busca un equilibrio constante entre tres variables clave:
- Espacio en disco (tamaño del archivo final).
- Calidad de vídeo (fidelidad respecto al original).
- Coste computacional/hardware necesario para la codificación y, sobre todo, para la descompresión en tiempo real.
Proceso de Descompresión
La descompresión es el proceso inverso, necesario para que los archivos comprimidos puedan ser interpretados y reproducidos de forma fluida por un software o hardware reproductor adecuado.
Soportes de Distribución
Son los medios físicos o digitales donde se almacenan y distribuyen los archivos digitales. Por ejemplo, un DVD (Digital Versatile Disc) puede almacenar una cantidad determinada de vídeo, típicamente comprimido en formato MPEG-2, que proporciona alta calidad de audio y vídeo dentro de los estándares de Definición Estándar (SD - Standard Definition).
Propiedades Fundamentales del Vídeo Digital
Resolución de Imagen
Se refiere al número de píxeles que componen cada cuadro (imagen) del vídeo, usualmente expresado como ancho x alto (ej., 720x576 para PAL SD, 1920x1080 para Full HD). Las "líneas de resolución" se refieren comúnmente a las filas horizontales de píxeles (la dimensión vertical).
Frame Rate (Tasa de Cuadros)
Es la frecuencia con la que se muestran los cuadros o imágenes fijas que componen el vídeo. Se mide en cuadros por segundo (fps - frames per second). Tasas comunes son 24 fps (cine), 25 fps (PAL TV), 29.97/30 fps (NTSC TV), y 50/60 fps o más para mayor fluidez o cámara lenta.
Tipos de Escaneo: Entrelazado vs. Progresivo
Los formatos de vídeo modernos a menudo especifican la resolución vertical seguida de una letra que indica el tipo de escaneo:
- 'i' para Entrelazado (Interlaced): Ejemplos: 1080i.
- 'p' para Progresivo (Progressive): Ejemplos: 720p, 1080p.
Escaneo Entrelazado (i)
Proviene de las limitaciones de las antiguas transmisiones de TV analógica y SD. En cada ciclo de refresco de pantalla, se dibuja primero un campo (las líneas impares) y luego el siguiente campo (las líneas pares). Esto significa que nunca se visualiza un cuadro completo de forma instantánea, lo que puede generar artefactos de "peine" en movimientos rápidos.
Escaneo Progresivo (p)
Es la técnica más moderna y preferida actualmente. Muestra cada cuadro completo (todas las líneas horizontales) secuencialmente en cada ciclo de refresco. Esto resulta en una imagen percibida como más nítida, detallada y estable, especialmente beneficioso para escenas con movimiento.
Aspect Ratio (Relación de Aspecto)
Es la proporción matemática entre el ancho y el alto de la imagen del vídeo. Determina cuán ancha o cuadrada es la imagen.
- 4:3 (o 1.33:1): Relación de aspecto tradicional de la televisión SD.
- 16:9 (o 1.78:1): Relación de aspecto estándar para la alta definición (HDTV), Ultra HD y la mayoría de monitores y pantallas modernas (panorámico).
Adaptación de Formatos (Letterboxing y Pillarboxing)
Cuando la relación de aspecto del vídeo no coincide con la de la pantalla de reproducción, se aplican técnicas para evitar la distorsión:
- Letterboxing: Se añaden barras negras horizontales arriba y abajo. Ocurre típicamente al mostrar un vídeo panorámico (16:9) en una pantalla tradicional (4:3).
- Pillarboxing: Se añaden barras negras verticales a los lados. Ocurre al mostrar un vídeo tradicional (4:3) en una pantalla panorámica (16:9).
Bit Rate (Tasa de Bits)
Indica la cantidad de datos (medida en bits por segundo, bps, o más comúnmente en kbps o Mbps) que se utiliza para codificar un segundo de vídeo y/o audio. Generalmente, un bit rate más alto se traduce en:
- Mayor calidad de imagen y sonido (más detalle, menos artefactos de compresión).
- Archivos de mayor tamaño.
El bit rate puede ser constante (CBR) o variable (VBR), donde este último adapta la cantidad de bits según la complejidad de cada escena.