Compresión de Video: Técnicas y Estrategias Clave

Enviado por Chuletator online y clasificado en Informática y Telecomunicaciones

Escrito el 2 de Abril de 2025 en español con un tamaño de 3,49 KB

Codificación de Video

Conceptos Generales

El problema de la codificación de video es, básicamente, una cuestión de **supresión de redundancia** y **eliminación de información**. La señal de TV en calidad SD necesita un BW superior a 200MBps para su transmisión íntegra. Los algoritmos de compresión de video reducen esta capacidad hasta BW inferiores a 10Mbps. Los diferentes estándares de compresión de video utilizan una diversidad de algoritmos con este fin. Se puede agrupar una serie de pasos que conducirán a la obtención del **flujo de bits (bitstream)** o señal de video comprimida.

Adquisición

El ojo humano es mucho más sensible a las señales en blanco y negro que a las de color, por lo que es posible reducir la información de color de las imágenes sin pérdidas subjetivas de la calidad. Las 3 componentes de color (rojo, verde y azul) (RGB) que forman las imágenes se convierten al formato **luminancia-crominancia (YUV)**. Es posible aplicar a las componentes de color un diezmado adicional para obtener un formato con resolución espacial menor. Una vez reducida la cantidad de información original, comienza el proceso de codificación en sí.

Estrategias de Codificación

La codificación de video se implementa como la codificación de una secuencia de imágenes (eliminación de redundancia espacial).

Codificación INTER

Se utiliza **compensación de movimiento** entre planos sucesivos, eliminando la redundancia temporal. El primer paso es dividir las imágenes en bloques cuadrados de píxeles que la cubran totalmente sin solaparse entre sí.

Codificación INTRA

Para la codificación de las imágenes se utiliza una derivación de la TF en 2 dimensiones (**DCT**). Los coeficientes reales de la transformada obtenidos se convierten a enteros mediante un proceso de discretización de los mismos, codificando de manera más precisa los coeficientes de baja frecuencia y de forma más burda los de alta (aprovechando otros fenómenos de la condición humana, que no es muy sensible a variaciones espaciales rápidas de la señal).

Las imágenes P (inter) se codifican con referencia a otras ya codificadas. Se busca para cada bloque de imagen que se va a codificar, el bloque de la ya codificada que más se le parezca --> **estimación de movimiento** (de esta manera la información de un bloque de una imagen P se reduce a un vector con la posición del bloque de la imagen I que le interesa). Los bloques así obtenidos pueden ser diferentes de los originales. Se puede codificar el residuo diferencia entre 2 bloques por medio de la DCT. Si no se encuentra ningún bloque parecido al bloque previo, se codifica el bloque original mediante la TF DCT.

Codificación Aritmética

Codificación de entropía. Huffman solo es óptima si las probabilidades de los símbolos son múltiplos enteros de 1/2. El objetivo es codificar una cadena de símbolos conjuntamente.

Base: Dividir el intervalo (0,1) en segmentos proporcionales a la probabilidad de los símbolos.
Longitud Variable: Cadenas más probables dan lugar a los segmentos de mayor tamaño que contienen algún número de menor precisión.

Etapa de Postproceso

Objetivos: mejorar la calidad subjetiva de la secuencia decodificada y eliminar o atenuar al máximo las distorsiones producidas por la codificación. Efectos típicos observados son: efecto bloque, efecto mosquito y ruido granular.

Entradas relacionadas:

Etiquetas: