Codificación intracampo

Enviado por Programa Chuletas y clasificado en Informática y Telecomunicaciones

Escrito el en español con un tamaño de 6,95 KB

Técnicas que aparecen en MPEG-4 parte 10


Subdivisión de MB, Múltiples referencias para cuadros P, Ordenación de MB flexible, Codificación adaptativa al campo/cuadro, Agrupamiento de slices, Ordenación de slices arbitraria, predicción intra,1/4 pel ME/MC,uso de cuadros B como referencia,cuadros B generalizados, transformación entera,codificación adaptativa al contexto(cavlc,cabac) , PROBLEMA en la subdivisión de macrobloque(imagen chico):
Hay dos problemas en el MB marcado: 1. Para poder subdividir el bloque 8x8 dentro del MB se debería haber hecho primero una subdivisión en 4 bloques de 8x8. 2. La subdivisión en si no existe como tal, se debería haber hecho según uno de los siguientes casos:dibujar 4 tipos.

FMO descripción de tipos:

TIPO 0:utiliza tiras de macrobloques que se repiten hasta llenar toda la imagen. Para reconstruir el MBAmap sólo se debe conocer la longitud de las tiras.TIPO 1: utiliza una función matemática, conocida por el codificador y el decodificador, para repartir los macrobloques. La distribución de la figura, en la que los macrobloques se distribuyen en forma de tablero de ajedrez, es muy utilizada.TIPO 2: se utiliza para marcar áreas rectangulares conocidas como áreas de interés. En este caso se guarden en los MBAmaps las coordenadas superior izquierda e inferior derecha de los rectángulos.TIPO 3-5: son tipos dinámicos que dejan crecer o encoger de forma cíclica los grupos de slices de las diferentes imágenes consecutivas. Así pues, sólo se tiene que enviar la dirección, la tasa de crecimiento y la posición en el ciclo para tener bien definidos los grupos de slices.

Explicación del proceso de estimación de movimiento a precisión de ¼ píxel:

El algoritmo de estimación de movimiento presentado es un algoritmo de búsqueda a tres pasos: PRIMER PASO: Búsqueda del bloque más parecido al MB buscado en las posiciones de píxel entero (círculos vacíos). La posición de menor error se indica con un círculo relleno. SEGUNDO PASO: Interpolación de las posiciones intermedias del bloque encontrado y sus filas y columnas envolventes mediante un filtro FIR de orden 6 tipo Wiener. Se busca en las 8 posiciones alrededor de la posición encontrada anteriormente (cuadrados vacíos), la mejor posición se indica mediante un cuadrado relleno, es el bloque encontrado a precisión de ½ píxel.TERCER PASO: Interpolación bilineal de la zona de acierto y el alrededor y búsqueda en las 8 posiciones alrededor de la posición encontrada anteriormente (triángulos vacíos), la mejor posición se indica mediante un triángulo relleno, es el bloque encontrado a precisión de ¼ píxel.

Diferencia entre parte 2 y parte 10 de MPEG-4 y codificación en parte 2:

En vez de centrarse en maximizar la compresión, se ha centrado en una interpretación semántica del contenido de la imagen, segmentándolo en objetos con significado.En mpeg-4 parte 2 se codifican los objetos de manera especial, separando la codificación de contorno, textura y movimiento.

Objeto con el que se ahorra información en determinadas escenas.¿como se llaman y como se manejan?

Este tipo de objeto se llama slice. Un slice tiene la particularidad de ser enviado una sola vez porque sirve p.Ej. Como un fondo estático al que se componen diferentes objetos.

¿que es la escabilidad?

•Se puede quitar parte del flujo binario de manera que el flujo restante forma un flujo válido que representa el contenido con menor calidadque el flujo completo original.• Flujos binarios escalablesse llaman:multi‐layer bit streams•los no escalables
: single‐layer bit streams.

Tipos de escalabilidad:

•E. Temporal: Transmite menos cuadros de lo normal(peor resolución del movimiento)• E. Espacial:Extraer una imagen más pequeña• E. De calidad (PSNR):Extraer una imagen de igual tamaño con menor calidad.

Ventajas de video escalable:

• Multidifusión (multicast):Envío de la información a múltiples destinos simultáneamente•Clientes heterogéneos:–Se ofrece simultáneamente el contenido en diferente tamaño, tasa binaria y tasa de cuadros–Una única codificación en resolución y tasa–Menor resolución o calidad descartando datos–Clientes con recursos restringidos(resolución pantalla,batería) solo necesitan decodificar parte•Protección de error diferente según importancia.

Predicción intra:

• Predicción de un MB de una imagen basada en los pixeles adyacentes al MB que ya fueron transmitidos• Objetivo: codificar la diferencia entre la predicción y el contenido real, esto implica la reducción de redundancia espacial•Modos de predicción: 4 modos para bloques de croma y MB 16x16 y 9 modos para bloques de tamaño 4x4 o 8x8•Funcionamiento:-Calcular el SAD entre el bloque actual y la predicción para los modos disponibles-Escoger el modo con menor SAD.

Múltiples referencias


P slices• Se puede utilizar más que una imagen de referencia para predecir los MB’s de un slice• Las imágenes de referencia se guardan en una lista llamada lista 0• Pueden ser imágenes pasadas o futuras (pero ya transmitidas).

B slices:

• Se puede utilizar uno o dos imágenes de referencia para cada MB y sus particiones pueden ser predichos de dos listas:lista 0 y lista 1, ponderando los valores• Pueden ser imágenes pasadas o futuras (pero ya transmitidas)•Opciones:2 pasadas,2 futuras,1 pasada + 1 futura.

Filtro antibloques:

In‐loop deblocking filter = filtrado dentro del bucle de predicción•Mejora la calidad objetiva y subjetiva de la imagen decodificada•Significantemente superior a filtrado post‐codificación• Filtrado afecta a los bordes de los bloques 4x4• Filtrado adaptivo al contenido– quita efectos de bloque– no desenfoca el contenido visual• Filtros especialmente fuertes para MB con carácterísticas muy planas, casi quitan efectos de “tiling” (azulejos).

Diferencia en codificación MPEG-2 Y MPEG4:

En MPEG-2 se utiliza la codificación de longitud variable (VLC) mediante tablas fijas y en MPEG-4/AVC:Existen dos posibilidades de codificación adaptativos al contenido de las imágenes:CAVLC(codificación de longitud variable adaptativa al contexto): – Cambia la tabla de codificación para adaptarse al contenido localizado de la imagen– Mejora de aprox. 25%sobre codificación no adaptiva (p.Ej.Huffman).CABAC(codificación aritmética binaria apatativa al contexto):– Contempla la distribución de probabilidad de la imagen entera– hasta 30% de ganancia en compresión– 10% mejora sobre CAVLC, pero más costoso que CAVLC-Reducción de la complejidad evitando multiplicaciones:sólo shifts y table look‐ups

Entradas relacionadas: