Sistemas de Televisión Digital: PAL, NTSC, Digitalización, Compresión y Flujos MPEG2
Enviado por Chuletator online y clasificado en Informática y Telecomunicaciones
Escrito el en español con un tamaño de 8,29 KB
Sistemas de Televisión Analógica: PAL y NTSC
PAL: Línea de fase alterada, mejora a NTSC. Definida en BT470. Modulación en cuadratura con portadora suprimida de las componentes de color B-Y y R-Y. Es un sistema entrelazado, se exploran las líneas impares y luego las pares.
NTSC: Primer sistema de TV simultáneo que transmite las dos señales de color de forma simultánea usando señales I y Q. Compatibilidad con emisiones en ByN.
Digitalización de Video
Las señales digitales suponen ventajas desde el punto de vista técnico y digital:
- Mayor protección de señal de audio y video.
- Posibilidad de incluir imágenes más nítidas y con más calidad de audio.
- Emisiones en panorámico (16:9).
- Aprovechamiento del espectro radioeléctrico.
- Muestreo, cuantificación, codificación.
Elección de Señales a Digitalizar
- Video compuesto: Luminancia y crominancia están mezcladas; diferencias para PAL, NTSC, SECAM.
- Componentes RGB: Se digitaliza con altas frecuencias de muestreo.
- Luminancia y crominancia de color: El ojo humano es muy sensible a la luminancia (mayor definición) y menos a la crominancia (menor precisión).
Elección de Frecuencia de Muestreo
Existen dos técnicas:
- Muestreo ortogonal intercalado: El número de muestras por línea no es entero; la frecuencia de muestreo es la frecuencia de línea multiplicada por un factor (n+0,5).
- Muestreo estático ortogonal: Se muestrean los mismos puntos; en cada línea un número entero de muestras; la frecuencia de muestreo ha de ser múltiplo de la frecuencia de línea. Se elige este tipo de muestreo por simplicidad, aunque como problema tenemos que la frecuencia de muestreo tiene que ser el mínimo común múltiplo entre NTSC y PAL, es decir, múltiplo de 2.25MHz.
Cuantificación
La señal es discreta en el tiempo tras el muestreo. El margen de variación se divide en escalones cuánticos o niveles de decisión. Es imposible recuperar la señal, esto da error de cuantificación, que en el peor caso es la mitad del valor del escalón cuántico. Al cuantificar somos capaces de eliminar determinadas componentes frecuenciales.
Cuantificación de Luminancia
Valores entre 0 y 1, 8 bits para codificar, 256 valores. No se trabaja con todos, el 16 es el valor 0, el 235 es el 1, 0 y 255 son de sincronización.
Cuantificación de Crominancia
Valores entre -0.5 y 0.5, número de escalones impar, 0 y 255 sincronización, 16 -> A=0.5, 128 -> A=0, 240 -> A=0.5.
Compresión de Video
Ancho de Banda (AB): La frecuencia de corte del filtro es al menos la mitad del flujo binario de la misma, por lo que es necesario comprimir para transmitir.
Compresión Espacial MPEG2
Finalidad: eliminar información redundante, manteniendo la calidad y disminuyendo el ancho de banda.
- Compresión espacial: Utilizando píxeles que son iguales o muy parecidos dentro del mismo cuadro.
- Elimina redundancia.
- Elimina información no perceptible.
- Compresión temporal: Ahorra espacio con píxeles que no cambian en imágenes sucesivas.
- Eliminación de información no visible y redundante: Se elimina información de color de alta frecuencia. Dividimos la imagen en bloques (8x8) y macrobloques (16x16) eliminando información que no cambia dentro del mismo cuadro.
Entramado de la Imagen
El número de píxeles para Y (luminancia), UV (crominancia) dependerá del formato de croma.
- Formato 4:4:4: Cada píxel tiene una muestra de Y, una de U y otra de V, y 4 macrobloques por cada muestra.
- Formato 4:2:2: Sobre cada línea se desprecian la mitad de muestras de croma y todas son tratadas por igual. En sentido vertical la crominancia tiene las mismas dimensiones que la luminancia y en sentido horizontal la crominancia es la mitad que la luminancia. Tendremos macrobloques (4Y, 2U, 2V).
- Formato 4:2:0: En cada línea se desprecian la mitad de las muestras de croma y en vertical 1 de cada 2 muestras. En sentido vertical la crominancia es la mitad que la luminancia, en sentido horizontal igual. Los macrobloques serán 4Y, 1U, 1V.
Compresión Temporal
Elimina información que se repite en imágenes sucesivas. Los bloques y macrobloques que no cambian no se vuelven a codificar. 25 imágenes/seg con variaciones mínimas.
- DPCM: Codificación de señal que utiliza como línea de base la modulación por impulsos codificados (PCM), añade algunas funcionalidades. Porciones de imágenes que cambian de posición (compensación de movimiento), porciones de la imagen que no existían (codificación intra MB).
- DPCM aplicado a imágenes en movimiento: Al muestrear y digitalizar se forman pulsos espaciados a intervalos equidistantes (PCM). Solo se transmiten las diferencias. Se intercalan muestras completas entre muestras diferenciales.
- Estimación de movimiento: Los macrobloques o partes pueden haberse desplazado, predicción del desplazamiento, block matching (algoritmo utilizado en la estimación de movimiento) en un área determinada para encontrar información que encaja con la del macrobloque actual.
Agrupación de Imágenes: El GOP
Las frames se agrupan en GOP (Group of Pictures). Hay imágenes I, P, B. Se inserta una referencia (imagen I) cada cierto tiempo, la distancia entre ellas marca el tamaño del GOP.
- Frames I (Intra): Codificadas sin referencia de otras frames, transmiten una imagen completa, sin vectores de movimiento, no necesitan información adicional para decodificar, transmitidas cada 12-15 frames.
- Frames P (Predictivas): Codificadas a partir de frames anteriores I o P, envían vectores de movimiento y macrobloques que no tenían referencia anterior, cantidad de información: 1/2 de frame I.
- Frames B (Bidireccionales): Codificadas utilizando imágenes pasadas o futuras, transmiten vectores de movimiento y macrobloques sin referencia, son las más frecuentes en la agrupación de frames (GOP).
Flujos MPEG2
Elementary Streams (ES)
Trama formada por los datos de un único componente: audio, video o datos. Son la unidad básica de trama MPEG2, no aptas para transmisión, es necesario incluir información de la estructura de la información contenida en la trama.
- Sequence Header: Proporciona información de la secuencia de video codificada, relación de aspecto 16:9 o 4:3, bitrate de la secuencia: bits/seg, 25 imágenes/seg.
- Contenido de la secuencia (SEQUENCE): Es donde se introducen los GOPs headers y el contenido de cada GOP.
- Frame Header: Especifica referencias temporales, tipos de frame I, B, P, delay VBV, códigos de inicio, estructura del frame.
- Contenido de los frames: Cada frame contiene: cabecera de slices, macrobloques (localización del macro, tipo, escala de cuantificación, vectores de movimiento, patrón de codificación de bloque, bloques).
Program Streams (PS)
Trama que incluye PES (Packetized Elementary Streams) de video y audio para formar un programa, todos los ES comparten una misma base de tiempos: timestamps, adecuados para transmisión en canales sin errores (error-free), paquetes con longitud variable.
Transport Streams (TS)
Resultado de combinar 1 o más programas, con diferentes bases de tiempos, en un solo flujo. Los PES que forman un programa (servicio) comparten la misma base de tiempos. La base de tiempos de los servicios definida por los valores de posiciones de los PCR (Program Clock Reference), para cada programa el STC (System Time Clock), extraído del PCR, tiene una relación exacta con las frecuencias de muestreo de video y audio. NO debe variar, paquetes de longitud fija de 188 bytes.