Formatos de Imagen y Vídeo: Características, Estándares y Codificación

Enviado por Chuletator online y clasificado en Informática y Telecomunicaciones

Escrito el en español con un tamaño de 7,71 KB

Formatos de Imagen: Características y Usos

Formatos Comunes: JPEG, PNG, TIFF, RAW, DNG, GIF, PSD, DPX, EXR, JPEG2000, BMP.

Formatos de Vídeo: HEVC, MPEG-1, WMV, MOV, AVCHD, MKV, H.264, AVI, MPEG-2.

Estándares (Imagen): JPEG, PDF, DNG, JPEG2000.

Estándares (Vídeo): HEVC (H.265), MPEG-4, H.264, MPEG-2.

BMP (Bitmap)

  • Desarrollado por Microsoft.
  • Ofrece alta calidad de imagen, similar a TIFF, pero sin información adicional para impresión.
  • Ideal para imágenes destinadas a visualización en pantalla (alta o normal calidad).
  • Profundidad de color: 1, 4, 8 y 24 bits por píxel (bpp).
  • Modos de color: RGB, indexado, escala de grises y mapa de bits.
  • No admite canal alfa.

PNG (Portable Network Graphics)

  • Admite modos de color: RGB, indexado, escala de grises.
  • Soporta transparencia (canal alfa: RGB y RGBA).
  • No es adecuado para impresión profesional (no admite CMYK).
  • Profundidad de color: 1, 2, 4, 8 y 16 bits por canal (hasta 64 bpp en modo RGBA).
  • Compresión sin pérdida.

TGA (Truevision Graphics Adapter)

  • Originalmente para tarjetas de video TARGA (Truevision).
  • Imágenes bitmap de cualquier tamaño.
  • Profundidad de color: 2 a 32 bits por imagen.
  • Desventaja: archivos de gran tamaño.
  • Excelente para el tratamiento del color.
  • RGB hasta 32 bits, color indexado y escala de grises.
  • Opcionalmente sin canal alfa, permitiendo elegir la profundidad de color por píxel al guardar.
  • Compresión RLE (Run-Length Encoding).

TIFF (Tagged Image File Format)

  • Desarrollado por Aldus (ahora Adobe).
  • Compresión por áreas.
  • Almacena imágenes con la máxima calidad y parámetros específicos para impresión.
  • Formato que ocupa más espacio, pero óptimo para impresión profesional.
  • Modos de color: CMYK, RGB, Lab, color indexado y escala de grises (con canal alfa).
  • Imágenes en modo mapa de bits no admiten canal alfa.
  • Compatible con Photoshop.

JPEG (Joint Photographic Experts Group)

  • Ideal para imágenes digitales y web con gran variedad de tonos (fotografías digitales, degradados).
  • No recomendado para imágenes o dibujos planos con poca variación de color (mala relación de compresión).
  • Utiliza la transformada discreta del coseno (DCT).
  • Profundidad de color: hasta 24 bits.
  • Modos de color: CMYK, RGB y escala de grises (no admite alfa).
  • Codificación: estándar, optimizado y progresivo.

JPEG2000

  • Mejora de JPEG.
  • Compresión wavelet (elimina el efecto de bloques "blocking" de la DCT en JPEG).
  • Codificación en diferentes grados según el interés (ROI - Region of Interest).
  • Recepción progresiva: previsualización en baja calidad y posterior visualización en alta calidad.
  • Escalabilidad: previsualización de la imagen en tamaño reducido y posterior decodificación a tamaño completo.
  • Estándar en cine digital (junto con DPX y OpenEXR).

RAW

  • Contiene la información directa del sensor de la cámara sin procesamiento.
  • Profundidad de color: 16 bits por canal.
  • Admite canal alfa.
  • Cada fabricante tiene su propio sistema.
  • Adobe DNG es un formato RAW universal (utilizado por Samsung, Ricoh, Leica, Hasselblad).
  • Compresión reversible (sin pérdida).

DPX (Digital Picture Exchange)

  • Originalmente Cineon de Kodak, luego convertido en estándar de intercambio (negativo digital).
  • Codifica la densidad de cada color con una respuesta logarítmica, preservando la latitud original del telecine.
  • Estándar en sistemas de postproducción y laboratorios.
  • Limitación: No soporta más de 10 bits. No es suficiente calidad para algunas películas.

Organismos de Estandarización

ISO (International Organization for Standardization)

  • Organización internacional de estándares.
  • Compuesta por organizaciones nacionales.
  • Coordina normas en acuerdo con la Organización Mundial del Comercio (OMC) para facilitar el comercio, el intercambio de información y el desarrollo tecnológico.

ITU (International Telecommunication Union)

  • Organismo intergubernamental especializado de la ONU.
  • Regula las telecomunicaciones a nivel internacional.
  • Divisiones:
    • ITU-T: Estándares de telecomunicaciones.
    • ITU-R: Estándares de radiocomunicación.
    • ITU-D: Grupo de desarrollo.

IEC (International Electrotechnical Commission)

  • Organización de normalización en los campos eléctrico, electrónico y tecnologías relacionadas.
  • Establece estándares para equipos electrónicos.
  • Comités: privados, públicos y mixtos.
  • ISO + IEC = MPEG

MPEG-2: Perfiles y Niveles

Perfiles

  • Simple: Videoconferencia con bajo retardo.
  • Principal: Radiodifusión de vídeo.
  • SNR escalable: Permite múltiples grados de calidad.
  • Espacialmente escalable: Múltiples grados de calidad y resolución espacial.
  • Alto: Incluye los perfiles anteriores y soporte para formato de croma.

Niveles

  • MP-ML (Main Profile at Main Level): Distribución.
  • 422P-ML (4:2:2 Profile at Main Level): Contribución.

MPEG-4

Parte 2:

  • SP (Simple Profile): Bajo bitrate y baja resolución (móvil).
  • ASP (Advanced Simple Profile): Mejora de SP.

Parte 10 (H.264/AVC):

  • Creación de macrobloques.
  • Predicción intra-frame.
  • Buffers de mayor calidad.
  • Escalado de imagen y compensación de estimación de movimiento.
  • Predicción de 1/4 de píxel.
  • Filtro de desbloqueo (deblocking filter).

Proceso del Codificador H.264

  1. Macrobloque de 16x16.
  2. DCT (Transformada Discreta del Coseno).
  3. Cuantificación y escalado.
  4. Compresión.
  5. Proceso inverso.
  6. Filtro de desbloqueo (en la estimación y compensación de movimiento).
  7. Selector intra-frame (3 modos de predicción intra):
    • Luminancia: Macrobloque de 16x16 (4 modos) y macrobloque de 4x4 (9 modos).
    • Color: 8x8 (4 modos).

Slices en H.264

  • Slices de altura variable formados por macrobloques.
  • Tipos: I (Intra), P (Predictive). Predicción dentro del mismo slice.
  • Nuevos tipos de slices:
    • Switch I (SI): Construido a partir de sí mismo (para zapping).
    • Switch P (SP): Necesita información de otro slice.
  • Opciones de predicción de slice:
    • A partir de un slice.
    • A partir de otros tres slices.
  • Predicción a partir de varios fotogramas:
    • Long Term Reference: Guarda en buffer.
    • Short Term Reference.

Estimación de Movimiento (Inter) en H.264

  • MPEG-2: Precisión de 1 píxel.
  • H.264: Precisión de 1/4 o 1/2 píxel.
  • Pasos para la precisión de 1/2 píxel:
    1. Evaluar la imagen.
    2. Ampliar la imagen interpolando nuevos píxeles (filtro TAP de 6 pasos, divide por 32).
  • Precisión de 1/4 de píxel: Interpolación bilineal.

Filtro de Deblocking (Desbloqueo)

Niveles y Perfiles de H.264

  • Niveles: Desde 1 hasta 6.2 (a mayor nivel, mayor resolución espacial y temporal).
  • Perfiles: CBP, BP, MP, ProHiP y Hi44PP (hasta 14 bits y norma 4:4:4).

H.265 (HEVC)

Entradas relacionadas: