Métodos de Compresión y Tratamiento de Imágenes Digitales: Optimización y Conversión

Enviado por Programa Chuletas y clasificado en Informática y Telecomunicaciones

Escrito el 7 de Enero de 2025 en español con un tamaño de 9,32 KB

Métodos de Compresión

Los algoritmos de compresión sin pérdida aprovechan la redundancia estadística para representar la información sin errores. Esto es posible debido a que los datos del mundo real presentan redundancia estadística.

Una compresión con pérdida se basa en la investigación de cómo las personas perciben los datos. La compresión de imágenes JPEG funciona, en parte, "redondeando" la información que parece menos importante. La compresión con pérdida proporciona una forma de obtener la mejor fidelidad para una cantidad dada de compresión.

Los métodos de compresión sin pérdida son reversibles, de manera que los datos originales se pueden reconstruir, mientras que los métodos de compresión con pérdida aceptan la pérdida de datos con el fin de obtener una mayor compresión.

Algoritmo de Compresión sin Pérdida

Se denomina algoritmo de compresión sin pérdida al procedimiento de codificación que tiene como objetivo representar cierta cantidad de información utilizando una menor cantidad de la misma, siendo posible una reconstrucción exacta de los datos originales.

Consiste en la garantía de generar un duplicado exacto del flujo de datos de entrada después de un ciclo de compresión/expansión. El objetivo de la codificación es reducir el tamaño de la información, intentando que esta reducción no afecte al contenido. Los datos antes y después de comprimirlos son exactos en la compresión sin pérdida. Una mayor compresión solo implica más tiempo de proceso. Se utiliza para optimizar el espacio en disco de los ordenadores en las oficinas o para el mejor uso del ancho de banda en una red. Para texto y hojas de cálculo es esencial porque no se puede tolerar ni el cambio ni la pérdida de un solo bit.

Diferentes tipos de modelos: estático o basado en diccionario.

El modelo estático lee y codifica mientras utiliza la probabilidad de aparición de un carácter. Si un flujo de entrada no concuerda, la relación de compresión se degradaría, posiblemente hasta el punto de que el flujo de datos saliente fuese tan largo como el entrante.
El modelo basado en diccionario usa un código simple para reemplazar cadenas de símbolos; los modelos estáticos codifican un símbolo a la vez. Lee una entrada de datos y observa por grupos de símbolos que aparecen en el diccionario. Si una cadena concuerda, un indicador puede salir en lugar del código del símbolo.

Ejemplo de Formato de Almacenamiento sin Pérdida

Formato de Compresión ZIP

ZIP o zip se utiliza para la compresión de datos como imágenes, programas o documentos.

Para este tipo de archivos se utiliza generalmente la extensión ".zip".

Es un formato de fichero simple que comprime cada uno de los archivos de forma separada. Comprimir cada archivo independientemente del resto de archivos comprimidos permite recuperar cada uno de los ficheros sin tener que leer el resto, lo que aumenta el rendimiento. El resultado de agrupar un número grande de pequeños archivos es siempre mayor que agrupar todos los archivos y comprimirlos como si fuera uno solo. RAR permite extraer cada archivo de forma independiente sin tener que procesar el archivo desde el principio.

ZIP soporta un sistema de cifrado simétrico basado en una clave única.

Algoritmo de Compresión con Pérdida

Para la información visual y de audio, se puede tolerar la pérdida de calidad sin perder la esencia natural de los datos. Dadas las limitaciones del sistema sensorial humano, se puede ahorrar una gran cantidad de espacio mientras se produce una salida básicamente indistinguible del original. Tres aspectos importantes: velocidad de compresión, tamaño de los datos comprimidos y pérdida de calidad.

Un algoritmo de compresión con pérdida representa cierta cantidad de información utilizando una menor cantidad de la misma, siendo imposible una reconstrucción exacta de los datos originales.

Suele restringirse a información analógica que ha sido digitalizada (imágenes, audio, vídeo, etc.), donde la información puede ser "parecida" y, al mismo tiempo, ser subjetivamente la misma. Su ventaja reside en las altas razones de compresión que ofrece en contraposición a un algoritmo de compresión sin pérdida. Puede eliminar datos para reducir aún más el tamaño, con lo que se suele reducir la calidad.

En el caso de JPEG, se sacrifican en su proceso cierto número de bits que inciden poco o muy poco en el resultado final de la imagen. Se basan en el solapamiento de tonos de color iguales o casi iguales. El resultado es una importante reducción en el tamaño final del archivo sin una aparente pérdida de calidad.

En compresión de sonido, los métodos psicoacústicos se utilizan para eliminar los componentes no audibles o menos audibles de la señal de audio.

Realidad Actual de los Algoritmos de Compresión

Surgieron para reducir el tamaño de los archivos y así ocupar menos espacio y reducir el tiempo de transferencia. Se ha seguido usando estos formatos por la comodidad que representa tener varios archivos relacionados en un único contenedor. De no existir un contenedor, implicaría al usuario tener que descargarse los archivos uno a uno, mientras que gracias a estos formatos el usuario descarga un único archivo. Otra ventaja que ofrecen actualmente es la posibilidad de dividir archivos en varias partes.

Tratamiento de Imágenes y Conversión

Tras la digitalización, los documentos pueden necesitar un tratamiento de ajuste y dimensionado.

Si el destino es la conversión OCR, solo se precisa una copia a tamaño adecuado.

En láminas y libros especiales que se ofrecen en imágenes, se recomiendan tres versiones:

Una a alta resolución, para impresión a buen tamaño.
Otra a tamaño intermedio, para su visualización en una pantalla.
Y una tercera en miniatura, para una ficha de datos.

Lo mejor es digitalizar cada página una única vez con los requerimientos de la primera versión, que se guarda en un formato adecuado para la impresión, como TIFF. Las otras versiones se hacen a partir de esta, en JPEG.

Esta cantidad de archivos requiere una nomenclatura extensa, eficaz para su localización y acorde con las propuestas de normalización.

Las coberturas habituales son: p para página completa, z para doble página y d para detalle. En caso de varios detalles en la misma página, se ordenan alfabéticamente.

Las operaciones más comunes que podemos necesitar realizar son:

a. Conversión de Formatos

Proceso de transformación de datos informáticos de una representación concreta a otra, cambiando los bits de un formato a otro, para lograr la interoperabilidad de aplicaciones o sistemas diferentes. Consiste en editar una imagen y guardarla en otro formato diferente.

La conversión le ayuda a compartir documentos cuando no todos los miembros de su espacio de trabajo pueden utilizar el mismo programa. Traduce un documento desde su formato original a algo que podrán leer y editar más fácilmente.

El programa de conversión le informará en cuanto pueda de las pérdidas o cambios que puede esperar de una conversión específica.

Conceptos Básicos

Antes de que pueda efectuarse cualquier conversión de datos se debe tener en cuenta estos conceptos básicos:

Es fácil descartar información usando un ordenador, pero añadirla requiere esfuerzo.
El ordenador puede usarse para añadir información solo con base en reglas; la mayoría de adiciones que interesa a los usuarios solo puede lograrse con la ayuda de humanos.

Convertir una imagen o un fichero de sonido desde un formato comprimido con pérdida a otro sin pérdida o descomprimido solo desperdicia espacio; la imagen o sonido resultante será el mismo, con la información original perdida.

Conversión Pivote

La conversión de datos puede ser realizada directamente de un formato a otro, pero muchas aplicaciones que convierten entre múltiples formatos usan una codificación pivotal mediante la cual cualquier formato origen se convierte a su destino.

Conversión de Datos con Pérdida e Inexacta

Debe soportar las mismas características y atributos presentes en el fichero origen. La conversión de un documento de procesador de texto a texto plano implica la pérdida de información, debido a que este último no soporta atributos tales como marcar una palabra en negrita.

La conversión de datos también sufre de inexactitud cuando se convierte entre formatos que son diferentes.

b. Escalados (Scaling)

Se cambia el tamaño de una imagen sin variar su resolución. Lo normal es pasar de un tamaño grande a otro menor, lo cual no afecta a su calidad. Si el proceso es inverso, el resultado será una imagen de peor calidad, aunque de mayor tamaño. Se mide en tantos por ciento.

Este proceso produce un cambio en las dimensiones de los píxeles del mapa de bits y en el tamaño final de la imagen.

Entradas relacionadas:

Etiquetas: