Imagen digital: qué es, formatos y cómo se calcula su peso

El campo de la informática que se ocupa de la creación y el manejo de imágenes digitales se denomina infografía. La infografía cubre varias áreas de conocimiento, incluyendo no sólo la representación de elementos gráficos (texto, imagen o video) sino también sus transformaciones (rotación, traslación, zoom, etc.), por medio de algoritmos.

¿Qué es una imagen digital y qué hay detrás de su visualización?

Las imágenes digitales son representaciones bidimensionales de imágenes reales constituidas por medio de una matriz numérica y que pueden ser visualizadas a través de una pantalla o soporte compatible.

La imagen se visualiza en una pantalla (también denominada monitor), que es un dispositivo periférico de salida que permite mostrar representaciones visuales. Esta información proviene del equipo, pero de forma "indirecta". De hecho, el procesador no envía la información directamente al monitor sino que procesa la información que proviene de su memoria de acceso aleatorio (RAM) y la envía a la tarjeta gráfica que convierte la información en impulsos eléctricos, que después envía al monitor.

Los monitores de los equipos son, por lo general, tubos catódicos, es decir, tubos de vidrio en los que un cañón de electrones emite electrones que son dirigidos por un campo magnético hacia la pantalla en la que se encuentran elementos fosforescentes pequeños (luminóforos), constituyendo puntos (píxeles) que emiten luz cuando los electrones los tocan.

¿Qué son los píxeles?

Una imagen digital consiste en un conjunto o matriz de puntos llamados píxeles (la palabra píxel es la abreviación de Picture Element o elemento de imagen). El píxel es el componente más pequeño de la imagen digital. Todo el conjunto de estos píxeles se encuentra en una tabla de dos dimensiones que constituye la imagen:

Como el barrido de pantalla se efectúa de izquierda a derecha y de arriba hacia abajo, es común indicar el píxel que se encuentra en el extremo superior izquierdo de la imagen con las coordenadas [0,0]. Esto significa que las direcciones de los ejes de imagen son las siguientes:

La dirección del eje X es de izquierda a derecha.
La dirección del eje Y es de arriba hacia abajo, contrario a la notación convencional de matemática, donde la dirección del eje Y es hacia arriba.

¿Qué son la definición y resolución?

El número de puntos (píxeles) que constituyen la imagen, es decir, sus "dimensiones" (el número de columnas de la imagen multiplicado por el número de filas) se conoce como definición. Una imagen de 640 píxeles de ancho y 480 píxeles de alto tiene una definición de 640 por 840 píxeles, que se representa 640 x 480.

Por otro lado, la resolución, un término muchas veces confundido con "definición", está determinada por el número de puntos por unidad de área, expresada en puntos por pulgada (DPI). Una pulgada equivale a 2,54 cm. Por lo tanto, la resolución permite establecer la relación entre el número de píxeles de una imagen y el tamaño real de su representación en un soporte físico. Entonces una resolución de 300 ppp tiene 300 columnas y 300 líneas de píxeles en una pulgada cuadrada, lo que significa 90000 píxeles en una pulgada cuadrada. La resolución de referencia de 72 dpi nos da un píxel de 1"/72 (una pulgada dividida por 72), es decir, 0,353 mm. Esto corresponde a una pica (unidad de medida tipográfica anglosajona).

¿Cuáles son los modelos de color?

Por lo tanto, una imagen está representada en una tabla bidimensional en la que una celda es un píxel. Para representar una imagen por medio del equipo, sólo es necesario crear una tabla de píxeles en la que cada celda contiene un valor. El valor almacenado en una celda se codifica en un determinado número de bits que determinan el color o la intensidad del píxel y se lo denomina profundidad de codificación (o a veces también profundidad de color). Existen varios estándares de profundidad de codificación:

Mapa de bits blanco y negro: si se almacena un bit en cada celda, se pueden definir dos colores (negro o blanco).
Mapa de bits con 16 colores o 16 niveles de gris: si se almacenan 4 bits en cada celda, se pueden definir 2 ⁴ intensidades por cada píxel, es decir, 16 grados de gris desde el negro al blanco o 16 colores diferentes.
Mapa de bits con 256 colores o 256 niveles de gris: si se almacena un byte en cada celda, se pueden definir 2 ⁴ intensidades, es decir, 256 grados de gris desde el negro al blanco o 256 colores diferentes.
Mapa de colores de paleta de colores: gracias a este método, se puede definir una paleta, o tabla de colores, con todos los colores que puede contener la imagen, para los cuales hay un índice asociado en cada caso. El número de bits reservados para la codificación de cada índice de la paleta determina el número de colores que pueden utilizarse. Por lo tanto, cuando se codifican los índices en 8 bits, se pueden definir 256 colores disponibles; es decir, cada celda de la tabla bidimensional que representa la imagen contiene un número que indica el índice del color que se utilizará. A la imagen cuyos colores estén codificados según esta técnica se la denomina imagen de color indexado.
"Colores verdaderos" o "colores reales": esta representación permite que se represente una imagen al definir cada componente (RGB, por rojo, verde y azul). Cada píxel está representado por un conjunto de tres componentes, cada uno codificado en un byte, es decir, en total 24 bits (16 millones de colores). Es posible agregar un cuarto componente, para poder agregar información relacionada con la transparencia o la textura; en ese caso cada píxel estará codificado en 32 bits.

¿Cómo se calcula el peso de una imagen?

Para calcular el peso (en bytes) de una imagen, es necesario contar el número de píxeles que contiene esa imagen, que equivale a calcular el número de celdas de la tabla, es decir, la altura de la tabla multiplicada por el ancho. Entonces el peso de la imagen equivale al número de píxeles multiplicado por la altura de cada uno de esos elementos.

A continuación se indica la fórmula para una imagen de color verdadero de 640 x 480:

Cantidad de píxeles:

640 x 480 = 307200

Peso de cada píxel:

24 bits / 8 = 3 bytes

Entonces el peso de la imagen es igual a:

307200 x 3 = 921600 bytes

Para calcular el tamaño en KB, basta con dividirlo por 1024:

921600 / 1024 = 900 KB

A continuación se indican algunos ejemplos (teniendo en cuenta que la imagen no está comprimida):

Definición de la imagen	Blanco y negro (1 bit)	256 colores (8 bits)	65000 colores (16 bits)	Color verdadero (24 bits)
320 x 200	7,8 KB	62,5 KB	125 KB	187,5 KB
640 x 480	37,5 KB	300 KB	600 KB	900 KB
800 x 600	58,6 KB	468,7 KB	937,5 KB	1,4 MB
1024 x 768	96 KB	768 KB	1,5 MB	2,3 MB

Esto muestra la cantidad de memoria de video que necesita la tarjeta gráfica según la definición de la pantalla (el número de puntos visualizados) y el número de colores. Por lo tanto, el ejemplo demuestra que se necesita un cuadro que tenga al menos 4 MB de memoria de video para lograr una resolución de 1024 x 768 con colores verdaderos.

¿Qué tipos o formatos de imágenes digitales existen?

Las imágenes digitales pueden presentarse en distintos formatos. El formato es algo así como el continente en el que se guarda la información. La elección del formato viene determinada por cómo te interese preservar la imagen: con mayor o menor pérdida de calidad, de mayor o menor peso, con capacidad para soportar transparencias, etc.

Actualmente, los formatos principales son:

BMP (bitmap, mapa de bits): formato propiedad de Microsoft y sólo se utiliza en el sistema operativo Windows, para guardar sus imágenes.
JPG: el más empleado para mandar fotografías y archivos gráficos por su bajo peso y su calidad decente.
PNG: formato de mejor calidad (y mayor peso) que JPG, empleado en programas de edición y que soporta el uso de transparencias.
TIFF: el formato de calidad óptima, empleado por ejemplo en imágenes con fines de maquetación.
GIF: el formato de imágenes digitales animadas.

¿Cuáles son las modalidades de transparencia de una imagen?

La transparencia es la característica que permite definir el nivel de opacidad de los elementos de una imagen, es decir, la posibilidad de mirar a través de una imagen los elementos gráficos que se encuentran detrás de ella.

Existen dos modalidades de transparencia:

La transparencia simple, que se aplica a imágenes indexadas y consiste en definir como transparente un color de entre los que hay en la paleta.
La transparencia de canal alfa consiste en agregar un byte que defina el nivel de transparencia (de 0 a 255) para cada píxel de la imagen. Al proceso de agregar una capa transparente a una imagen se lo denomina combinación alfa.