Enciclopedia de Conocimientos Fundamentales
UNAM ˜ SIGLO XXI


regreso








8.4 IMÁGENES Y VIDEO

El video, un medio muy importante de comunicación, consiste en la grabación de imágenes. En este tema, primero se presentará una introducción sobre las imágenes digitales y, posteriormente, en la parte de animación, se enriquecerán los conceptos relacionados con este tema de estudio.

Un antiguo proverbio afirma que una imagen dice más que mil palabras. En verdad se cree que así es: una imagen posee un gran contenido de información. En ella se pueden ver la forma, colores y texturas de los objetos, así como las relaciones entre ellos. La visión es el sentido más avanzado que poseen los seres humanos. Por ende, no es de extrañar que las imágenes sean el objeto de estudio más importante de la percepción humana.

8.4.1 Imágenes digitales

Una imagen digital está compuesta por un número finito de elementos, cada uno con un lugar y valor específicos. Estos elementos de forma cuadrada son llamados pixeles (picture elements). Por ejemplo, una imagen de diferentes tonos de gris queda representada por una matriz; o sea, un arreglo rectangular de números, donde cada elemento o pixel de la imagen mantiene un valor numérico que indica el valor de intensidad o tono de gris en ese punto. Cuando se desea representar texto, solamente existen dos valores de intensidad de gris: el blanco y el negro. A este tipo de imágenes se les llama imágenes binarias. Una imagen binaria es aquella que mantiene dos valores de intensidad:0 y 1, es decir que sus intensidades sólo mantienen dos estados. Este tipo de representación es muy común en textos o símbolos donde sólo se desea indicar su silueta ausente de color. La figura 1 muestra un ejemplo de una imagen binaria, el escudo de la UNAM.

Una vez representada una escena por medio de una imagen digital, es muy simple realizar otro tipo de representaciones. Por ejemplo, la mostrada en la figura 2 (que utiliza el tipo de información de la figura 1), donde a cada pixel "negro" se le confirió una altura previamente definida; posteriormente, se colocó una malla sobre la imagen y se proyectó en perspectiva.

unam
Figura 1. Ejemplo de una imagen binaria: el escudo de la UNAM.


Concepto
En términos formales se puede definir una imagen como una función bidimensional f(x,y), donde x y y son las coordenadas cartesianas y f la amplitud de la intensidad o nivel de gris de la imagen en ese punto de coordenadas. Cuando los valores de las coordenadas y el valor de la amplitud son todos finitos, es decir, poseen cantidades discretas, se trata de una imagen digital.


unambinario
Figura 2. Otra representación de una parte de la imagen binaria mostrada en la figura 1
© Ernesto Bribiesca.


flordigital
Figura 3. Ejemplo de una imagen digital
© Ernesto Bribiesca.

La figura 3 muestra un ejemplo de imagen digital a colores, donde la combinación de los colores básicos —rojo, verde y azul— permite obtener una gran variedad. Esta imagen digital está formada por 640 × 480 pixeles, es decir, 640 elementos en cada una de las 480 líneas.

Si se observa con detenimiento la figura 3, se puede extraer una gran cantidad de información. Entre las principales características se tienen: el color, es posible distinguir claramente los diferentes colores en la imagen; la forma de cada uno de los elementos y su textura (es posible distinguir los diferentes tipos de texturas presentes); el contexto de información, esto es, las relaciones que mantienen los objetos dentro de la imagen; y, finalmente, la experiencia permite identificar la mayor parte de estos elementos. La cantidad de información que se puede extraer de una imagen es impresionante.

La figura 3 representa una planta conocida como buganvilia. A primera vista, se distinguen con facilidad las flores y las hojas de la planta; se pueden ver los diferentes colores y tonalidades del verde de las hojas; al fondo se observan algunas ramas de la planta; en las flores se distinguen con facilidad las partes de las mismas, como pistilos y polen, además de los distintos matices de color rosa de los pétalos.

En resumen, el color y la forma son fundamentales en el reconocimiento. Sin embargo, también es posible ver fácilmente las texturas de los elementos de la imagen, por ejemplo, la suave textura de las hojas. Asimismo, se pueden apreciar la iluminación y las sombras.

Las relaciones entre los diferentes elementos de una imagen son muy notorias. Una parte muy importante en todo reconocimiento es la experiencia, es decir, el conocimiento previamente acumulado, producto de experiencias anteriores. ¿Qué otras cosas se pueden decir de la planta de la figura 3?

Se puede afirmar con seguridad que se trata de una planta viva, no parece deshidratada o disecada; se ve saludable, ya que posee hojas simétricas y sus formas son armónicas; su iluminación es natural, producto de la luz solar (incluso se puede intentar adivinar a qué hora fue fotografiada); en fin, se puede apreciar su belleza y reconocer algunas de sus características, pero si esta descripción la hiciera un botánico, seguramente tendría mucho más que comentar, ya que su experiencia es distinta. Como dato adicional, la buganvilia es originaria de América del Sur y, lo que comúnmente se llaman flores, en realidad son hojas modificadas que se denominan brácteas. Las verdaderas flores son diminutas, blancas y están rodeadas por las brácteas. ¿Será posible encontrar una flor en la figura 3?


Curiosidades
La habilidad del ojo humano para distinguir colores se basa en la sensibilidad de las células retinianas a la luz. La retina tiene tres tipos de células receptoras de color o conos. El primer cono responde a lo que conocemos como violeta (o longitudes de onda de 420 nm), el segundo amarillo-verdoso (564 nm) y el tercero a verde (534 nm). Incorrectamente, estos conos son conocidos como: azul, rojo y verde, respectivamente. Se estima que el ojo humano puede distinguir 10 millones de colores. Curiosamente, el modelo de color más común es: RGB, siglas en inglés de rojo, verde y azul, para televisiones de rayos catódicos, de plasma y de cristal líquido.


Como se mencionó, un elemento de resolución es el pixel, el cual tiene forma cuadrada. Sin embargo, no es el único; existen también otros elementos de resolución: los polígonos, los hexágonos y los triángulos, por ejemplo. Los polígonos deben llenar el plano, es decir, no deben existir espacios entre ellos. La figura 5(a) muestra un objeto; en la (b) se aprecia el objeto representado por pixeles; en la (c), por hexágonos y, finalmente, en la (d), por triángulos.


platonumeros
Figura 4. Ejemplo de plato con el número 74 para la prueba de Ishihara
© Anónimo


poligonosregulares
Figura 5. Un mismo objeto representado por diferentes polígonos regulares.


Cada una de estas representaciones posee ventajas y desventajas, aunque la representación que se usa más, por lo general, es la que se realiza por medio de pixeles. No obstante, de vez en cuando aparecen en la literatura científica artículos que muestran imágenes representadas por hexágonos. Cabe señalar que este tipo de celosías es común en la naturaleza: un panal de abejas tiene una estructura formada por hexágonos para optimizar el espacio; las células retinianas del ojo humano con conos y bastones forman estructuras hexagonales.


Curiosidades
La percepción o visión es el término que utiliza la psicología para definir la habilidad de interpretar la información, en forma de luz visible, que llega al ojo.


Inicio de página