El futuro de la multimedia. Técnicas de compresión de la información digital. Transformada de wavelet. Aplicaciones

Nieves Baena Martín

 

1. INTRODUCCIÓN

El futuro de la multimedia tiende hacia la Realidad Virtual, puesto que de lo que se trata es de acercarnos cada vez mas a la realidad.

Esta aglutinación de comunicaciones y aplicaciones con sonidos, vídeo, gráficos, imágenes fijas, texto, hipertexto, etc., ha surgido por la posibilidad de usar un ordenador, siendo éste un sistema capaz de manejar cualquier tipo de datos digitalizados, de forma que se trata todo ese tipo de medios de la misma forma.

Las aplicaciones de la multimedia invaden múltiples campos:

Los requisitos tecnológicos necesarios para estas aplicaciones supondrán un avance en aspectos como:

 

1.- El procesado de señales digitales: compresión, filtrado, representación gráfica, etc.

2.- Interfaces de usuario: pantallas táctiles, sensores, etc.

3.- Equipos hardware: ordenadores cada vez más potentes, sistemas de almacenamiento de gran capacidad, etc.

4.- Redes de comunicaciones: ancho de banda cada vez más elevado, adaptable a los distintos flujos de información.

 

Tras estos avances, vemos cómo cada vez se hacen más necesarias las técnicas de compresión de la información digital.

Están surgiendo nuevas formas de análisis de señal mucho más eficientes que el análisis de Fourier, siempre y cuando una señal esté dominada por un comportamiento transitorio o con discontinuidades. Se trata de la transformada de Wavelet.

 

2. INTRODUCCIÓN AL ANÁLISIS DE WAVELET. APLICACIONES

Cualquier señal puede ser representada como una superposición de formas de onda sinusoidales de unas determinadas frecuencias. Pero mientras que el análisis clásico de Fourier cubre extraordinariamente comportamientos sinusoidales que ocurren de forma natural, como los que se ven en las señales de voz, no es muy adecuado para representar señales con discontinuidades, como los bordes de las facciones en las imágenes.

Últimamente, otro poderoso concepto ha sacudido las matemáticas aplicadas y la investigación en ingeniería: el análisis de wavelet. En contraste con una sinusiode de Fourier, que oscila para siempre, una wavelet está localizada en el tiempo y dura unos cuantos ciclos. Como el análisis de Fourier, sin embargo, el análisis de Wavelet usa un algoritmo para descomponer una señal en elementos más simples.

Esta técnica ha sido aplicada en tan diversos campos como comunicaciones digitales, sensores remotos, procesado de señales biomédicas y de imágenes biomédicas, astronomía y análisis numérico. Ingenieros y científicos están usando ahora las wavelets para comprimir señales e imágenes digitales, para acelerar algoritmos científicos fundamentales, y para eliminar ruido de señales digitales.

Las wavelets vienen en muchas formas y tamaños, y nuevas formas se inventan casi diariamente.

Ahora, una transformada de Fourier representa una señal como una superposición de sinusoides con diferentes frecuencias, y los coeficientes de Fourier miden la contribución de las sinusoides a esas frecuencias. De forma similar, la transformada de wavelet representa una señal como una suma de wavelets con diferentes localizaciones y escalas. Los coeficientes de wavelet esencialmente cuantifican la fuerza de la contribución de las wavelets a esas localizaciones y escalas.

Un ejemplo es una señal de la forma de una onda de diente de sierra. La intensidad de la señal sube continuamente con el tiempo, y entonces baja abruptamente antes de comenzar otra rampa de nuevo. Esta forma simple puede ser representada como una suma de wavelets. Las wavelets de escala gruesa duran a grandes rasgos la duración de la rampa, la parte suave de subida de la onda, mientras que las wavelets de escala fina capturan el salto en la mitad. Ambas transformadas de Fourier y de wavelet nos muestran una descomposición de la señal en bloques de construcción únicos (sinusoides y wavelets). Donde difieren es en su eficiencia para un trabajo en concreto. La señal de diente de sierra, muestreada a 256 observaciones por segundo, es compactamente representada por 16 wavelets. Por otro lado, un análisis de Fourier de la misma señal de diente de sierra necesitaría 256 sinusoides completas debido a la dificultad de la técnica para representar la discontinuidad en la mitad de la señal (Bruce, 1996).

La eficiencia de las wavelets en representar señales e imágenes con discontinuidades es una clave para su utilidad con problemas como compresión de datos y eliminación de ruido. Singularidades y bordes, que son difíciles de discernir desde una transformada de Fourier, aparecen claramente en la transformada de wavelet. Por tanto, el análisis de wavelet puede ayudar a un ingeniero a identificar más rápidamente ocurrencias importantes localizadas en una imagen.

 

3. ESPARCIMIENTO Y COMPRESIÓN DE DATOS

Dicho esparcimiento tiene una aplicación práctica vital. Nos puede llevar a algoritmos con pérdidas de señales e imágenes. Con compresión con pérdidas, la idea es representar una señal de forma tan compacta y a la vez con tanta precisión como sea posible para acomodarse a las limitaciones en la transmisión o el almacenamiento. Un método popular para compresión con pérdidas es la codificación por transformadas. La señal, en lugar de ser codificada directamente para la transmisión o el almacenamiento, es transformada primero y los coeficientes de su transformada son entonces codificados. Los datos son comprimidos en la fase de codificación, pero el esparcimiento de los coeficientes de la transformada en su mayor parte determinan la eficiencia con la que pueden ser codificados.

El estándar comercial actual para compresión con pérdidas para imágenes fijas es el estándar JPEG (El Joint Photographic Experts Group fue formado por expertos de la industria para desarrollar un estándar mundial). Bajo el estándar JPEG, bloques de 8x8 elementos de la imagen (pixels) se convierten en sumas de funciones coseno después de la manipulación por la transformada coseno discreta, una transformada ampliamente usada en compresión de señales e imágenes. El estándar JPEG entonces codifica los coeficientes resultantes de la transformada coseno discreta.

Pero las transformadas de wavelet, al ser más frecuentemente esparcidas que las transformadas coseno discretas, han sido el preludio para mejores algoritmos de compresión con pérdidas con altas relaciones de compresión.

4. ACELERANDO LA COMPUTACIÓN

El análisis de wavelet ha probado ser potente en facilitar ciertos tipos de problemas computacionales. El álgebra matricial es uno de estos casos. Variadas integrales y ecuaciones diferenciales, cuando son expresadas en forma digitalizada para un ordenador, pueden ser resueltas usando el álgebra matricial. Desafortunadamente, la velocidad de estas operaciones matriciales es baja, típicamente del orden de n2 ciclos de CPU para una matriz de n x n elementos.

En 1990, la idea brillante de ver las matrices como imágenes se le ocurrió a Gregory Beylkin. Cuando la "imagen" de la matriz se manda a la transformada de wavelet, es necesariamente comprimida debido al esparcimiento de la transformada. Operaciones simples, como multiplicación de matrices, se convierten en un trabajo rápido en el "dominio wavelet" porque las operaciones pueden ser hechas directamente en los coeficientes wavelet. La transformada inversa es entonces aplicada para retornar al dominio del problema original, dando una solución aproximada a la ecuación diferencial o integral. Esta solución aproximada notablemente buena requiere sólo una fracción del esfuerzo computacional necesario para la solución exacta (Bruce, 1996).

 

5. ELIMINANDO RUIDO

Dejar a las señales e imágenes sin ruido es a menudo mucho más fácil en el dominio de wavelet que en el dominio original. Con wavelets, el ruido puede ser eliminado de un gran número de tipos de señal, incluyendo aquellas con saltos, picos y otras ocurrencias no demasiado suaves. La eliminación de ruido por wavelets es superior a las técnicas tradicionales, que eliminan el ruido por medio de filtrados paso bajo, emborronando las zonas abruptas de la señal.

El procedimiento trabaja tomando la transformada de wavelet de la señal, poniendo a cero los coeficientes por debajo de un cierto límite e invirtiendo la transformada para reconstruir la señal original menos sin el ruido. El proceso de filtrar los coeficientes es bastante parecido a mantener sólo los coeficientes más importantes en los algoritmos de compresión de datos.

 

REFERENCIAS BIBLIOGRÁFICAS

ANDREW, B.; DONOHO, D. Y HONG-YE GAO (1996): Wavelet Analysis. IEEE Spectrum.