Clase 11 — Análisis y Transformación de Imágenes: Preprocesado, Filtros y Transformada de Fourier (Temas 8 y 9)
Resumen Ejecutivo
Sesión de 52 minutos que cubre los temas 8 y 9 del temario. Se abre con un repaso práctico de la Actividad 3 (OpenCV en Jupyter Notebook con ejemplo real del Pirineo Aragonés) y se avanza después por los dos temas de análisis y transformación de imágenes digitales. Los contenidos centrales son: las tres etapas del análisis (preprocesado, reducción de datos, análisis de características), las operaciones básicas y filtros espaciales, y la Transformada de Fourier como mecanismo para pasar del dominio espacial al dominio frecuencial y aplicar filtros selectivos (paso bajo, paso alto, paso banda). Se conecta todo con el formato JPEG como ejemplo de filtrado frecuencial.
Conceptos Clave
Tres etapas del análisis de imágenes digitales ⚠️ EXAMEN
flowchart LR
A[Imagen original] --> B[1. Preprocesado]
B --> C[2. Reducción de datos]
C --> D[3. Análisis de características]
D --> E[Resultado / Aplicación]
E -->|Bucle de retroalimentación| B
| Etapa | Descripción |
|---|---|
| Preprocesado | Eliminar ruido, información irrelevante y artefactos. Extraer regiones de interés. Transformaciones simples (escala de grises, brillo, recorte). |
| Reducción de datos | Reducir datos en el dominio espacial o transformarlos al dominio frecuencial. Filtrado para extraer características. |
| Análisis de características | Examinar y evaluar las características extraídas para la aplicación concreta. |
El bucle de retroalimentación entre la aplicación y el preprocesado hace que el proceso sea iterativo: se ajustan parámetros hasta obtener resultados satisfactorios.
Preprocesado ⚠️ EXAMEN
Objetivo: hacer que las etapas posteriores (segmentación, clasificación) funcionen mejor y sean más eficientes.
Operaciones típicas: - Extracción de regiones de interés (ROI). - Operaciones matemáticas básicas sobre píxeles. - Transformación del espacio de color (RGB → escala de grises, HSV, etc.). - Reducción de datos: disminuir resolución o cuantificación para ahorrar cómputo y coste de tokens en modelos de IA. - Eliminación de artefactos (p. ej., bordes negros al fotografiar por una ventana).
Ejemplo real (Francisco Javier): en el procesamiento de QR, si la librería ZBAR o ZXing no puede leer el código directamente, se realiza preprocesado (cambio de contraste, inversión de color) antes de pasarlo a OpenCV.
Modelo de filtro como base teórica ⚠️ EXAMEN
Todas las operaciones de procesamiento se pueden modelar como un filtro:
donde \(F\) es la función de transferencia. Una "señal" es cualquier función de una o varias variables independientes: imágenes, sonidos, vídeo.
Los filtros espaciales actúan sobre la imagen en conjunto mediante operaciones globales. La operación más usada es la convolución, definida como:
donde \(f\) es la imagen de entrada, \(h\) es el kernel (máscara de convolución) y \(g\) es la imagen resultante.
Transformada de Fourier ⚠️ EXAMEN
Desarrollada por Jean-Baptiste Joseph Fourier (~1800) para modelar conducción de calor. Hoy tiene aplicaciones en vibración, electrónica y procesamiento de imágenes.
Idea central: descompone una señal compleja en una suma ponderada de sinusoides (armónicos).
- Dominio espacial: la imagen representada por píxeles en una cuadrícula \((x, y)\).
- Dominio frecuencial: la imagen representada por la velocidad de cambio de los píxeles. Cada componente indica cuánto y cómo cambian los valores de gris de zona a zona.
Relación frecuencia ↔ contenido visual ⚠️ EXAMEN
| Frecuencia | Contenido visual | Ejemplo |
|---|---|---|
| Baja | Cambios suaves, uniformidad | Pared blanca |
| Alta | Cambios bruscos, bordes, detalles finos | Tablero de ajedrez |
En el espectro de Fourier, el centro representa las frecuencias bajas; las frecuencias altas se alejan del centro.
Tipos de filtros frecuenciales ⚠️ EXAMEN
| Filtro | Efecto | Uso típico |
|---|---|---|
| Paso bajo | Deja pasar frecuencias bajas, atenúa altas | Suavizado, eliminación de ruido de alta frecuencia |
| Paso alto | Deja pasar frecuencias altas, atenúa bajas | Realce de bordes y detalles |
| Paso banda | Deja pasar un rango de frecuencias | Eliminación de ruido periódico a una frecuencia concreta |
JPEG como ejemplo de filtrado frecuencial
El formato JPEG aplica la Transformada Discreta del Coseno (variante de Fourier) y descarta las frecuencias que el ojo humano no percibe, reduciendo el tamaño del archivo manteniendo calidad visual aceptable.
Desarrollo del Temario
1. Repaso Actividad 3 — demo con Jupyter Notebook
El profesor muestra un ejemplo con una imagen del pueblo de Sallent de Gállego (Pirineo Aragonés):
- Cargar y mostrar la imagen con sus dimensiones originales.
- Redimensionar (ampliar o reducir).
- Rotar (45°, 90°, el ángulo deseado).
- Cambiar perspectiva.
- Detectar bordes.
- Cambiar brillo.
Todas estas operaciones se realizan con OpenCV (cv2) y los resultados se visualizan con Matplotlib dentro del Jupyter Notebook (porque cv2.imshow no funciona en entornos Jupyter; sí funciona si se ejecuta el script Python directamente por línea de comandos).
2. Tema 8 — Análisis de imágenes digitales
Flujo detallado del proceso completo:
flowchart TD
A[Imagen adquirida] --> B{Preprocesado}
B --> C1[Segmentación en dominio espacial]
B --> C2[Transformación al dominio frecuencial]
C1 --> D[Filtrado]
C2 --> D
D --> E[Extracción de características]
E --> F[Análisis / Aplicación]
F -->|Retroalimentación| B
Preprocesado incluye: - Extracción de regiones de interés. - Operaciones matemáticas básicas. - Mejora y resaltado de características. - Transformación del espacio de color. - Reducción de datos (resolución y brillo).
El preprocesado es especialmente importante cuando se usan modelos de IA generalistas: cada token procesado tiene un coste, por lo que filtrar datos irrelevantes antes de enviarlos al modelo reduce coste y mejora precisión.
Operaciones básicas se pueden explicar desde la teoría de filtros: cada operación es una función de transferencia que convierte la señal de entrada en una señal de salida.
3. Tema 9 — Transformación de imágenes digitales
Las transformaciones de datos de imagen trasladan los datos a un espacio matemático diferente:
- Transformaciones de color: asignación uno a uno entre píxel de entrada y píxel de salida en un espacio de color diferente.
- Transformaciones de dominio: todos los píxeles de entrada contribuyen a cada valor de salida. Son las más potentes pero computacionalmente costosas.
La potencia creciente de los ordenadores y la disponibilidad de memoria hace que el uso de transformadas sea hoy factible a gran escala.
Proceso de filtrado frecuencial paso a paso
- Calcular la Transformada de Fourier de la imagen → representación en dominio frecuencial.
- Diseñar el filtro (máscara en el dominio frecuencial).
- Multiplicar la representación frecuencial por la máscara del filtro.
- Calcular la Transformada Inversa de Fourier → imagen filtrada en dominio espacial.
Filtrado paso bajo: mantiene el centro del espectro. Efecto de suavizado / eliminación de ruido de alta frecuencia.
Filtrado paso alto: mantiene la periferia del espectro. Realza bordes y detalles finos.
Filtrado paso banda: permite procesar un rango específico de frecuencias, por ejemplo para eliminar ruido periódico (vibración de maquinaria industrial) sin afectar al resto de la imagen.
Conexión con sistemas multiagente
En un sistema multiagente para procesamiento de imágenes industriales en tiempo real: - Cada agente puede especializarse en un rango de frecuencias diferente. - El procesamiento paralelo de rangos frecuenciales distintos permite escalar y responder en tiempo real mejor que un agente centralizado que procese todo el espectro secuencialmente.
4. Nota sobre los tests de campus ⚠️ EXAMEN
Los tests de los temas en el campus sí pueden incluir preguntas memorísticas (fechas, datos concretos). Las preguntas del examen final no son memorísticas, pero los tests de campus son parte del temario y pueden inspirar las preguntas tipo test del examen.
Preguntas de Autoevaluación
- Enumera y describe brevemente las tres etapas del análisis de imágenes digitales. ¿Qué papel juega el bucle de retroalimentación?
- ¿Qué es el preprocesado en el análisis de imágenes? Da tres ejemplos concretos de operaciones de preprocesado.
- ¿Por qué el preprocesado es especialmente importante cuando el sistema utiliza modelos de IA con coste por token?
- ¿Cómo se modela matemáticamente un filtro en procesamiento de imágenes? ¿Qué es la función de transferencia?
- ¿Qué es la convolución en el contexto del filtrado espacial de imágenes?
- Define la Transformada de Fourier aplicada a imágenes. ¿Qué representa el dominio frecuencial frente al dominio espacial?
- ¿Qué tipo de contenido visual corresponde a frecuencias bajas? ¿Y a frecuencias altas? Da un ejemplo de imagen para cada caso.
- Explica cómo funciona el filtro paso bajo. ¿Qué efecto produce en la imagen resultante?
- Explica cómo funciona el filtro paso alto. ¿Para qué se utiliza?
- ¿Qué es un filtro paso banda y en qué escenario industrial es especialmente útil?
- ¿Cómo funciona el formato JPEG desde el punto de vista frecuencial? ¿Qué datos descarta y por qué?
- ¿Por qué un sistema multiagente es más adecuado que uno centralizado para el filtrado frecuencial en tiempo real?
- ¿En qué se diferencia una transformación de color de una transformación de dominio?
- ¿Cuáles son los pasos para aplicar un filtro en el dominio frecuencial y recuperar la imagen filtrada?