Procesamiento de imágenes
En el procesamiento digital de imágenes se distinguen dos niveles principales de manera general:
- Procesamiento de imágenes a bajo nivel
• Muy poco uso de conocimiento respecto al contenido de las imágenes.
• Comúnmente se reconoce una secuencia de cuatro para el procesamiento a bajo nivel: adquisición de la imagen, pre-procesamiento, segmentación de la imagen, descripción y clasificación de objetos.
- Entendimiento de imágenes a alto nivel
• Existe la capacidad de realizar toma de decisiones respecto al contenido de las imágenes.
El procesamiento de imágenes está dado por un conjunto de operaciones llevadas a cabo sobre las imágenes a fin de realizar mediciones cuantitativas para poder describirlas; es decir, extraer ciertas características que permitan mejorar, perfeccionar o detallar la imagen .
Una característica es un atributo usado para hacer decisiones respecto a objetos en la imagen. Algunos atributos son naturales y se definen mediante la apariencia visual de la imagen, en tanto otros, los artificiales, son el resultado de operaciones realizadas a la imagen .
Los procedimientos aplicados para el procesamiento de imágenes están orientados a las aplicaciones.
Adaptación de [Starostenko, 2002].
Las herramientas para la adquisición de imágenes transforman la imagen visual de un objeto físico y sus características intrínsecas en un conjunto de datos digitalizados, usados para procesarla.
En el procesamiento digital de imágenes, existen diversas aplicaciones y problemas:
- Representación
- Transformación
- Modelado
- Restauración
- Reconstrucción
- Análisis
- Compresión de datos
Para propósitos de este trabajo, son las áreas de restauración y análisis donde se presentan las principales herramientas de uso básico: aplicación de filtros para la eliminación de ruido (restauración), detección de esquinas, bordes, líneas, y puntos (análisis), para la detección de características.
Para propósitos de este trabajo, son las áreas de restauración y análisis donde se presentan las principales herramientas de uso básico: aplicación de filtros para la eliminación de ruido (restauración), detección de esquinas, bordes, líneas, y puntos (análisis), para la detección de características.
Filtros para la eliminación de ruido en las imágenes
Se define como ruido cualquier entidad en las imágenes, datos o resultados intermedios que no son interesantes para la computación que se pretende llevar a cabo. Para realizar el procesamiento en este sistema, se considera como ruido en las imágenes electrocardiográficas un fondo con cuadriculado, así como cualquier otro píxel ajeno a la curva del electrocardiograma que pueda presentarse en la imagen. Para los fines de este documento solamente se hará mención de los filtros más relevantes considerados como factibles a aplicar en el procesamiento de las imágenes electrocardiográficas.
Se define como ruido cualquier entidad en las imágenes, datos o resultados intermedios que no son interesantes para la computación que se pretende llevar a cabo. Para realizar el procesamiento en este sistema, se considera como ruido en las imágenes electrocardiográficas un fondo con cuadriculado, así como cualquier otro píxel ajeno a la curva del electrocardiograma que pueda presentarse en la imagen. Para los fines de este documento solamente se hará mención de los filtros más relevantes considerados como factibles a aplicar en el procesamiento de las imágenes electrocardiográficas.
Las técnicas de filtraje son transformaciones de la imagen píxel a píxel, que no dependen solamente del nivel de gris de un determinado píxel, sino también del valor de los niveles de gris de los píxeles vecinos en la imagen original. El proceso de filtraje se realiza utilizando matrices denominadas máscaras, que son aplicadas sobre la imagen. Los filtros sirven para suavizar o realzar detalles de la imagen, o inclusive minimizar efectos de ruido .
Filtro gaussiano : Este filtro implementa máscaras que intentan imitar la forma de una gaussiana: G(x,y) = e - (x + y)² / 2σ², donde x, y son las coordenadas de la imagen y sigma una desviación estándar de la probabilidad de distribución asociada
La desviación estándar sigma es el único parámetro del filtro gaussiano y es proporcional
Los píxeles más lejanos del centro del operador tienen menor influencia y los píxeles más allá de tres valores de sigma a partir del centro tienen una influencia insignificante
Este filtro tiene el inconveniente de que, además de remover el ruido, empaña la imagen ocasionando pérdida de los detalles más finos .
El filtro gaussiano es comúnmente utilizado en aplicaciones de detección de bordes y análisis de escala espacial.
Filtro mediana (rango de vecindades) : El objetivo del filtro mediana es reducir el empañamiento de los bordes. Este filtro reemplaza el píxel actualmente analizado en la imagen por la mediana del brillo con respecto a los vecinos más cercanos. Este filtro tiene la ventaja de no ser afectado por píxeles individuales ruidosos.
Las principales desventajas del filtro mediana son que su desempeño disminuye cuando el número de píxeles con ruido es mayor a la mitad del número total de píxeles en la vecindad y tiene el inconveniente frente a los filtros lineales de ser más lento .
Filtro de suavizado direccional (preservación de bordes)
La eliminación de ruido mediante suavizado distorsiona la información con respecto a los bordes.
Filtro de suavizado conservador
Si la intensidad del píxel central cae dentro del rango de sus vecinos no se realiza cambio alguno, por el contrario, si la intensidad del píxel central es mayor que el valor máximo, el píxel central toma el valor del máximo. Si la intensidad del píxel central es menor que el valor mínimo, dicho valor es asignado al píxel central.
Realce de contraste
La técnica de realce de contraste tiene como objetivo mejorar la calidad de las imágenes bajo ciertos criterios subjetivos del ojo humano. La manipulación de contraste consiste en una transferencia radiométrica en cada píxel, con el objetivo de aumentar la discriminación visual entre los objetos presentes en la imagen.
Filtro paso bajo
El filtro paso bajo es un tipo de filtro de suavizado empleado para remover ruido de alta frecuencia espacial en una imagen digital.
La reducción del ruido mediante el filtro de paso bajo se lleva a cabo mediante una cancelación de las variaciones más rápidas entre píxel y píxel. El ruido aparece de manera aleatoria a manera de puntos en la imagen, usualmente con valores bastante distintos a los vecinos más cercanos. El efecto visual de un filtro paso bajo es el suavizado de la imagen y reducción del número de niveles de gris de la escena.El suavizado tiende a minimizar ruidos y origina una imagen menos nítida, con niveles de gris más difuminados .
Filtro paso alto
De manera general, el filtro paso alto opera de la misma manera que el filtro paso bajo, mediante el análisis de los valores de cada píxel y cambiando estos de acuerdo a los valores de los píxeles vecinos. El efecto en este filtro es, sin embargo, el opuesto. En vez de obtener un suavizado de la imagen, el filtro paso alto realza detalles de la imagen,. Desafortunadamente, esto tiende también a enfatizar en muchas ocasiones el ruido existente en la imagen. Por ello, el uso de este filtro debe reservarse preferentemente a imágenes con muy poco ruido.
Filtro SUSAN (Smallest Univalue Segment Assimilating Nucleus)
El algoritmo SUSAN para la eliminación de ruido preserva la estructura de la imagen alisando únicamente sobre los píxeles que se encuentran dentro de la región del píxel analizado (píxel central) tomando un excedente del promedio de los píxeles en la localidad que cae dentro del USAN (Univalue Segment Assimilating Nucleus), siendo este un núcleo circular de píxeles utilizado para el cálculo matemático del nuevo valor del píxel central].
Operadores para la detección de bordes
La detección de esquinas y líneas se basa en los operadores de detección de bordes, mismos que, mediante el cálculo de primeras y segundas derivadas (figura 3.4) permiten determinar puntos de principal importancia para poder realizar las mediciones necesarias.
En el análisis de objetos dentro de las imágenes resulta esencial poder distinguir entre el objeto de interés y el resto de la imagen. Las técnicas utilizadas para determinar los objetos de interés son conocidas como técnicas de segmentación.
Existe una gran variedad de métodos para la detección de bordes, mismos que se basan en información con respecto a los límites de una imagen. Los métodos de detección .
de bordes utilizan para sus fines diversos operadores que marcan puntos de acuerdo a discontinuidades en los niveles de gris, los colores o las texturas.
Sin embargo, el objetivo de un algoritmo de detección de bordes es obtener imágenes cuya salida muestre píxeles de mayor intensidad en los valores que detecten transiciones cercanas. Los bordes son encontrados en zonas de la imagen donde el nivel de intensidad fluctúa bruscamente.
Sin embargo, el objetivo de un algoritmo de detección de bordes es obtener imágenes cuya salida muestre píxeles de mayor intensidad en los valores que detecten transiciones cercanas. Los bordes son encontrados en zonas de la imagen donde el nivel de intensidad fluctúa bruscamente.
Para poder detectar los bordes de los objetos debemos detectar aquellos puntos de borde que los forman. Así, un punto de borde puede ser visto como un punto en una imagen donde se produce una discontinuidad en el gradiente.Un buen proceso de detección de bordes facilita la elaboración de fronteras de objetos, con lo que el proceso de reconocimiento de objetos se simplifica.
Algunos de los algoritmos de detección de bordes más comunes son los siguientes:
- Técnicas basadas en el gradiente:
o Operador de Roberts
o Operador de Sobel
o Operador de Prewitt
o Operador Isotrópico (u operador de Frei-Chen)
- Operadores basados en cruces por cero:
o Operador de Marr-Hildreth
o Detector de Canny
Los operadores basados en el gradiente asumen que los bordes de una imagen son píxeles con un alto gradiente. Un rápido índice de cambio de intensidad en alguna dirección dada por el ángulo del vector gradiente puede observarse en los píxeles de los bordes. En el píxel, la intensidad cambia de 0 a 255 en dirección del gradiente.
calculamos el gradiente en regiones uniformes obtendremos un vector de valor 0, lo que significa que no hay píxeles de borde .
Un píxel de borde se describe mediante dos características importantes:
1. Intensidad del borde, que es igual a la magnitud del gradiente.
2. Dirección del borde, que es igual al ángulo del gradiente.
El gradiente se estima por medio del uso de operadores.
Gradiente de un píxel de borde
Gradiente de un píxel de borde
Operador de Sobel
El operador de Sobel es la magnitud del gradiente, calculada mediante:
M√ sx² + sy²
donde las derivadas parciales son calculadas por:
sx = (a2 + ca3 +a4) – (a0 + ca7 +a6)
sy = (a6 + ca5 + a4) – (a0 + ca1 + a2)
Operador Isotrópico El operador de Prewitt proporciona una buena detección para bordes verticales y horizontales, mientras que el operador de Sobel es mejor en la detección de bordes diagonales.
Animación por Computadora
La animación es la simulación de un movimiento, creada por la muestra de una
Serie de imágenes o cuadros. Un ejemplo sencillo de esto son las caricaturas, que
Pertenecen a la animación tradicional. Con el paso de los años, la animación de imágenes he evolucionado de forma considerable.
La animación por computadora se puede definir como un formato de presentación
de información digital en movimiento a través de una secuencia de imágenes o cuadros
creadas o generadas por la computadora se utiliza principalmente en videojuegos y
películas.
El video toma el movimiento continuo y lo descompone en cuadros, la animación parte varias imágenes estáticas y las une para crear la ilusión de un movimiento continuo.
Características de la Animación 3D
Una característica importante de la animación por computadora es que nos permite
crear escenas “realmente” tridimensionales.
Las Aventuras de Andre y Wally B.
La computadora no es enemiga de la animación tradicional.
Técnicas de animación
Algunas técnicas que se utilizan en la animación tradicional son la animación en
acetatos (cel animation), la animación basada en cuadros (flipbook animation) y la
animación en sprite .
Animación Basada en Cuadros
La animación basada en cuadros es una de las más utilizadas.
Es posible formar bibliotecas de movimientos de cada parte del cuerpo de la animación para de esta forma combinarlas y hacer animaciones diferentes.
Animación Basada en Sprites
Sobre la animación en Sprites, esta se refiere a animaciones de objetos sobre fondos
estáticos, es decir, lo que cambia son los personajes. Esta técnica es aplicada en los video juegos. Con el paso del tiempo, se han creado nuevas técnicas como key framing, rotoscopiado, motion control y wavelets.
Key Framming
El key framing se refiere a establecer posiciones en puntos específicos de tiempo en
una animación y la parte intermedia la obtiene la computadora por medio de interpolación matemática. Es necesario hacer un key frame para cada control en cada nivel de la jerarquía del modelo.
Rotoscopiado
El Rotoscopiado consiste en una forma más elaborada de key framing.
Motion Control
La técnica de Motion control es muy utilizada actualmente, sobre todo en sets
virtuales y en el cine. Consiste en obtener posiciones clave de manera automática a partir de un actor real por medio de dispositivos que se conectan a su cuerpo. El primer modelo importante utilizando esta técnica fue Sexy Robot en 1985 creado por Robert Abel &Associates. En México, un modelo muy conocido de esta técnica es el Ponchito Virtual, utilizado por Andrés Bustamante en el programa de TV Azteca Los Protagonistas. El Ponchito Virtual fue construido por la empresa mexicana ARTEC.
Wavelets
Wavelets significa “pequeñas ondulaciones” . Esta técnica permite que en una
sola imagen se compriman una gran cantidad de datos para que al acercarse a ella, se vayan viendo los detalles.
La técnica de los Wavelets fue utilizada en la realización de la
película Bichos (Bugs) de Pixar.
Técnicas de Pixar
El proceso que utiliza Pixar para crear sus animaciones se compone de cuatro
etapas principales:
1. Desarrollo (crear el guión de la historia),
2. preproducción (se direccionan los retos técnicos),
3. producción (creación de la película)
4. post producción (pulir los últimos detalles).
Los mismos artistas de Pixar son los
encargados de grabar los diálogos para el Story Board.
Se diseñan los sets, imágenes para superficies, colores, iluminación, etc.
Ahora se traduce la historia en escenas tridimensionales. Se anima la escena.
Como la animación se hace por computadora, los animadores
no dibujan o pintan las tomas.
Una vez realizada la animación, se sombrean los sets y los personajes.
Este es el proceso de traducir la información que forma la toma (sets, movimientos de los personajes, colores, etc) en un solo frame.
Los efectos de animación añaden los efectos especiales y el departamento de fotociencia graba las imágenes digitales a una película o al formato adecuado para su proyección.
VISIÓN POR COMPUTADORA:
PROCESAMIENTO DE IMÁGENES O INTELIGENCIA ARTIFICIAL
Tal vez sea más fácil contestar a estas dos preguntas si son resueltas en orden inverso.
Esta interacción es facilitada por la continua intervención inteligente entre la percepción y el control del movimiento (es decir acción); la percepción visual es de fundamental importancia para la vida inteligente.
La experiencia en el mundo en que vivimos esta cubierta por una variedad sin fin de objetos, animados e inanimados. Pero el tema de la visión artificial es extenso: los asuntos tales como la restauración de imágenes, mejoramiento de imagen, inspección visual automatizada, visión robótica, escenas tridimensionales, y percepción y cognición visual todas forman parte del término “Visión Artificial”.
Los usos han sido muchos y variados, abarcando el reconocimiento de caracteres, análisis las células de sangre, investigación automática de las radiografías, medicina nuclear , tomografías asistidas por computadora (CAT, Computer Aided Tomography), clasificación de cromosomas, identificación land-use, supervisión del tráfico, generación automática de proyecciones cartográficas, inspección de piezas para la garantía de calidad industrial, identificación de piezas y regeneración visual para ensamblaje y reparación automática. Como hemos visto, a la visión artificial le compete estudiar la estructura física tridimensional del mundo para el análisis automático de imágenes. Sin embargo, es necesaria la calidad en el uso de imágenes. Muy a menudo, es la recuperación de esta información perdida la que forma el problema central en la visión artificial. En segundo lugar, las imágenes son imágenes digitales: son representaciones discretas (es decir ellas tienen valores distintos en los puntos regularmente muestreados) y son representaciones cuantificadas (es decir cada valor es un valor del número entero).
La visión artificial incluye muchas técnicas que son útiles para si misma, Ej., el procesamiento de imágenes (que se refiere a la transformación, codificación, y transmisión de las imágenes) y los patrones, de las cuales los patrones visuales son pero solo una instancia). Más significativamente, sin embargo, la visión artificial incluye técnicas para la descripción útil de la forma y del volumen, para modelos geométricos, y para el llamado proceso cognoscitivo. Así, aunque la visión artificial se refiere ciertamente al procesamiento de imágenes, estas imágenes son solamente la materia prima de una ciencia mucho más amplia, la misma que se esfuerza en última instancia para emular las capacidades perceptivas del hombre y, quizás, para verter una luz sobre la manera por la cual él logra su interacción adaptativa y robusta con su ambiente.
No hay comentarios:
Publicar un comentario