Descriptores de Imagen, Transformaciones y Procesamiento en Visión Artificial
Enviado por Chuletator online y clasificado en Plástica y Educación Artística
Escrito el en español con un tamaño de 7,06 KB
T4 Descriptores de Imagen
Descriptores: conjunto de números que describen la forma de un objeto en una imagen. Son capaces de describir un mismo objeto en la imagen independientemente de si se encuentra en una posición, rotación o escala distinta. Generalmente se calculan partiendo de una imagen previamente segmentada en regiones.
Tipos de Descriptores
Simples:
- Altura
- Área
- Perímetro
- Compactación: relación entre perímetro y área (la mejor es el círculo)
- Elongación: ratio entre altura y anchura de la caja mínima
- Rectangularidad: cociente entre el área del objeto y el área de la caja que lo envuelve
- Euler: diferencia entre el número de componentes conectados y el número de agujeros
Envolventes:
- Cierre convexo (hoja casi cerrada)
- Caja de Feret (cuadro normal)
- Menor rectángulo envolvente (MRE) (cuadro rotado)
Puntos extremos: los 8 puntos que definen una forma.
2. Momentos Geométricos
Determinan la posición y orientación de una región en la imagen.
- Centro de gravedad o centroide: posición.
- Momentos de inercia centrales: orientación.
3. Momentos de Hu
Se derivan de los momentos geométricos. Son empleados en el reconocimiento de objetos mediante técnicas de patrones. Son invariantes a traslación, rotación y escalado. No son invariantes a transformaciones afines.
4. Códigos de Cadena
Código numérico que se emplea para representar el contorno de un objeto mediante la dirección de los segmentos que lo forman. Se calculan con un patrón-rejilla numérica que determina la longitud y dirección de cada contorno. Se va asociando un código a cada uno de los píxeles que forman el contorno. Se hace el recorrido en sentido antihorario.
Inconvenientes:
- No es invariante a rotaciones.
- Necesita saber el punto de inicio.
- Es sensible al tamaño del patrón rejilla y al ruido.
5. Texturas
Patrones visuales homogéneos que se observan. Se describen mediante parámetros que representan valores estadísticos de primer orden o superior de los niveles de gris. Se calculan analizando la distribución espacial de alguna propiedad de píxeles (por ejemplo, valor de gris) de la imagen contenidos en un área o región. Las variaciones son pequeñas en el entorno de vecindad.
Inconvenientes:
- Dependen de la resolución de la imagen.
- Dependen del tamaño de vecindad elegido.
5.1 Primer Orden
- Media: o valor medio de los píxeles del histograma.
- Desviación típica: variación entre los posibles valores del histograma y su valor medio.
- Coeficiente de asimetría del histograma: determina el nivel de inclinación de la forma del histograma respecto a una distribución normal o gaussiana.
- Curtosis: indica cómo se reparte el histograma entre la parte central y los extremos.
- Entropía: mide la uniformidad del histograma.
5.2 Segundo Orden
Se crearon porque los de primer orden pierden información espacial.
- Matriz de coocurrencia o región espacial: estima la probabilidad de que los píxeles a una distancia tengan las mismas características (por ejemplo, mismo nivel de gris). Se buscan estos píxeles a ángulos de 0º o 45º para ahorrar coste. Se obtienen propiedades como la media, la varianza, el contraste, la entropía, la correlación y la homogeneidad.
6. Mapas de Predominancia
Permiten encontrar objetos que destaquen sobre la escena. Descomponen la imagen en dos partes (novedosa y redundante) para eliminar los patrones. Se calculan con la transformada de Fourier. La imagen tiene que estar en escala de grises.
T42 Procesamiento de Imágenes: Transformaciones Puntuales
Homogéneas: las más simples. El valor de gris es modificado sólo en función del propio valor. Ejemplo: aumento del contraste a través del histograma.
No homogéneas: el valor de gris es modificado dependiendo de la posición que ocupa en la imagen y del valor previo.
Limitaciones:
- No es posible detectar características de los objetos del fondo.
- El resultado no recoge más información que los nuevos valores de gris.
Ejemplos:
- Reducción de ruido por el promedio de sucesivas adquisiciones de la imagen.
- Corrección de iluminación no homogénea del fondo mediante la división entre el fondo sin objetos y la imagen original.
Problema del Mapeo
Las imágenes están formadas por píxeles en posiciones discretas. La transformación genera nuevas coordenadas para los niveles de gris.
Mapeo directo: las coordenadas de la imagen de salida se establecen según la posición del píxel más próximo.
Inconvenientes:
- Píxeles sin valor.
- Píxeles con varios niveles de gris.
- Píxeles fuera de la imagen.
Mapeo inverso: las coordenadas de la imagen de entrada son función de las coordenadas de la imagen de salida. El valor del píxel de salida es interpolado a partir de los valores de los vecinos. No hay píxeles sin valor en la imagen de salida.
Interpolación
Cuantos más píxeles, más precisión y mayor coste computacional.
Tipos:
- Vecino más próximo: se redondean las coordenadas. Rápido pero con pixelación.
- Bilineal: estima el nivel de gris con una vecindad de 2x2. Mejor.
- Bicúbica: vecindad 4x4. La mejor.
Transformaciones Geométricas
: se clasifican; Rígidas o euclídeas: preservan distancias, ángulos y áreas. Traslación rotación y reflexión. Afines: preservan la colinealidad de los puntos, paralelismos y razones entre puntos. Escalado y sesgado. Proyectivas: preservan sólo la colinealidad de los puntos.