Descriptores de Imagen, Transformaciones y Procesamiento en Visión Artificial

Enviado por Chuletator online y clasificado en Plástica y Educación Artística

Escrito el en español con un tamaño de 7,06 KB

T4 Descriptores de Imagen

Descriptores: conjunto de números que describen la forma de un objeto en una imagen. Son capaces de describir un mismo objeto en la imagen independientemente de si se encuentra en una posición, rotación o escala distinta. Generalmente se calculan partiendo de una imagen previamente segmentada en regiones.

Tipos de Descriptores

Simples:

  • Altura
  • Área
  • Perímetro
  • Compactación: relación entre perímetro y área (la mejor es el círculo)
  • Elongación: ratio entre altura y anchura de la caja mínima
  • Rectangularidad: cociente entre el área del objeto y el área de la caja que lo envuelve
  • Euler: diferencia entre el número de componentes conectados y el número de agujeros

Envolventes:

  • Cierre convexo (hoja casi cerrada)
  • Caja de Feret (cuadro normal)
  • Menor rectángulo envolvente (MRE) (cuadro rotado)

Puntos extremos: los 8 puntos que definen una forma.

2. Momentos Geométricos

Determinan la posición y orientación de una región en la imagen.

  • Centro de gravedad o centroide: posición.
  • Momentos de inercia centrales: orientación.

3. Momentos de Hu

Se derivan de los momentos geométricos. Son empleados en el reconocimiento de objetos mediante técnicas de patrones. Son invariantes a traslación, rotación y escalado. No son invariantes a transformaciones afines.

4. Códigos de Cadena

Código numérico que se emplea para representar el contorno de un objeto mediante la dirección de los segmentos que lo forman. Se calculan con un patrón-rejilla numérica que determina la longitud y dirección de cada contorno. Se va asociando un código a cada uno de los píxeles que forman el contorno. Se hace el recorrido en sentido antihorario.

Inconvenientes:

  • No es invariante a rotaciones.
  • Necesita saber el punto de inicio.
  • Es sensible al tamaño del patrón rejilla y al ruido.

5. Texturas

Patrones visuales homogéneos que se observan. Se describen mediante parámetros que representan valores estadísticos de primer orden o superior de los niveles de gris. Se calculan analizando la distribución espacial de alguna propiedad de píxeles (por ejemplo, valor de gris) de la imagen contenidos en un área o región. Las variaciones son pequeñas en el entorno de vecindad.

Inconvenientes:

  • Dependen de la resolución de la imagen.
  • Dependen del tamaño de vecindad elegido.

5.1 Primer Orden

  • Media: o valor medio de los píxeles del histograma.
  • Desviación típica: variación entre los posibles valores del histograma y su valor medio.
  • Coeficiente de asimetría del histograma: determina el nivel de inclinación de la forma del histograma respecto a una distribución normal o gaussiana.
  • Curtosis: indica cómo se reparte el histograma entre la parte central y los extremos.
  • Entropía: mide la uniformidad del histograma.

5.2 Segundo Orden

Se crearon porque los de primer orden pierden información espacial.

  • Matriz de coocurrencia o región espacial: estima la probabilidad de que los píxeles a una distancia tengan las mismas características (por ejemplo, mismo nivel de gris). Se buscan estos píxeles a ángulos de 0º o 45º para ahorrar coste. Se obtienen propiedades como la media, la varianza, el contraste, la entropía, la correlación y la homogeneidad.

6. Mapas de Predominancia

Permiten encontrar objetos que destaquen sobre la escena. Descomponen la imagen en dos partes (novedosa y redundante) para eliminar los patrones. Se calculan con la transformada de Fourier. La imagen tiene que estar en escala de grises.

T42 Procesamiento de Imágenes: Transformaciones Puntuales

Homogéneas: las más simples. El valor de gris es modificado sólo en función del propio valor. Ejemplo: aumento del contraste a través del histograma.

No homogéneas: el valor de gris es modificado dependiendo de la posición que ocupa en la imagen y del valor previo.

Limitaciones:

  • No es posible detectar características de los objetos del fondo.
  • El resultado no recoge más información que los nuevos valores de gris.

Ejemplos:

  • Reducción de ruido por el promedio de sucesivas adquisiciones de la imagen.
  • Corrección de iluminación no homogénea del fondo mediante la división entre el fondo sin objetos y la imagen original.

Problema del Mapeo

Las imágenes están formadas por píxeles en posiciones discretas. La transformación genera nuevas coordenadas para los niveles de gris.

Mapeo directo: las coordenadas de la imagen de salida se establecen según la posición del píxel más próximo.

Inconvenientes:

  • Píxeles sin valor.
  • Píxeles con varios niveles de gris.
  • Píxeles fuera de la imagen.

Mapeo inverso: las coordenadas de la imagen de entrada son función de las coordenadas de la imagen de salida. El valor del píxel de salida es interpolado a partir de los valores de los vecinos. No hay píxeles sin valor en la imagen de salida.

Interpolación

Cuantos más píxeles, más precisión y mayor coste computacional.

Tipos:

  • Vecino más próximo: se redondean las coordenadas. Rápido pero con pixelación.
  • Bilineal: estima el nivel de gris con una vecindad de 2x2. Mejor.
  • Bicúbica: vecindad 4x4. La mejor.

Transformaciones Geométricas

: se clasifican; Rígidas o euclídeas: preservan distancias, ángulos y áreas. Traslación rotación y reflexión. Afines: preservan la colinealidad de los puntos, paralelismos y razones entre puntos. Escalado y sesgado. Proyectivas: preservan sólo la colinealidad de los puntos.

Transformaciones en entorno vecindad: combinan valores de gris en un pequeño entorno de vecindad. 3 tipos: convoluciones, filtros de valor de rango y transformaciones morfológicas. Convolucion promediado del entorno de vecindad:matriz de 1/9. la img se obtienen promediando los valores de los px y su entorno. Reduce el ruido pero desdibuja contornos.Convolución realce espacial: aumenta contraste. matriz de -1 menos el centro, 9. Filtro de valor de rango: operan empleando selección para no usar todos los px del entorno de vecindad. De naturaleza no lineal. Mediana: opera ordenando por valores de la máscara y luego slecc el medio.

Entradas relacionadas: