Fundamentos y Métodos de Segmentación de Imágenes Digitales

Enviado por Chuletator online y clasificado en Plástica y Educación Artística

Escrito el en español con un tamaño de 5,36 KB

Segmentación de Imágenes: Conceptos Fundamentales y Métodos

La segmentación de imágenes es un proceso esencial en el procesamiento digital que divide una imagen en sus partes constituyentes. El objetivo es alcanzar un nivel de subdivisión en el que se aíslen las regiones u objetos de interés.

Un objeto se define como una entidad básica en una imagen de alta resolución, generada por el agrupamiento de píxeles. Cada objeto está compuesto por píxeles con niveles digitales (ND) similares y posee un tamaño, una forma y una relación geográfica con el componente del mundo real que modela.

Los algoritmos de segmentación se basan principalmente en dos propiedades fundamentales de los valores del nivel de gris:

1. Discontinuidad entre los Niveles de Gris de Píxeles Vecinos

Esta aproximación divide la imagen basándose en la detección de cambios bruscos en el nivel de gris.

Detección de Bordes en Imágenes en Escala de Grises

La detección de bordes implica el cálculo de un operador local de derivación. Un píxel se considera parte de un borde si se produce un cambio abrupto en los niveles de gris con sus vecinos. Cuanto más brusco sea el cambio, más fácil resulta detectar el borde. Sin embargo, un desafío inherente es que esta técnica también puede detectar el ruido presente en la imagen.

  • La primera derivada se utiliza para determinar la presencia de un borde.
  • El signo de la derivada segunda indica la posición del píxel dentro del borde.

Enlazado de Bordes

Este procedimiento local consiste en analizar las características de los vecinos de cada píxel detectado como borde. Todos los puntos que comparten similitudes con dicho píxel se enlazan, formando así un contorno continuo.

2. Similitud entre los Niveles de Gris de Píxeles Vecinos

Esta metodología segmenta la imagen mediante la búsqueda de zonas que presenten valores de nivel de gris similares, conforme a criterios predefinidos. Las técnicas más comunes incluyen:

  • Umbralización
  • Crecimiento de Región
  • Watershed
  • Split and Merge (División y Fusión)

Split and Merge (División y Fusión)

Este método divide la imagen en regiones y, posteriormente, realiza una subdivisión adicional o una fusión entre ellas, dependiendo de si se verifican las condiciones prefijadas. La estructura más utilizada para este proceso es el árbol cuaternario, que sigue los siguientes pasos:

  1. Se define un test de homogeneidad.
  2. Se subdivide la imagen en los cuatro cuadrantes disjuntos.
  3. Se calcula la medida de homogeneidad para cada cuadrante.
  4. Se fusionan dos regiones si la condición de homogeneidad se verifica.
  5. Si una región no verifica la condición, se vuelve a dividir y se repite todo el proceso hasta que todas las regiones pasan el test de homogeneidad.

Umbralización

Mediante el histograma de la imagen, se obtiene una gráfica que muestra el número de píxeles por cada nivel de gris. Para binarizar la imagen, se debe elegir un valor adecuado (el umbral) dentro de los niveles de grises, de tal forma que el histograma forme un valle en ese nivel. Todos los niveles de grises menores al umbral calculado se convertirán en negro, y todos los mayores en blanco.

Algoritmo ISODATA

El algoritmo ISODATA es un método iterativo. A partir de una primera estimación del umbral, se recalculan los parámetros y nuevos umbrales sucesivamente. Los pasos son:

  1. Se define un umbral inicial (t0) como el nivel medio de gris.
  2. Se calculan μi (nivel medio de gris de los niveles a la izquierda de t0) y μd (nivel medio de gris de los niveles a la derecha de t0).
  3. Se calcula (μi + μd) / 2. Si este valor es igual a t0, entonces t0 es el umbral final. Si es distinto, se asigna el nuevo valor a t0 y se vuelve al paso 2. El proceso se detiene cuando la diferencia entre los valores de t0 obtenidos en iteraciones sucesivas es menor que un cierto parámetro predefinido.

Segmentación Watershed (Cuencas Hidrográficas)

Este método interpreta la imagen como un Modelo Digital de Elevaciones (MDE), donde la cota de un píxel es su nivel digital (ND). Los pasos son:

  1. Se analiza la imagen como un MDE donde la cota de un píxel es su ND.
  2. Se detectan los mínimos locales en la imagen.
  3. Se inicia una "inmersión" del terreno desde el mínimo nivel.
  4. Cuando dos cuencas vertientes están a punto de unirse, se crea un "dique". Este punto se selecciona como perteneciente a la divisoria.
  5. Al finalizar la inmersión del terreno, los píxeles pertenecen a una cuenca o son parte de las divisorias de cuencas. Las cuencas representan los objetos segmentados, y las divisorias marcan los límites de dichos objetos.

Entradas relacionadas: