Segmentación de Datos: Métodos de Partición Rígida y Difusa

Enviado por Chuletator online y clasificado en Otras materias

Escrito el en español con un tamaño de 2,1 KB

Métodos de Segmentación

Tipos de Segmentación

1. Método de Partición: Es importante tener en cuenta el número de variables y conglomerados para la utilización de este método.

  • A. Partición Rígida: Se enfoca en la separación de la población en grupos heterogéneos, es decir, los elementos no pueden pertenecer a dos o más grupos. Se utiliza en la clasificación.
  • B. Partición Difusa: Los elementos pueden pertenecer a dos o más grupos. Se utiliza cuando se hacen particiones. Se trabaja con probabilidades. En la práctica, la partición difusa se utiliza cuando se hacen particiones, mientras que la rígida se utiliza para la clasificación.

I. K-Medias

Se utiliza en base a distancias, es decir, los elementos se agrupan al centroide más cercano. Pertenece a los modelos de partición rígida.

¿Cómo se construye el algoritmo de K-medias?

Los datos se mueven al centroide más cercano, es decir, la cantidad de centroides que se tiene es la cantidad de segmentos que hay. El desafío es entender el número de clúster óptimo que se necesita. Se debe optimizar el número de clúster para poder representar bien el problema.

Para poder conocer la medida óptima de clúster se debe:

  1. Conocer el universo muestral (cantidad de datos).
  2. Conocer los tipos de datos de las variables (se clasifican por la distancia euclidiana, distancia entre dos puntos).
  3. En caso de escalas dispares, se debe normalizar. La regla del codo ayuda a ver el número óptimo de clúster.

Centroide: Es el centro de cada clúster (cada segmento). Ej: 5 clúster -> 5 centroides. Los datos se mueven al centroide de menor distancia.

II. C-Medias

Se enfoca en el método de partición difusa, ya que se asignan los elementos a dos o más grupos asignando una probabilidad de pertenencia, donde se analizan sus restricciones y objetivos. Establece una función objetivo en base a una ecuación donde se establece a qué clúster corresponde.

Entradas relacionadas: