Proceso Metodológico de la Segmentación de Datos por Conglomerados

Enviado por Chuletator online y clasificado en Magisterio

Escrito el en español con un tamaño de 3,78 KB

Fases del Proceso de Conglomeración de Datos

3.1 Fase 1: Definición de Objetivos

Esta fase inicial establece la finalidad del estudio de conglomerados, que puede incluir:

  • Desarrollo de una tipología o clasificación: Se pueden trazar los perfiles o clasificar a las entidades en grupos de entidades semejantes.
  • Investigación de esquemas conceptuales útiles: Los esquemas de clasificación pueden generalizarse y aplicarse a una amplia variedad de estudios.
  • Generación de hipótesis: Mediante la exploración de datos. Si se generan agrupaciones inesperadas, esto sugeriría relaciones a investigar.
  • Prueba de hipótesis: Intentar determinar si los grupos definidos mediante otros procedimientos están de hecho presentes en los datos.
  • Reducción de datos: Se puede obtener una descripción más concisa y comprensible de las entidades con una mínima pérdida de información.

3.2 Fase 2: Diseño Metodológico

El diseño del estudio requiere decisiones cruciales sobre la preparación de los datos:

  • Selección de variables: Se trata de seleccionar las variables con cuidado para evitar incluir variables altamente correlacionadas.
  • Estandarización de variables: Para calcular las distancias entre casos, es necesario convertir las variables a una misma unidad de medida.
  • Detección de “outliers”: Detectar los casos con rasgos claramente diferentes a los demás.
  • Determinación de la medida: Establecer qué tipo de medida se utilizará para calcular la distancia (e.g., euclidiana, Manhattan).

(pág. 11)

3.3 Fase 3: Verificación de Supuestos

Es conveniente que se cumplan dos condiciones principales para la validez del proceso:

  • Representatividad: Los casos seleccionados representan a grupos «reales» en la población.
  • Multicolinealidad: Se han eliminado variables que solo aportan información redundante.

3.4 Fase 4: Extracción de Conglomerados

La etapa de extracción implica cuatro tareas esenciales:

  1. Método de conglomeración: Hay que seleccionar un método de conglomeración adecuado.
  2. Determinación de las distancias: Valorar las distancias que existen entre las entidades.
  3. Determinación del número de conglomerados: Establecer el número de conglomerados que van a formar parte de la solución final.
  4. Replanteamiento de la solución: Examinar la estructura de cada conglomerado y decidir si hay o no que replantear la solución.

3.5 Fase 5: Interpretación y Denominación

Una vez decidido cuántos conglomerados distinguir, la fase de interpretación implica dos tareas:

  • Asignación a conglomerados: Se trata de asignar las entidades a cada uno de los conglomerados de la solución final.
  • Denominación de los conglomerados: Hay que determinar cuál es el contenido sustantivo de cada uno de los conglomerados y, a partir de ahí, asignarles un nombre descriptivo.

3.6 Fase 6: Validación y Consistencia

Se puede valorar en qué medida la presencia o no de una variable puede modificar la agrupación de entidades en conglomerados.

Para determinar en qué medida cada una de las variables contribuye a explicar la agrupación en conglomerados, se utiliza el análisis discriminante.

Así, el análisis discriminante puede utilizarse para valorar la consistencia de los resultados de un proceso de conglomeración.

Entradas relacionadas: