Proceso Metodológico de la Segmentación de Datos por Conglomerados
Enviado por Chuletator online y clasificado en Magisterio
Escrito el en
español con un tamaño de 3,78 KB
Fases del Proceso de Conglomeración de Datos
3.1 Fase 1: Definición de Objetivos
Esta fase inicial establece la finalidad del estudio de conglomerados, que puede incluir:
- Desarrollo de una tipología o clasificación: Se pueden trazar los perfiles o clasificar a las entidades en grupos de entidades semejantes.
- Investigación de esquemas conceptuales útiles: Los esquemas de clasificación pueden generalizarse y aplicarse a una amplia variedad de estudios.
- Generación de hipótesis: Mediante la exploración de datos. Si se generan agrupaciones inesperadas, esto sugeriría relaciones a investigar.
- Prueba de hipótesis: Intentar determinar si los grupos definidos mediante otros procedimientos están de hecho presentes en los datos.
- Reducción de datos: Se puede obtener una descripción más concisa y comprensible de las entidades con una mínima pérdida de información.
3.2 Fase 2: Diseño Metodológico
El diseño del estudio requiere decisiones cruciales sobre la preparación de los datos:
- Selección de variables: Se trata de seleccionar las variables con cuidado para evitar incluir variables altamente correlacionadas.
- Estandarización de variables: Para calcular las distancias entre casos, es necesario convertir las variables a una misma unidad de medida.
- Detección de “outliers”: Detectar los casos con rasgos claramente diferentes a los demás.
- Determinación de la medida: Establecer qué tipo de medida se utilizará para calcular la distancia (e.g., euclidiana, Manhattan).
(pág. 11)
3.3 Fase 3: Verificación de Supuestos
Es conveniente que se cumplan dos condiciones principales para la validez del proceso:
- Representatividad: Los casos seleccionados representan a grupos «reales» en la población.
- Multicolinealidad: Se han eliminado variables que solo aportan información redundante.
3.4 Fase 4: Extracción de Conglomerados
La etapa de extracción implica cuatro tareas esenciales:
- Método de conglomeración: Hay que seleccionar un método de conglomeración adecuado.
- Determinación de las distancias: Valorar las distancias que existen entre las entidades.
- Determinación del número de conglomerados: Establecer el número de conglomerados que van a formar parte de la solución final.
- Replanteamiento de la solución: Examinar la estructura de cada conglomerado y decidir si hay o no que replantear la solución.
3.5 Fase 5: Interpretación y Denominación
Una vez decidido cuántos conglomerados distinguir, la fase de interpretación implica dos tareas:
- Asignación a conglomerados: Se trata de asignar las entidades a cada uno de los conglomerados de la solución final.
- Denominación de los conglomerados: Hay que determinar cuál es el contenido sustantivo de cada uno de los conglomerados y, a partir de ahí, asignarles un nombre descriptivo.
3.6 Fase 6: Validación y Consistencia
Se puede valorar en qué medida la presencia o no de una variable puede modificar la agrupación de entidades en conglomerados.
Para determinar en qué medida cada una de las variables contribuye a explicar la agrupación en conglomerados, se utiliza el análisis discriminante.
Así, el análisis discriminante puede utilizarse para valorar la consistencia de los resultados de un proceso de conglomeración.