Interpretación de dendrogramas y formación de conglomerados: etapas, cortes y comunalidad

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 4,09 KB

1. Comentar la 2.ª y 3.ª etapa del historial de aglomeración

Segunda etapa

En la segunda etapa aparecen, en primer lugar y por primera vez, el clúster 3 y el clúster 6, volviendo a aparecer el clúster 3 en la etapa 6 junto con el clúster 2; este último vuelve a aparecer en la etapa 11 junto con el clúster 8. El clúster 2 vuelve a aparecer en la etapa 13 junto con el 15, seguidamente en la etapa 14 junto con el 4, después en la etapa 15 junto con el clúster 9 y, por último, aparece en la etapa 16 junto con el clúster 1.

Tercera etapa

En la tercera etapa aparecen el clúster 2 y el 17, que vuelven a aparecer en la etapa 6…

2. ¿Dónde efectuaría el corte en el dendrograma para una solución de 4 conglomerados? ¿Qué comunidades formarían parte de cada conglomerado?

El corte se efectuaría aproximadamente en el 9 para dar lugar a 4 conglomerados:

  • Primer conglomerado: Aragón, Castilla y León, La Rioja, Principado de Asturias y Cantabria.
  • Segundo conglomerado: Castilla-La Mancha, Galicia, Navarra, País Vasco, Extremadura y Murcia.
  • Tercer conglomerado: Islas Baleares, Canarias y Comunidad Valenciana.
  • Cuarto conglomerado: Cataluña, Madrid y Andalucía.

3. ¿Cuántos grupos resultan si se corta a una distancia de 14?

A una distancia de 14 aparecerían 3 grupos.

1. Citar, dentro del conglomerado 3, 2 comunidades autónomas que podemos considerar más diferentes del resto

Castilla-La Mancha y Navarra, pues sus distancias son las mayores…

2. Comentar el perfil de los grupos 1 y 3

2. Comentar el perfil de los grupos 1 y 3.

Tercera pregunta

1. Indique qué se entiende por comunalidad de una variable en el análisis factorial

La comunalidad es la varianza de la variable explicada por el conjunto de los factores. Se calcula sumando el cuadrado de todas las cargas (lij) de dicha variable.

2. Señale dos diferencias entre el método jerárquico y el no jerárquico en la determinación de clúster

CLÚSTER JERÁRQUICOCLÚSTER NO JERÁRQUICO
El número de grupos considerados se determina como consecuencia del análisis.Es necesario especificar el número de grupos a crear.
Es un método no dinámico; es decir, una vez que un caso pasa a formar parte de un grupo, permanece en él hasta el final del proceso.Es un método dinámico; es decir, en cada fase del proceso los casos pueden cambiar de grupo.
Requiere la conversión de la matriz original a una matriz de distancias.No requiere la conversión de la matriz original a una matriz de distancias.
Se utilizan, por ejemplo, para clasificar productos, marcas o empresas.Recomendados para la agrupación de grandes conjuntos de datos, como pueden ser clasificaciones de individuos, compradores o consumidores (requieren menos tiempo de cálculo que los jerárquicos).

3. ¿Cómo se define la distancia entre grupos con el criterio del «enlace promedio entre grupos»?

Con el criterio de enlace promedio la distancia entre dos grupos se define como la media de las distancias entre todos los pares de individuos, tomando uno de cada grupo.

Criterios para formar grupos en métodos jerárquicos

  • Enlace sencillo: unir por la distancia al individuo más cercano del grupo (útil para identificar atípicos).
  • Enlace completo: unir por la distancia al individuo más alejado del grupo.
  • Enlace promedio: se unen por la media de las distancias a todos los individuos del grupo.
  • Enlace de centroides: minimizar la distancia a los «centros» de los grupos.
  • Método de Ward: minimizar la suma de cuadrados de las distancias a los centros de los grupos.

Entradas relacionadas: