Cluster eta Korrespondentzia Analisiaren Gida
Enviado por Chuletator online y clasificado en Derecho
Escrito el en
vasco con un tamaño de 3,31 KB
Cluster hierarkikoa
- Variables: Klasifikazio aldagaiak
- Etiquetar casos mediante: Taldeak
- Estadísticos: Historial de conglomerado
- Gráficos: Dendograma eskatu
- Método: Neurria zehazteko
Historial de conglomeración
Taulan ikusi dezakegunez, guztira 22 etapa izango ditugu. Kasu hauek dira haien artean urrunen daudenak. Taldeak egiteko, coeficientes taula begiratu behar dugu. Taldeak egiteko formula: etapa guztien kopuruaren (gehi bat) eta salto handiena (mozketa) duenaren arteko kenketa.
Mozketa 19. etapan egiten dugu, saltorik handiena 19. etapatik (186,973) 20. etapara (322,076) ematen delako (322,076 - 186,973 = 135,103). Beraz, 22 - 19 = 3 talde egingo ditugu.
Zenbat aniztasun dago hamargarren etapan mozten dugunean? 186,973 / 322,076 * 100 = %58,05eko aniztasuna.
Dendograma
Hiru taldeak, saltoa baino lehen (19 taldeak), honakoak dira:
- 1. Taldea: Grezia, Espainia, Zipre, Malta eta Portugal.
- 2. Taldea: Letonia, Lituania, Hungaria, Polonia, Estonia eta Txekiar Errepublika.
- 3. Taldea: Belgika, Frantzia, Alemania, Holanda, Danimarka, Suedia, Finlandia, Italia, Austria, Irlanda eta Erresuma Batua.
Cluster ez hierarkikoa (K-Means)
- Variables: Klasifikazio aldagaiak
- Etiquetar casos mediante: Taldeak
- Guardar: Cluster de pertenencia eta Distancia desde…
- Opciones: Centros de… / Tabla ANOVA / Información…
Centros de cluster iniciales
Talde kopurua zehaztea.
Cluster de pertenencia
Hiru talde egitea erabaki dugu. Puntuak aleatorioki hartzen dira. Taldeen barneko homogeneotasuna aztertzeko, distantzia neurtzen dugu. Distantzia txikia bada, taldea homogeneoa da.
- 1. taldearen batez besteko distantzia: 1,599
- 2. taldearen batez besteko distantzia: 3,069
- 3. taldearen batez besteko distantzia: 2,148
Centros de cluster finales
Talde bakoitzaren ezaugarriak alderatzen dira. Hiru taldeak antzekoak dira, baina gastu-eredu desberdinak dituzte janari, etxebizitza eta garraioan.
ANOVA
Aldagaien esanguratasuna (sig) 0,05 baino txikiagoa bada, adierazgarriak dira. 0,05 baino handiagoa denean, aldagaiak garrantzi handia du taldeak osatzerakoan.
Korrespondentzia analisia
H0: Aldagaien artean ez dago erlaziorik.
H1: Aldagaien artean erlazioa dago.
Tabla de correspondencias
Kasuak guztira 2645 dira. Datuak homogeneoak eta kalitatezkoak izan behar dira. Enpresen eta ezaugarrien arteko harremana aztertzen da.
Resumen
- Hipotesi nulua: Sig < 0,001 denez, H0 baztertu eta H1 onartzen da.
- Faktore kopurua: HAIR irizpidea eta bariantza (inertzia) erabiliz, 2 dimentsio aukeratzen dira (%90,5eko bariantza metatua).
Puntos de fila y columna
Dimentsio bakoitzaren deskribapena egiteko, ekarpen absolutua eta erlatiboa aztertzen dira. Muturreko kasuak aukeratuz, %60ko inertzia gainditzea bilatzen da.