Cluster eta Korrespondentzia Analisiaren Gida

Enviado por Chuletator online y clasificado en Derecho

Escrito el en vasco con un tamaño de 3,31 KB

Cluster hierarkikoa

  • Variables: Klasifikazio aldagaiak
  • Etiquetar casos mediante: Taldeak
  • Estadísticos: Historial de conglomerado
  • Gráficos: Dendograma eskatu
  • Método: Neurria zehazteko

Historial de conglomeración

Taulan ikusi dezakegunez, guztira 22 etapa izango ditugu. Kasu hauek dira haien artean urrunen daudenak. Taldeak egiteko, coeficientes taula begiratu behar dugu. Taldeak egiteko formula: etapa guztien kopuruaren (gehi bat) eta salto handiena (mozketa) duenaren arteko kenketa.

Mozketa 19. etapan egiten dugu, saltorik handiena 19. etapatik (186,973) 20. etapara (322,076) ematen delako (322,076 - 186,973 = 135,103). Beraz, 22 - 19 = 3 talde egingo ditugu.

Zenbat aniztasun dago hamargarren etapan mozten dugunean? 186,973 / 322,076 * 100 = %58,05eko aniztasuna.

Dendograma

Hiru taldeak, saltoa baino lehen (19 taldeak), honakoak dira:

  1. 1. Taldea: Grezia, Espainia, Zipre, Malta eta Portugal.
  2. 2. Taldea: Letonia, Lituania, Hungaria, Polonia, Estonia eta Txekiar Errepublika.
  3. 3. Taldea: Belgika, Frantzia, Alemania, Holanda, Danimarka, Suedia, Finlandia, Italia, Austria, Irlanda eta Erresuma Batua.

Cluster ez hierarkikoa (K-Means)

  • Variables: Klasifikazio aldagaiak
  • Etiquetar casos mediante: Taldeak
  • Guardar: Cluster de pertenencia eta Distancia desde…
  • Opciones: Centros de… / Tabla ANOVA / Información…

Centros de cluster iniciales

Talde kopurua zehaztea.

Cluster de pertenencia

Hiru talde egitea erabaki dugu. Puntuak aleatorioki hartzen dira. Taldeen barneko homogeneotasuna aztertzeko, distantzia neurtzen dugu. Distantzia txikia bada, taldea homogeneoa da.

  • 1. taldearen batez besteko distantzia: 1,599
  • 2. taldearen batez besteko distantzia: 3,069
  • 3. taldearen batez besteko distantzia: 2,148

Centros de cluster finales

Talde bakoitzaren ezaugarriak alderatzen dira. Hiru taldeak antzekoak dira, baina gastu-eredu desberdinak dituzte janari, etxebizitza eta garraioan.

ANOVA

Aldagaien esanguratasuna (sig) 0,05 baino txikiagoa bada, adierazgarriak dira. 0,05 baino handiagoa denean, aldagaiak garrantzi handia du taldeak osatzerakoan.

Korrespondentzia analisia

H0: Aldagaien artean ez dago erlaziorik.
H1: Aldagaien artean erlazioa dago.

Tabla de correspondencias

Kasuak guztira 2645 dira. Datuak homogeneoak eta kalitatezkoak izan behar dira. Enpresen eta ezaugarrien arteko harremana aztertzen da.

Resumen

  • Hipotesi nulua: Sig < 0,001 denez, H0 baztertu eta H1 onartzen da.
  • Faktore kopurua: HAIR irizpidea eta bariantza (inertzia) erabiliz, 2 dimentsio aukeratzen dira (%90,5eko bariantza metatua).

Puntos de fila y columna

Dimentsio bakoitzaren deskribapena egiteko, ekarpen absolutua eta erlatiboa aztertzen dira. Muturreko kasuak aukeratuz, %60ko inertzia gainditzea bilatzen da.

Entradas relacionadas: