Guia de Mostreig i Anàlisi Estadística Bàsica

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en catalán con un tamaño de 8,56 KB

Freqüències

  • Freqüència acumulada (fac): Es repeteix el primer número de la freqüència absoluta i es va sumant el següent.
  • Marca de classe: Punt mitjà d'un interval. Exemple: Interval 0-20 → (0 + 20) / 2 = 10.
  • Rang: Diferència entre el valor màxim i el valor mínim de les dades (o entre la marca de classe superior i inferior si estan agrupades).
  • Mitjana ponderada: Suma de (marques de classe * freqüència absoluta corresponent) / Nombre total d'observacions (últim número de la freqüència acumulada).
  • Mediana (dades agrupades): Localitzar l'interval medià on la freqüència acumulada supera N/2 (sent N el total d'observacions). Després s'aplica la fórmula específica per a dades agrupades.

Pressupost d'Enquesta

  • Pressupost total: (Cost per enquesta [cost enquestador, obsequi, material] * Nombre d'enquestes) + Cost del supervisor/coordinació.
  • Dies necessaris: Nombre total d'enquestes / (Nombre d'enquestadors * Enquestes realitzables per dia per enquestador).
  • Calcular enquestadors addicionals si cal:
    1. Calcular les enquestes totals per dia necessàries: Nombre total d'enquestes / Dies disponibles.
    2. Calcular el nombre total d'enquestadors necessaris: Enquestes totals per dia necessàries / Enquestes que fa 1 enquestador per dia.
    3. Comparar amb els enquestadors disponibles inicialment per determinar quants més es necessiten.

Codificació de Respostes

  • Preguntes de resposta única (Ex: Edat): S'assigna un codi numèric a cada categoria o valor de resposta possible. Cada enquestat té un sol codi per a aquesta pregunta.
    Exemple:
    ID | Edat_codi
    ---|-----------
    R1 | 3
    R2 | 1
    
  • Preguntes de resposta múltiple (Ex: Què fas els caps de setmana?): Es crea una variable (columna) separada per a cada opció de resposta possible. S'assigna un codi (sovint 1 o 0) per indicar si l'enquestat va seleccionar o no aquesta opció.
    Exemple:
    ID | P1_OpcioA | P1_OpcioB | P1_OpcioC
    ---|-----------|-----------|-----------
    R1 | 1         | 0         | 1
    R2 | 0         | 1         | 1
    

Error Mostral

  • Error estàndard (per a mitjanes): Desviació estàndard de la mostra / Arrel quadrada de la mida de la mostra (n).
  • Quan disminueix la mida de la mostra (n), generalment augmenta l'error d'estimació (hi ha més incertesa).

Proporció i Correcció Mostral

  • Proporció de la mostra (fracció de mostreig): Mida de la mostra (n) / Mida de la població (N).
  • Conclusió (Factor de Correcció - FCF): Si la fracció de mostreig (n/N) és significativa (sovint es considera > 5% o 10%), és recomanable aplicar el Factor de Correcció per a Poblacions Finetes (FCF) per ajustar el càlcul de l'error estàndard i fer-lo més precís.
  • Aplicació del FCF:
    1. Calcular N - n.
    2. Calcular el FCF: Arrel quadrada de [(N - n) / (N - 1)].
    3. Multiplicar l'error estàndard (calculat sense correcció) pel FCF per obtenir l'error estàndard corregit.

Anàlisi de Renda Familiar (Exemple)

  • Renda mitjana (dades agrupades): Sumar els productes de (Marca de classe de l'interval de renda * Nombre de famílies en aquest interval). Dividir la suma total pel nombre total de famílies.
  • Proporció d'habitatges amb una característica: (Nombre d'habitatges amb la característica / Nombre total d'habitatges a la mostra) * 100 (%).
  • Estimació del total a la població: Nombre total d'habitatges a la població * (Proporció calculada a la mostra / 100).

Tipus de Mostreig

  • Exemple de no probabilístic: Mostreig per quotes.
  • Distribució per quotes (Exemple amb mostra = 300):
    1. Tenir una taula amb les quotes desitjades (basades en característiques de la població, ex: edat i sexe). Sumar files i columnes per verificar el total poblacional de referència.
    2. Calcular la proporció que representa cada cel·la de la quota respecte al total de la població de referència: (Valor de la cel·la / Total població).
    3. Assignar la mida de la mostra a cada cel·la: (Proporció de la cel·la) * (Mida total de la mostra desitjada, ex: 300).

Mètodes d'Afixació en Mostreig Estratificat

  1. Afixació Simple: S'assigna la mateixa mida de mostra a cada estrat. Mida mostra per estrat = Mida total de la mostra / Nombre d'estrats.
  2. Afixació Proporcional: La mida de la mostra de cada estrat és proporcional a la mida d'aquest estrat dins la població. Mida mostra estrat i = (Mida població estrat i / Mida total població) * Mida total de la mostra.
  3. Afixació Òptima (de Neyman): Considera tant la mida de l'estrat com la seva variabilitat (desviació típica). Assigna més mostra als estrats més grans i més heterogenis.
    • Calcular per a cada estrat i: (Mida població estrat i * Desviació típica estrat i). Sumar aquests productes per a tots els estrats (= Suma X).
    • Mida mostra estrat i = [(Mida població estrat i * Desviació típica estrat i) / Suma X] * Mida total de la mostra.

Conceptes Teòrics Fonamentals

  • Estadístics: Mesures numèriques descriptives calculades a partir de les dades d’una mostra (ex: mitjana mostral, proporció mostral). S'utilitzen per estimar els paràmetres poblacionals.
  • Mostreig: Procés de selecció d'un subconjunt d'individus (una mostra) d'una població més gran, amb l'objectiu d'estudiar aquesta mostra per extreure conclusions sobre tota la població.
  • Inferència estadística: Conjunt de mètodes i tècniques que permeten treure conclusions (generalitzar) sobre una població a partir dels resultats obtinguts en una mostra. Inclou l'estimació de paràmetres i el contrast d'hipòtesis.
  • Treball de camp: Fase del procés d'investigació on es recullen les dades primàries directament de les fonts (ex: mitjançant enquestadors). Inclou la planificació, l'execució de la recollida, el control de qualitat i el registre inicial de les dades.
  • Diferència entre mostreig probabilístic i no probabilístic: En el probabilístic (ex: aleatori simple, estratificat), cada element de la població té una probabilitat coneguda i no nul·la de ser seleccionat per a la mostra, basant-se en l'atzar. En el no probabilístic (ex: per quotes, de conveniència), la selecció dels elements es basa en el criteri de l'investigador o en la facilitat d'accés, i no es coneix la probabilitat de selecció de cada element.
  • Població infinita (a efectes pràctics): Es considera quan la població és extremadament gran (sovint s'usa el llindar de N > 100.000) i la mida de la mostra és molt petita en comparació, de manera que extreure un element no altera significativament les probabilitats de selecció dels restants. No cal aplicar el factor de correcció.
  • Població finita: Es considera quan la mida de la població (N) és coneguda i limitada (sovint N ≤ 100.000), i la fracció de mostreig (n/N) pot ser rellevant. Pot requerir l'ús del factor de correcció per a poblacions finites.
  • Diferència entre variables quantitatives (mesurables) i qualitatives (categòriques): Les variables quantitatives representen quantitats numèriques que es poden mesurar o comptar i amb les quals es poden realitzar operacions aritmètiques (ex: talla, edat, ingressos). Les variables qualitatives descriuen qualitats, atributs o categories que no són intrínsecament numèriques (ex: sexe, color preferit, nivell d'estudis).
  • Tipus d'informes d'investigació comercial:
    • Informe Científic/Tècnic: Detallat, dirigit a un públic expert (ex: investigadors, tècnics de màrqueting). Inclou metodologia completa, anàlisis exhaustives i llenguatge tècnic.
    • Informe Directiu/Executiu: Concís, enfocat en les conclusions clau i recomanacions pràctiques per a la presa de decisions. Utilitza un llenguatge clar i directe, sovint amb suport visual.

Entradas relacionadas: