Conceptes Fonamentals d'Estadística: Distribucions i Tests

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en catalán con un tamaño de 6,3 KB

Estadística Descriptiva: Mesures Clau

Mesures de Tendència Central

  • Moda (Poc sensible)
  • Mitjana (Molt sensible)
  • Mediana (Robust/Poc sensible)

Mesures de Dispersió

  • Rang (Recorregut)
  • Rang interquartílic
  • Variància
  • Desviació Típica (Desv. Típica)
  • Coeficient de Variació (CV)

Mesures de Localització

Inclouen Centils (percentils), Decils i Quartils.

Distribució Binomial

Paràmetres: $p + q = 1$.

Notació: $X \sim B(N, p)$

Càlcul de Probabilitat

$$P(X=k) = \binom{n}{k} p^k q^{n-k}$$

Càlcul del Factorial

Exemple: $\binom{10}{3} = \frac{10!}{3! \cdot 7!}$

Casos especials del factorial:

  • $\binom{n}{0} = 1$
  • $\binom{n}{1} = N$
  • $\binom{n}{2} = \frac{N(N-1)}{2}$

Distribució Normal

Notació: $X \sim N(\mu; \sigma)$

Funció de Densitat

La funció de densitat $f(x)$ no pot ser negativa i l'àrea sota la corba és 1. La integral de $f(x) \cdot x = \mu$.

Fórmula (simplificada): $$f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{1}{2} \left(\frac{x-\mu}{\sigma}\right)^2}$$

Distribució Normal Estàndard (Z)

Notació: $Z \sim N(\mu=0, \sigma=1)$

S'utilitza per estandarditzar quan es compleixen les condicions (per exemple, $N \ge 30$, $Nq \ge 5$, $Np \ge 5$).

Fórmula d'Estandardització

$$Z = \frac{x - \mu}{\sigma}$$

Exemple de càlcul de probabilitat:

$$P(a \le X \le b) = P\left(\frac{a - \mu}{\sigma} \le Z \le \frac{b - \mu}{\sigma}\right)$$

Esperança i Variància com a Paràmetres

  • Estadístics (Mostra): $\bar{x}$, $s^2$, $s$
  • Paràmetres (Població): $\mu$ (Esperança/Mitjana), $\sigma^2$, $\sigma$

Paràmetres per a la Distribució Binomial

  • Esperança: $\mu = N \cdot p$
  • Desviació Típica: $\sigma = \sqrt{Npq}$

Exemple de Càlcul Binomial

Mostra: $N=10$. $p=0,04$ (tenen grip), $q=0,96$ (no tenen grip).

Calcular la probabilitat que almenys 2 tinguin grip ($P(X \ge 2)$):

$$P(X \ge 2) = 1 - (P(X=0) + P(X=1))$$

$$P(X \ge 2) = 1 - \left[ \binom{10}{0} 0,04^0 0,96^{10} + \binom{10}{1} 0,04^1 0,96^9 \right]$$

Estandardització i Ús de la Taula Z

Correcció de Continuïtat

Quan es passa d'una distribució discreta a una contínua (Normal), s'aplica la correcció de continuïtat.

Exemple: $P(X \le 20050)$ es transforma a $P(-0,5 \le X \le 20050,5)$ per a la normalització.

El valor $Z$ es busca a la taula: $Z = \frac{x - \mu}{\sigma}$.

Interpretació de la Taula Z

  • Si es demana $P(X \le x)$ (o $Z \le z$): El resultat és directament el valor de la taula.
  • Si es demana $P(X > x)$ (o $Z > z$): El resultat és $1 - (\text{valor de la taula})$.

Càlcul d'Intervals de Probabilitat

Per trobar l'interval simètric $P(L_1 \le X \le L_2) = 0,9$:

Es busca el valor $Z$ corresponent a la probabilitat acumulada (si $0,9$, es busca $0,95$ a la taula, resultant $Z = 1,64$).

Els valors crítics són $-1,64$ i $1,64$.

Per trobar els límits $X$: $X = Z\sigma + \mu$

Distribució T d'Student i Intervals de Confiança

Interval de Confiança per a la Mitjana ($\mu$)

  1. Calcular la mitjana mostral ($\bar{x}$) i la desviació típica mostral ($s$).
  2. Determinar el nivell de significació i trobar el valor crític $t_{\alpha/2, (n-1)}$ a la taula T d'Student (Graus de llibertat: $n-1$).

    Exemple: Per a un 95% de confiança, la probabilitat acumulada és $0,975$.

  3. Calcular els Límits de Confiança:

    $$Límits = \bar{x} \pm t_{\text{crític}} \cdot \left(\frac{s}{\sqrt{n}}\right)$$

    On $\frac{s}{\sqrt{n}}$ és l'Error Mostral.

Interval de Confiança per a Proporcions ($p$)

S'utilitza quan no es coneix $p$, però sí $X$ (èxits) i $N$ (mostra).

L'estadístic de proporció mostral és $\hat{p} = X/N$.

Límits de Confiança (basat en la Normal Estàndard $N(0,1)$):

$$Límits = \hat{p} \pm Z_{\alpha/2} \cdot \sqrt{\frac{\hat{p}(1-\hat{p})}{N}}$$

El resultat indica que la proporció poblacional $p$ pertany a l'interval $(L^-; L^+)$.

Tests d'Hipòtesis

Comparació de Mitjanes ($\mu$)

Hipòtesi Nul·la ($H_0$): $\mu_1 = \mu_2$

  • Mostres Independents:
    • Si se suposa igualtat de variàncies (Homoscedasticitat): Test T d'Student.
    • Si no se suposa igualtat de variàncies: Test de Welch.
  • Mostres Aparellades: $H_0: \mu_{\text{diferència}} = 0$. (S'assumeix $X \sim N(\mu; \sigma)$).

Test 1: Prova T per a Mostres Independents

  1. Hipòtesi Nul·la: $H_0$: Igualtat de mitjanes.
  2. Càlcul de l'Estadístic de Test ($t_{\text{exp}}$):

    $$t_{\text{exp}} = \frac{\bar{x}_1 - \bar{x}_2}{S_a \cdot \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}$$

    On $S_a$ és la desviació típica combinada (pooled standard deviation), calculada amb els graus de llibertat ($n_1 + n_2 - 2$). Es compara amb el valor crític $t_c$ (taula).

  3. Decisió:
    • Si $|t_{\text{exp}}| \le t_c$: Acceptem $H_0$ (AHo).
    • Si $|t_{\text{exp}}| > t_c$: Rebutgem $H_0$ (RHo).

Test 2: Prova F (Comparació de Variàncies)

S'utilitza per comprovar l'homoscedasticitat.

  1. Hipòtesi Nul·la: $H_0$: Igualtat de variàncies (Homoscedasticitat).
  2. Càlcul de l'Estadístic de Test ($F_{\text{exp}}$):

    $$F_{\text{exp}} = \frac{s^2_{\text{gran}}}{s^2_{\text{petit}}}$$

    Es compara amb el valor crític $F_c$ (taula), utilitzant els graus de llibertat del numerador (variància gran) i del denominador (variància petita).

Test 3: Prova T per a Mostres Aparellades

Aquest test redueix l'error degut a la variabilitat entre individus.

$$t_{\text{exp}} = \frac{\bar{x}_{\text{dif}} - \mu_0}{s_d / \sqrt{n_d}}$$

Si s'accepta $H_0$, les mitjanes són homologables. És crucial buscar el p-valor per a una decisió més precisa.

Entradas relacionadas: