Conceptes Fonamentals d'Estadística: Distribucions i Tests
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en
catalán con un tamaño de 6,3 KB
Estadística Descriptiva: Mesures Clau
Mesures de Tendència Central
- Moda (Poc sensible)
- Mitjana (Molt sensible)
- Mediana (Robust/Poc sensible)
Mesures de Dispersió
- Rang (Recorregut)
- Rang interquartílic
- Variància
- Desviació Típica (Desv. Típica)
- Coeficient de Variació (CV)
Mesures de Localització
Inclouen Centils (percentils), Decils i Quartils.
Distribució Binomial
Paràmetres: $p + q = 1$.
Notació: $X \sim B(N, p)$
Càlcul de Probabilitat
$$P(X=k) = \binom{n}{k} p^k q^{n-k}$$
Càlcul del Factorial
Exemple: $\binom{10}{3} = \frac{10!}{3! \cdot 7!}$
Casos especials del factorial:
- $\binom{n}{0} = 1$
- $\binom{n}{1} = N$
- $\binom{n}{2} = \frac{N(N-1)}{2}$
Distribució Normal
Notació: $X \sim N(\mu; \sigma)$
Funció de Densitat
La funció de densitat $f(x)$ no pot ser negativa i l'àrea sota la corba és 1. La integral de $f(x) \cdot x = \mu$.
Fórmula (simplificada): $$f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{1}{2} \left(\frac{x-\mu}{\sigma}\right)^2}$$
Distribució Normal Estàndard (Z)
Notació: $Z \sim N(\mu=0, \sigma=1)$
S'utilitza per estandarditzar quan es compleixen les condicions (per exemple, $N \ge 30$, $Nq \ge 5$, $Np \ge 5$).
Fórmula d'Estandardització
$$Z = \frac{x - \mu}{\sigma}$$
Exemple de càlcul de probabilitat:
$$P(a \le X \le b) = P\left(\frac{a - \mu}{\sigma} \le Z \le \frac{b - \mu}{\sigma}\right)$$
Esperança i Variància com a Paràmetres
- Estadístics (Mostra): $\bar{x}$, $s^2$, $s$
- Paràmetres (Població): $\mu$ (Esperança/Mitjana), $\sigma^2$, $\sigma$
Paràmetres per a la Distribució Binomial
- Esperança: $\mu = N \cdot p$
- Desviació Típica: $\sigma = \sqrt{Npq}$
Exemple de Càlcul Binomial
Mostra: $N=10$. $p=0,04$ (tenen grip), $q=0,96$ (no tenen grip).
Calcular la probabilitat que almenys 2 tinguin grip ($P(X \ge 2)$):
$$P(X \ge 2) = 1 - (P(X=0) + P(X=1))$$
$$P(X \ge 2) = 1 - \left[ \binom{10}{0} 0,04^0 0,96^{10} + \binom{10}{1} 0,04^1 0,96^9 \right]$$
Estandardització i Ús de la Taula Z
Correcció de Continuïtat
Quan es passa d'una distribució discreta a una contínua (Normal), s'aplica la correcció de continuïtat.
Exemple: $P(X \le 20050)$ es transforma a $P(-0,5 \le X \le 20050,5)$ per a la normalització.
El valor $Z$ es busca a la taula: $Z = \frac{x - \mu}{\sigma}$.
Interpretació de la Taula Z
- Si es demana $P(X \le x)$ (o $Z \le z$): El resultat és directament el valor de la taula.
- Si es demana $P(X > x)$ (o $Z > z$): El resultat és $1 - (\text{valor de la taula})$.
Càlcul d'Intervals de Probabilitat
Per trobar l'interval simètric $P(L_1 \le X \le L_2) = 0,9$:
Es busca el valor $Z$ corresponent a la probabilitat acumulada (si $0,9$, es busca $0,95$ a la taula, resultant $Z = 1,64$).
Els valors crítics són $-1,64$ i $1,64$.
Per trobar els límits $X$: $X = Z\sigma + \mu$
Distribució T d'Student i Intervals de Confiança
Interval de Confiança per a la Mitjana ($\mu$)
- Calcular la mitjana mostral ($\bar{x}$) i la desviació típica mostral ($s$).
- Determinar el nivell de significació i trobar el valor crític $t_{\alpha/2, (n-1)}$ a la taula T d'Student (Graus de llibertat: $n-1$).
Exemple: Per a un 95% de confiança, la probabilitat acumulada és $0,975$.
- Calcular els Límits de Confiança:
$$Límits = \bar{x} \pm t_{\text{crític}} \cdot \left(\frac{s}{\sqrt{n}}\right)$$
On $\frac{s}{\sqrt{n}}$ és l'Error Mostral.
Interval de Confiança per a Proporcions ($p$)
S'utilitza quan no es coneix $p$, però sí $X$ (èxits) i $N$ (mostra).
L'estadístic de proporció mostral és $\hat{p} = X/N$.
Límits de Confiança (basat en la Normal Estàndard $N(0,1)$):
$$Límits = \hat{p} \pm Z_{\alpha/2} \cdot \sqrt{\frac{\hat{p}(1-\hat{p})}{N}}$$
El resultat indica que la proporció poblacional $p$ pertany a l'interval $(L^-; L^+)$.
Tests d'Hipòtesis
Comparació de Mitjanes ($\mu$)
Hipòtesi Nul·la ($H_0$): $\mu_1 = \mu_2$
- Mostres Independents:
- Si se suposa igualtat de variàncies (Homoscedasticitat): Test T d'Student.
- Si no se suposa igualtat de variàncies: Test de Welch.
- Mostres Aparellades: $H_0: \mu_{\text{diferència}} = 0$. (S'assumeix $X \sim N(\mu; \sigma)$).
Test 1: Prova T per a Mostres Independents
- Hipòtesi Nul·la: $H_0$: Igualtat de mitjanes.
- Càlcul de l'Estadístic de Test ($t_{\text{exp}}$):
$$t_{\text{exp}} = \frac{\bar{x}_1 - \bar{x}_2}{S_a \cdot \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}$$
On $S_a$ és la desviació típica combinada (pooled standard deviation), calculada amb els graus de llibertat ($n_1 + n_2 - 2$). Es compara amb el valor crític $t_c$ (taula).
- Decisió:
- Si $|t_{\text{exp}}| \le t_c$: Acceptem $H_0$ (AHo).
- Si $|t_{\text{exp}}| > t_c$: Rebutgem $H_0$ (RHo).
Test 2: Prova F (Comparació de Variàncies)
S'utilitza per comprovar l'homoscedasticitat.
- Hipòtesi Nul·la: $H_0$: Igualtat de variàncies (Homoscedasticitat).
- Càlcul de l'Estadístic de Test ($F_{\text{exp}}$):
$$F_{\text{exp}} = \frac{s^2_{\text{gran}}}{s^2_{\text{petit}}}$$
Es compara amb el valor crític $F_c$ (taula), utilitzant els graus de llibertat del numerador (variància gran) i del denominador (variància petita).
Test 3: Prova T per a Mostres Aparellades
Aquest test redueix l'error degut a la variabilitat entre individus.
$$t_{\text{exp}} = \frac{\bar{x}_{\text{dif}} - \mu_0}{s_d / \sqrt{n_d}}$$
Si s'accepta $H_0$, les mitjanes són homologables. És crucial buscar el p-valor per a una decisió més precisa.