Estadística Inferencial: Muestreo, Estimación y Distribuciones
Enviado por Programa Chuletas y clasificado en Matemáticas
Escrito el en español con un tamaño de 14,31 KB
1. Reducción del Error Estándar de la Media
Una muestra de tamaño 100 tiene un error estándar de la media de 30. ¿Qué habría que hacer para reducir este error estándar a 15?
Datos iniciales:
- Tamaño de la muestra inicial (n₁): 100
- Error estándar de la media inicial (SE₁): 30
Sabemos que el error estándar de la media se calcula como SE = σ/√n, donde σ es la desviación típica poblacional.
A partir de los datos iniciales, podemos estimar σ:
$$ SE_1 = \frac{\sigma}{\sqrt{n_1}} \Rightarrow 30 = \frac{\sigma}{\sqrt{100}} \Rightarrow 30 = \frac{\sigma}{10} \Rightarrow \sigma = 300 $$
Ahora, queremos reducir el error estándar a 15 (SE₂ = 15) manteniendo la misma desviación típica poblacional (σ = 300). Necesitamos encontrar el nuevo tamaño de muestra (n₂):
$$ SE_2 = \frac{\sigma}{\sqrt{n_2}} \Rightarrow 15 = \frac{300}{\sqrt{n_2}} $$
$$ \sqrt{n_2} = \frac{300}{15} $$
$$ \sqrt{n_2} = 20 $$
$$ n_2 = 20^2 $$
$$ n_2 = 400 $$
Conclusión: Habría que aumentar el tamaño de la muestra a 400 para reducir el error estándar de la media a 15.
3. Construcción del Intervalo de Confianza para la Media Poblacional (μ)
El intervalo de confianza para la media poblacional (μ) se construye a partir de la distribución muestral de la media (X̄).
La fórmula general para un intervalo de confianza del (1-α)% para la media, cuando la desviación típica poblacional (σ) es conocida, es:
$$ IC(\mu) = \left( \bar{X} - Z_{\alpha/2} \frac{\sigma}{\sqrt{n}}, \bar{X} + Z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \right) $$
La derivación de este intervalo se basa en la probabilidad de que la media muestral (X̄) caiga dentro de un cierto rango alrededor de la media poblacional (μ):
$$ P\left( -Z_{\alpha/2} \le \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \le Z_{\alpha/2} \right) = 1-\alpha $$
Multiplicando por el error estándar (σ/√n):
$$ P\left( -Z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \le \bar{X} - \mu \le Z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \right) = 1-\alpha $$
Restando X̄ a todos los términos:
$$ P\left( -\bar{X} - Z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \le -\mu \le -\bar{X} + Z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \right) = 1-\alpha $$
Multiplicando por -1 e invirtiendo las desigualdades:
$$ P\left( \bar{X} - Z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \le \mu \le \bar{X} + Z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \right) = 1-\alpha $$
Este es el intervalo de confianza para μ.
Casos Especiales para el Intervalo de Confianza de la Media:
- Varianza poblacional (σ²) desconocida y tamaño de muestra (n) grande (n ≥ 30):
En este caso, la desviación típica poblacional (σ) se sustituye por la desviación típica muestral (s o S). La distribución sigue siendo aproximadamente normal debido al Teorema Central del Límite.$$ IC(\mu) = \left( \bar{X} - Z_{\alpha/2} \frac{s}{\sqrt{n}}, \bar{X} + Z_{\alpha/2} \frac{s}{\sqrt{n}} \right) $$
- Varianza poblacional (σ²) desconocida y tamaño de muestra (n) pequeño (n < 30):
Además de sustituir σ por la desviación típica muestral (s o S), se cambiaría el valor crítico de la distribución normal estándar (Z) por el de una distribución t de Student con n-1 grados de libertad (tn-1, α/2).$$ IC(\mu) = \left( \bar{X} - t_{n-1, \alpha/2} \frac{s}{\sqrt{n}}, \bar{X} + t_{n-1, \alpha/2} \frac{s}{\sqrt{n}} \right) $$
5. Resumen de Distribuciones Muestrales y Tipos de Inferencia
A continuación, se presenta una tabla que resume las características clave de las distribuciones muestrales para diferentes parámetros de interés y condiciones:
Parámetro de Interés | Condiciones de la Muestra | Distribución Poblacional | Estadístico Muestral | Distribución del Estadístico | Tipo de Inferencia Común |
---|---|---|---|---|---|
μ (Media) | n ≥ 30 (tamaño grande) σ² conocida | X → N(μ, σ) | X̄ = Σxᵢ/n | X̄ → N(μ, σ/√n) | Intervalo de Confianza (I.C.) Contraste de Hipótesis |
μ (Media) | n ≥ 30 (tamaño grande) σ² desconocida | X → N(μ, σ) | X̄ = Σxᵢ/n | X̄ → N(μ, s/√n) (aproximado) | I.C. Contraste de Hipótesis |
μ (Media) | n < 30 (tamaño pequeño) σ² desconocida | X → N(μ, σ) | X̄ = Σxᵢ/n | t = (X̄ - μ) / (s/√n) → tn-1 | I.C. Contraste de Hipótesis |
σ² (Varianza) | Cualquier n μ desconocida | X → N(μ, σ) | S² = Σ(xᵢ - X̄)² / (n-1) | (n-1)S²/σ² → χ²n-1 | I.C. Contraste de Hipótesis |
6. Características de las Observaciones Muestrales (X₁, X₂,...,Xₙ)
Las observaciones muestrales (X₁, X₂,...,Xₙ) presentan dos consideraciones principales, dependiendo del momento en que se analizan:
- Antes de extraer la muestra:
Cada observación muestral (Xᵢ) es una variable aleatoria. Como variables aleatorias, presentan las siguientes características:- Cada Xᵢ sigue un modelo de distribución de probabilidad específico.
- Cada Xᵢ tiene unos parámetros fundamentales (por ejemplo, media μ y varianza σ²).
- El modelo y los parámetros de cada Xᵢ son los mismos que los de la población de la que se extrae la muestra.
- Las Xᵢ son variables aleatorias independientes e idénticamente distribuidas (i.i.d.), lo que significa que la extracción de una observación no influye en la probabilidad de las demás, y todas provienen de la misma distribución.
- Después de extraer la muestra:
Una vez que la muestra ha sido extraída, cada observación muestral (xᵢ) es un valor concreto y determinado (un valor empírico o realizado). Por ejemplo, si las observaciones fueran X₁, X₂,...,Xₙ, sus valores concretos podrían ser: x₁=20, x₂=19, ..., xᵢ=20, ..., xₙ=21, respectivamente.
7. Muestreo de una Distribución Normal (n=40)
Consideremos una muestra de tamaño 40 extraída de una distribución Normal.
a) Características de los Estadísticos Muestrales antes de la Extracción de la Muestra
Antes de extraer la muestra, los estadísticos muestrales (como la media muestral X̄ o la varianza muestral S²) son variables aleatorias. Como tales, presentan las siguientes características:
- Cada estadístico muestral sigue un modelo de distribución de probabilidad específico (conocido como distribución muestral).
- Cada estadístico muestral tiene sus propios parámetros fundamentales (por ejemplo, la media de X̄ es μ, y su varianza es σ²/n).
- El modelo de un estadístico muestral depende de tres factores clave:
- El modelo de la población de origen.
- Los parámetros de la población.
- El tamaño de la muestra (n).
b) Cálculo de Probabilidades
Para calcular probabilidades relacionadas con la media muestral (X̄) y la varianza muestral (S²), se utilizan sus respectivas distribuciones muestrales:
- Para la media muestral P(X̄ ≤ x):
Si la población es Normal y la varianza poblacional (σ²) es conocida, o si el tamaño de la muestra es grande (n=40 es grande), la media muestral X̄ sigue una distribución Normal. Se estandariza a una variable Z:$$ P(\bar{X} \le x) = P\left( \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \le \frac{x - \mu}{\sigma/\sqrt{n}} \right) = P\left( Z \le \frac{x - \mu}{\sigma/\sqrt{n}} \right) $$
- Para la varianza muestral P(S² ≥ 8):
Si la población es Normal, el estadístico (n-1)S²/σ² sigue una distribución Chi-cuadrado (χ²) con (n-1) grados de libertad. Para calcular P(S² ≥ 8), se transforma la desigualdad:$$ P(S^2 \ge 8) = P\left( \frac{(n-1)S^2}{\sigma^2} \ge \frac{(n-1) \cdot 8}{\sigma^2} \right) = P\left( \chi^2_{n-1} \ge \frac{(n-1) \cdot 8}{\sigma^2} \right) $$
Esta probabilidad se calcula como:
$$ 1 - P\left( \chi^2_{n-1} < \frac{(n-1) \cdot 8}{\sigma^2} \right) $$
8. Distribución Normal con Varianza Desconocida y Muestra Pequeña (n < 30)
Consideremos una distribución Normal N(μ,σ) donde la desviación típica poblacional (σ) es desconocida y el tamaño de la muestra (n) es pequeño (n < 30).
a) Características de las Observaciones Muestrales (Xᵢ) y Distribución del Estadístico
Para las observaciones muestrales individuales (Xᵢ), las características son las mismas que las descritas en el punto 6: cada Xᵢ es una variable aleatoria independiente e idénticamente distribuida, siguiendo el modelo de la población, es decir, Xᵢ ~ N(μ, σ).
Sin embargo, cuando σ es desconocida y n es pequeña, la distribución del estadístico estandarizado de la media muestral ya no sigue una distribución Normal estándar (Z). En su lugar, se utiliza la distribución t de Student. Esto se debe a que la varianza muestral (S²) utilizada para estimar σ² introduce una variabilidad adicional, especialmente en muestras pequeñas.
El estadístico relevante es:
$$ T = \frac{\bar{X} - \mu}{S/\sqrt{n}} $$
Este estadístico T sigue una distribución t de Student con (n-1) grados de libertad, es decir, T ~ tn-1.
El texto original contenía fragmentos incorrectos como `(x-μ σ÷√n)→n(0,1)` y `(n-1)^s² > 30,` que no corresponden a este escenario. La expresión `(X̄ - μ) / (σ/√n)` es la que sigue una N(0,1) si σ es conocida. Si σ es desconocida, se sustituye por S y se usa la t-Student.
b) Cálculo de Probabilidad para una Observación Individual
Para calcular la probabilidad P(x₈ > μ + 2σ) para una observación individual (x₈) de una distribución N(μ,σ), se estandariza la variable. Dado que x₈ es una observación de la población N(μ,σ), se utiliza la estandarización Z:
$$ P(x_8 > \mu + 2\sigma) = P\left( \frac{x_8 - \mu}{\sigma} > \frac{(\mu + 2\sigma) - \mu}{\sigma} \right) $$
$$ P(x_8 > \mu + 2\sigma) = P\left( Z > \frac{2\sigma}{\sigma} \right) $$
$$ P(x_8 > \mu + 2\sigma) = P(Z > 2) $$
Esta probabilidad se calcula como:
$$ P(Z > 2) = 1 - P(Z \le 2) $$
Donde P(Z ≤ 2) se obtiene de la tabla de la distribución Normal estándar.
9. Cálculo de la Media y Varianza de un Estadístico Lineal
Se nos pide calcular la media (esperanza) y la varianza del estadístico T = (Σi=1n Xi + 5) / n, asumiendo que las Xᵢ son variables aleatorias independientes e idénticamente distribuidas (i.i.d.) con media E[Xᵢ] = μ y varianza Var[Xᵢ] = σ².
Nota: El enunciado original contenía un "30" antes de la sumatoria (30Σ Xi), lo cual, si se mantiene, alteraría significativamente los resultados. Basándonos en el resultado final proporcionado en el documento original (μ + 5/30 y σ²/30), se asume que el estadístico es T = (Σi=1n Xi + 5) / n y que el tamaño de la muestra (n) es 30.
a) Cálculo de la Media (Esperanza) E[T]
Utilizando las propiedades de la esperanza (linealidad):
$$ E\left[ \frac{\sum_{i=1}^{n} X_i + 5}{n} \right] = \frac{1}{n} E\left[ \sum_{i=1}^{n} X_i + 5 \right] $$
$$ = \frac{1}{n} \left( E\left[ \sum_{i=1}^{n} X_i \right] + E[5] \right) $$
$$ = \frac{1}{n} \left( \sum_{i=1}^{n} E[X_i] + 5 \right) $$
Dado que E[Xᵢ] = μ para cada observación:
$$ = \frac{1}{n} \left( \sum_{i=1}^{n} \mu + 5 \right) $$
$$ = \frac{1}{n} (n\mu + 5) $$
$$ = \mu + \frac{5}{n} $$
Si asumimos que n = 30, entonces:
$$ E[T] = \mu + \frac{5}{30} $$
b) Cálculo de la Varianza Var[T]
Utilizando las propiedades de la varianza (Var[cX] = c²Var[X] y Var[X+c] = Var[X]):
$$ Var\left[ \frac{\sum_{i=1}^{n} X_i + 5}{n} \right] = \frac{1}{n^2} Var\left[ \sum_{i=1}^{n} X_i + 5 \right] $$
$$ = \frac{1}{n^2} \left( Var\left[ \sum_{i=1}^{n} X_i \right] + Var[5] \right) $$
Dado que las Xᵢ son independientes, la varianza de la suma es la suma de las varianzas, y Var[5] = 0:
$$ = \frac{1}{n^2} \left( \sum_{i=1}^{n} Var[X_i] + 0 \right) $$
Dado que Var[Xᵢ] = σ² para cada observación:
$$ = \frac{1}{n^2} \left( \sum_{i=1}^{n} \sigma^2 \right) $$
$$ = \frac{1}{n^2} (n\sigma^2) $$
$$ = \frac{\sigma^2}{n} $$
Si asumimos que n = 30, entonces:
$$ Var[T] = \frac{\sigma^2}{30} $$