Conceptos Fundamentales de Estadística y Probabilidad Aplicada
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en español con un tamaño de 199,17 KB
1. Teorema Central del Límite
Consideremos un **conjunto de variables aleatorias** X₁, X₂, ..., Xn, independientes y todas ellas con la misma distribución, de media **μ** y varianza **σ²**. Entonces, si n ≥ 30 (tamaño de muestra suficientemente grande), la variable de la media muestral (X̄) sigue una distribución **Normal** N(μ, σ²/n).
2. Nivel de Significación en Contraste de Hipótesis
¿Qué mide el **nivel de significación** de un contraste de hipótesis? Mide la **probabilidad máxima** de cometer un **error de Tipo I**, es decir, rechazar la hipótesis nula (H₀) cuando esta es verdadera. Representa el **riesgo** que el investigador asume al tomar la decisión de rechazar H₀.
3. Influencia del Tamaño de la Muestra en el Error
¿Cómo influye el tamaño de la muestra en el error cometido? Al aumentar el **tamaño de la muestra**, disminuye el **error** cometido.
4. Distribución de Poisson y Exponencial
Número de llamadas en un móvil: Distribución de Poisson con una tasa de 2 llamadas por hora. a) Define la variable exponencial asociada. ¿Qué modelo concreto sigue?
La variable exponencial asociada a esta situación es la que nos mide el **tiempo transcurrido** hasta la primera llamada o entre dos llamadas consecutivas. Sigue un modelo **Exponencial con parámetro λ = 2** (horas⁻¹).
5. Contraste de Wilcoxon para Salarios
Para saber si el salario neto de los trabajadores no pasa de 1000 euros, se propone un contraste de Wilcoxon. ¿Razones para aplicar este contraste? ¿Hipótesis?
Razón para aplicar Wilcoxon:
Al hacer el test de **Shapiro-Wilk** para contrastar la normalidad de los datos, rechazamos H₀ (la hipótesis de normalidad) y, por lo tanto, aplicamos un **contraste de Wilcoxon** para la mediana, ya que es una prueba no paramétrica adecuada para datos no normales.
Hipótesis:
- **H₀:** La mediana del salario es igual o menor a 1000 euros (Mediana ≤ 1000 €).
- **H₁:** La mediana del salario es mayor a 1000 euros (Mediana > 1000 €).
6. Distribución de la Diferencia de Variables Aleatorias Normales
¿Distribución de la variable aleatoria X-Y? Utilizo la siguiente propiedad de la distribución normal:
Si X ~ N(μₓ, σₓ²) y Y ~ N(μᵧ, σᵧ²) son variables aleatorias normales e **independientes**, entonces su diferencia X-Y también sigue una distribución normal: **X-Y ~ N(μₓ - μᵧ, σₓ² + σᵧ²)**.
7. Análisis de Salarios: Representatividad y Dispersión
Consideremos 200 trabajadores de un sector laboral; Salario medio: 975 euros; Desviación típica: 280 euros; Salario mediano: 850 euros.
a) Representatividad del salario medio y b) Dispersión relativa del salario.
Para analizar la **representatividad de la media** y la **dispersión relativa**, se calcula el **coeficiente de variación (CV)**:
CV = (Desviación Típica / Media) * 100%
CV = (280 / 975) * 100% ≈ 28.72%
Interpretación del Coeficiente de Variación (CV)
- CV < 40%: Dispersión relativa baja y media muy representativa.
- 40% ≤ CV < 80%: Dispersión relativa moderada, media regularmente representativa.
- 80% ≤ CV < 140%: Dispersión relativa alta, media poco representativa.
- CV ≥ 140%: Dispersión relativa muy alta, media muy poco representativa.
Dado que el CV es aproximadamente 28.72%, que es menor al 40%, podemos concluir que la **dispersión relativa es baja** y la **media es muy representativa** del conjunto de datos.
c) Interpretación del salario mediano
El salario mediano de 850 euros indica que el **50% de los trabajadores gana al menos 850 euros** y el otro **50% gana más de 850 euros**. La diferencia entre la media (975 euros) y la mediana (850 euros), donde la media es mayor que la mediana, sugiere una **asimetría positiva (hacia la derecha)** en la distribución de los salarios.
8. Probabilidad Condicional y Teorema de Bayes
Un proceso está bajo control con un 2% de piezas defectuosas. Si el proceso presenta una anomalía, el 18% de las piezas son defectuosas. El proceso está bajo control el 96% del tiempo.
a) Representa en sucesos y probabilidades los datos:
Sean los sucesos:
- **C:** El proceso está bajo control.
- **Cᶜ:** El proceso tiene una anomalía (no está bajo control).
- **D:** La pieza es defectuosa.
- **Dᶜ:** La pieza no es defectuosa.
Los datos proporcionados son:
- P(D|C) = 0.02 (Probabilidad de pieza defectuosa si el proceso está bajo control)
- P(D|Cᶜ) = 0.18 (Probabilidad de pieza defectuosa si el proceso tiene una anomalía)
- P(C) = 0.96 (Probabilidad de que el proceso esté bajo control)
De esto se deduce que P(Cᶜ) = 1 - P(C) = 1 - 0.96 = 0.04.
b) ¿Probabilidad de que una pieza al azar sea defectuosa?
Para calcular P(D), utilizamos la **Ley de la Probabilidad Total**:
P(D) = P(D|C)P(C) + P(D|Cᶜ)P(Cᶜ)
P(D) = (0.02)(0.96) + (0.18)(0.04)
P(D) = 0.0192 + 0.0072
P(D) = 0.0264
La probabilidad de que una pieza al azar sea defectuosa es del **2.64%**.
c) Se toma una pieza al azar y no es defectuosa; ¿Probabilidad de que el proceso esté descontrolado?
Para calcular P(Cᶜ|Dᶜ), utilizamos el **Teorema de Bayes**:
P(Cᶜ|Dᶜ) = [P(Dᶜ|Cᶜ)P(Cᶜ)] / P(Dᶜ)
Primero, necesitamos P(Dᶜ) y P(Dᶜ|Cᶜ):
- P(Dᶜ) = 1 - P(D) = 1 - 0.0264 = 0.9736
- P(Dᶜ|Cᶜ) = 1 - P(D|Cᶜ) = 1 - 0.18 = 0.82
Ahora, sustituimos en la fórmula de Bayes:
P(Cᶜ|Dᶜ) = (0.82 * 0.04) / 0.9736
P(Cᶜ|Dᶜ) = 0.0328 / 0.9736
P(Cᶜ|Dᶜ) ≈ 0.03369
La probabilidad de que el proceso esté descontrolado, dado que la pieza no es defectuosa, es aproximadamente del **3.37%**.
9. Regresión Lineal y Coeficientes
Modelo de regresión: y = -31 + 0.47x con R² = 0.54
a) Coeficiente de Correlación Lineal e Interpretación
El **coeficiente de determinación (R²)** es 0.54. Esto significa que el **54% de la variabilidad total de la variable dependiente (Y)** es explicada por el modelo de regresión lineal a través de la variabilidad de la variable independiente (X).
El **coeficiente de correlación lineal (R)** se calcula como la raíz cuadrada de R². Dado que el coeficiente de regresión (la pendiente) es positivo (0.47), R también será positivo:
R = √0.54 ≈ 0.735
Esto indica una **correlación lineal positiva y moderadamente fuerte** entre X e Y.
b) Coeficiente de Regresión e Interpretación
El **coeficiente de regresión (b₁)** es 0.47.
Esto significa que, por cada **unidad de aumento en X**, se espera que **Y aumente en 0.47 unidades**.
En el contexto dado, si X representa las horas de trabajo (en miles de horas) y Y los ingresos (en millones de euros), un aumento de 1000 horas de trabajo al año (es decir, una unidad en X) se asocia con un aumento esperado de 0.47 millones de euros en los ingresos.