Fundamentos de Regresión Lineal y Distribución de Wishart: Conceptos Clave
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en
con un tamaño de 3,63 KB
Supuestos del Modelo de Regresión Lineal Simple
- Linealidad: La relación entre x e y debe ser aproximadamente lineal. Si no se cumple, el modelo está mal especificado.
- Homocedasticidad: La varianza de los errores es constante. Si no se cumple, las inferencias (intervalos y tests) pueden ser incorrectas.
- Normalidad de los errores: Los errores deben seguir una distribución normal, lo cual es fundamental para construir intervalos y realizar contrastes.
Intervalo de Confianza vs. Intervalo de Predicción
- Intervalo de confianza: Estima el valor medio esperado de Y para un valor dado de X.
- Intervalo de predicción: Estima una nueva observación individual de Y. Es más amplio porque incluye tanto la incertidumbre de la media como la variabilidad individual de los datos.
Influencia de la Matriz de Covarianzas
La matriz de covarianzas determina la dispersión, forma y orientación de la distribución:
- Las varianzas controlan la extensión en cada eje.
- Las covarianzas determinan la inclinación de las elipses. Si hay covarianza positiva, las variables tienden a crecer conjuntamente y la elipse se inclina en esa dirección.
Rol de α0 = ∑α
El parámetro α0 controla la concentración de la distribución:
- Valores grandes implican menor varianza y proporciones más estables.
- Valores pequeños implican mayor dispersión y más variabilidad en las proporciones.
Fórmulas Estadísticas
- Var[x1x2] = v22 - (v21² / v11)
- Var(xi) = (ai(a0 + ai)) / (a0²(a0 + 1))
Distribución de Wishart
La distribución de Wishart describe la distribución de matrices de covarianzas muestrales. Es la extensión multivariante de la distribución chi-cuadrado y se utiliza para modelar la variabilidad de matrices de covarianza.
Condiciones de la Matriz de Wishart
Debe ser una matriz cuadrada, simétrica y definida positiva (o semidefinida positiva).
Conceptos Avanzados de Estadística
- Homogeneidad vs. Kurtosis: La homogeneidad mide la similitud o concentración de los datos (baja dispersión). La kurtosis describe la forma de la distribución, especialmente la concentración en torno a la media y el peso de las colas.
- Pearson vs. Spearman: Pearson mide la relación lineal entre variables; Spearman mide la relación monótona usando rangos, siendo más robusto ante valores atípicos y relaciones no lineales.
- Supuesto de linealidad: Se asume linealidad si los errores no son significativos.
- Reducción de incertidumbre: Conocer x1 reduce la incertidumbre sobre x2 cuando ambas variables están relacionadas. Si existe correlación, el valor de x1 ayuda a predecir mejor x2, disminuyendo la varianza condicional.
Formulario de Regresión
- b1 = (Σ(x - media_x) * (y - media_y)) / Σ(x - media_x)²
- b0 = media_y - b1 * media_x
- SSR = Σ(ei²)
- Leverage = 2p / n
- R² = SSR / SST
- SST = Σ(y - media_y)²
- SSR = Σ(ypred - media_y)²
- SSE = Σ(y - ypred)²
- E[x1x2] = media2 - (v21 / v11) * (x1 - media1)