Fundamentos de Regresión Lineal: Conceptos, Métricas y Aplicaciones Estadísticas
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en
con un tamaño de 2,88 KB
Regresión Lineal: Predicción y Modelado
La regresión lineal tiene como objetivo principal predecir un fenómeno a partir de variables conocidas.
Dispersión y Ajuste
La dispersión permite cuantificar el grado de relación lineal existente entre dos variables. En una situación ideal, todos los puntos se encontrarían sobre una línea recta. La recta de regresión es aquella que hace mínima la suma de cuadrados de las distancias verticales entre cada punto y la recta.
Métricas de Evaluación
- R-cuadrado (R²): Si es 1, la relación es perfecta; si es 0, las variables son independientes.
- R² Corregida: Explica la varianza de la variable dependiente (VD).
- Error típico: Es la desviación típica de los residuos. Cuanto más pequeño sea, mejores serán los pronósticos y el ajuste de la recta en la nube de puntos.
Objetivos del Modelo
- Ver en qué medida la VD está explicada por las variables independientes (VI).
- Obtener predicciones en la VD a partir de las VI.
Interpretación de Resultados
ANOVA y Significatividad
El ANOVA sirve para contrastar la hipótesis de que la pendiente de la recta es cero. Si la Sig. es 0, la relación lineal es significativa entre la VD y el conjunto de VI.
Coeficientes
- Coeficientes no estandarizados (B): Representan el número de unidades que aumenta la VD por cada unidad que aumenta la VI, manteniendo constantes todas las demás VI.
- Beta (Coeficientes estandarizados): El valor más alto indica mayor importancia, expresado en unidades típicas de desviación.
Correlaciones y Colinealidad
- Correlación parcial: Relación existente entre variables tras eliminar de ambas el efecto de terceras.
- Correlación semiparcial: Grado de relación entre la VD y la parte de cada VI que no está explicada por el resto de las VI.
- No colinealidad: Indica que no hay relación lineal exacta entre las VI. La colinealidad es un problema, ya que impide estimar correctamente los coeficientes de la ecuación.
- Tolerancia: Proporción de la varianza de la VI que no depende del resto de VI. Una tolerancia de 0.01 significa que comparte un 99% de su varianza con el resto.
Supuestos del Modelo
- Independencia de los residuos: Se evalúa mediante el estadístico de Durbin-Watson (valores entre 1.95 y 2.5 indican independencia).
- Homocedasticidad: Se analiza mediante la relación entre ZRESID (residuo tipificado) y ZPRED (pronóstico tipificado).