Fundamentos de Validez Criterial y Regresión Lineal Múltiple
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en español con un tamaño de 6,16 KB
Validez Criterial
Supuestos para Inferencias
Para realizar inferencias válidas, se deben considerar los siguientes supuestos:
- Especificación correcta del modelo: En el caso de un único predictor, esto implica la linealidad de la relación.
- Variables medidas sin error: Se asume que las variables han sido medidas con precisión.
- Supuestos sobre el error:
- Esperanza matemática nula.
- Homocedasticidad de los valores de X (varianza constante del error para todos los niveles del predictor).
- Independencia de los errores o de las observaciones.
Fases de Inferencia
Las inferencias se realizan en dos fases principales:
- Sobre el modelo global: Se evalúa si el modelo reduce los errores que se cometerían en su ausencia.
- Sobre los coeficientes: Se contrastan hipótesis específicas:
- Hipótesis Nula (H0): β1 = 0 (el coeficiente no es significativamente diferente de cero).
- Hipótesis Alternativa (H1): β1 ≠ 0 (el coeficiente es significativamente diferente de cero).
Los estadísticos de contraste utilizados son: T(β0) = b0/sb0 y T(β1) = b1/sb1. Estos estadísticos siguen una distribución T de Student con los grados de libertad de la Media Cuadrática Residual (MCRes).
Intervalos de Confianza (I.C.)
Los intervalos de confianza se utilizan para:
- Estimación global: Basada en el error típico de estimación.
- Predicciones individuales.
Factores que Afectan la Validez
Diversos factores pueden influir en la validez de las inferencias:
Fiabilidad
Las variaciones en la validez pueden depender de si se mantiene o no el coeficiente de fiabilidad o el punto de criterio.
Longitud
La validez puede depender de la longitud (representada por k).
Variabilidad del Grupo
La validez se ve afectada por la variabilidad dentro de los grupos:
- Cuando se conocen las varianzas en los grupos de las variables directamente selectivas (aquellas con las que se realiza la selección).
- Cuando se conocen las varianzas en los dos grupos de las variables incidentalmente selectivas (aquellas en las que no se realiza selección, pero cuya variabilidad también se ve reducida).
- Para un grupo con puntuaciones en ambas variables (en minúsculas: varianzas, error típico de estimación, coeficiente de validez conocido rxy, pendiente de la recta Y sobre X → rxy = sy/sx).
- Para un grupo con puntuaciones en una de las variables con coeficiente de validez desconocido (similar a lo anterior, pero con notación en mayúsculas).
Supuestos Adicionales
Otros supuestos importantes incluyen:
- Igualdad de pendientes en los grupos.
- Homocedasticidad de la varianza del error.
Generalización de la Validez
La generalización de la validez implica "aplicar la evidencia de validez obtenida en una o más situaciones a otras situaciones similares sobre la base de estimación simultánea, meta-análisis o de argumentos de validación sintética". Este proceso puede ser ilustrado mediante una tabla de Verdaderos/Falsos positivos/negativos.
Regresión Lineal Múltiple
Conceptos Fundamentales
- Variable Criterio (Y)
- La variable que se desea predecir o explicar.
- Variable Pronosticada (Y')
- El valor predicho de la variable criterio basado en el modelo de regresión.
- Error de Estimación (Y - Y')
- La diferencia entre el valor observado de la variable criterio y su valor pronosticado.
- Error Típico de Estimación
- La desviación típica de los errores de estimación, que indica la precisión de las predicciones.
- Coeficientes de Regresión (b)
- Representan la relación entre las variables predictoras y la variable criterio.
b0
: La constante de la recta de regresión (intersección con el eje Y).bi
(para i > 0): Los pesos que expresan los cambios que se producen en la variable criterio (Y) con cambios unitarios en la correspondiente variable predictora (Xi), manteniendo constantes las restantes variables predictoras.
Modelos de Regresión
En la regresión lineal múltiple, la variable predictora X deja de ser única y se convierte en un conjunto de variables predictoras, representadas por un vector o una ecuación de regresión lineal múltiple.
Inferencia en Regresión Múltiple
La inferencia en regresión múltiple se realiza de la siguiente manera:
- La inferencia sobre la significación global de la ecuación se lleva a cabo con el estadístico F = MCreg / MCres, donde los grados de libertad varían según el modelo.
- Los contrastes de hipótesis sobre los coeficientes (antes representados por a y b, y ahora por los diferentes bs) se ponen a prueba mediante estadísticos t similares a los ya explicados. Habrá más contrastes puesto que hay más variables predictoras.
- El coeficiente de correlación se denomina coeficiente de correlación múltiple (RYY') y representa la correlación entre la variable criterio (Y) y la variable pronosticada (Y').
- El coeficiente de determinación múltiple (R2YY') es el coeficiente de correlación múltiple al cuadrado. Representa la proporción de variación de Y explicada por las variables predictoras.
- Proporción explicada: R2YY' = SCR / SCT
- Proporción de variación no explicada: SCE / SCT
- También se cumple que: R2YY' = 1 – SCE / SCT