Fundamentos del Modelo Lineal de Regresión Múltiple y Mínimos Cuadrados Ordinarios

Enviado por Francisco Jose y clasificado en Matemáticas

Escrito el en español con un tamaño de 3,18 KB

El Modelo Lineal de Regresión Múltiple

El modelo lineal uniecuacional múltiple estudia la relación lineal entre una variable dependiente Y y más de una variable independiente Xi, sumado a un término aleatorio.

El objetivo principal es estimar las cantidades constantes presentes en el modelo, así como evaluar la bondad de la estimación realizada.

Supuestos del Modelo

La perturbación aleatoria está centrada, es homocedástica e incorrelada. Asimismo, no existe relación entre las variables independientes y la perturbación aleatoria.

Mínimos Cuadrados Ordinarios (MCO)

La expresión fundamental es: Y = f(x) = β1 + β2Xt + Ut, donde el residuo se define como et = Yt - Ŷt.

Los errores o residuos representan la diferencia entre los valores observados de la variable dependiente y su estimación (e = y - ŷ).

Consecuencias de la estimación:

  • Xt * e = 0
  • It * e = 0
  • It * y = It * ŷ
  • ŷt * e = 0

Teorema de Gauss-Markov

Los estimadores de mínimos cuadrados ordinarios son lineales, insesgados y óptimos (ELIO), lo que significa que poseen varianza mínima dentro de la clase de estimadores lineales e insesgados. La fórmula es: β' = (XtX)-1 * Xty.

Insesgamiento

Los estimadores se distribuyen alrededor del parámetro desconocido. Se exige que la media del estimador sea igual al parámetro desconocido: E[β] = β.

Bondad del Ajuste

Coeficiente de Determinación (R²)

Es la medida para estudiar la bondad del ajuste lineal determinado por los estimadores MCO. Representa el porcentaje de variabilidad explicada por el modelo y se obtiene como el cociente entre la varianza explicada por la estimación y la varianza total.

SCT = SCE + SCR, por lo tanto, SCE = SCT - SCR.

R² = SCE / SCT = (SCT - SCR) / SCT = 1 - (SCR / SCT)

Coeficiente de Determinación Corregido

El ajustado mide el porcentaje de variación de la variable dependiente considerando el número de variables incluidas en el modelo; es decir, penaliza la inclusión excesiva de variables.

ajustado = 1 - (1 - R²) * (n - 1 / n - k)

Criterios de Selección de Modelos

Para evitar que el valor del coeficiente aumente artificialmente al añadir nuevas variables explicativas, se utilizan los siguientes criterios:

  • AIC: Criterio de Información de Akaike.
  • BIC: Criterio de Información de Schwarz.
  • HQC: Criterio de Hannan-Quinn.

Estos criterios se obtienen a partir de la suma de cuadrados de los residuos y un factor que penaliza la inclusión de parámetros. Un modelo con más variables explicativas reduce la suma de los cuadrados de los residuos, pero aumenta el factor de penalización.

Entradas relacionadas: