Regresión Lineal Inferencial: Modelo, Supuestos e Inferencia

Enviado por Programa Chuletas y clasificado en Matemáticas

Escrito el en español con un tamaño de 4,51 KB

Regresión Inferencial

Se denomina regresión inferencial porque las variables involucradas suelen ser continuas y el análisis cubre tanto la estimación por intervalo como los tests de hipótesis.

Método y Justificación

El modelo de regresión inferencial plantea explicar una variable dependiente Y en función de una variable independiente X mediante la forma:

Y = f(x) + E

Donde E representa los errores aleatorios y f(x) puede ser cualquier función. Nos centraremos en las funciones lineales:

f(x) = b₀ + b₁x

El objetivo es estimar este modelo a partir de una muestra (tanto de forma puntual como por intervalo) y analizar su significatividad. Esto se realiza típicamente con software estadístico como SPSS, bajo ciertas condiciones sobre los errores. Específicamente, se requiere que para cada valor de X, los errores Eᵢ sigan una distribución normal con media cero y varianza constante (Eᵢ ~ N(0, σ²)) y sean independientes (lo que se conoce como ruido blanco).

Bajo estas condiciones, se puede estimar la función de regresión poblacional:

µY|x = E[Y|X=x] = b₀ + b₁x

y realizar las inferencias correspondientes.

Condiciones para la Regresión Inferencial

Las condiciones que deben verificarse para poder aplicar la regresión inferencial son:

  • Relación Lineal/Potencial: Para comprobar si la relación es lineal o potencial, basta con observar los gráficos de dispersión. Si los datos se agrupan en torno a una recta, se verifica la hipótesis lineal. Otra forma de comprobar la linealidad es mediante el gráfico de residuos tipificados frente a valores pronosticados tipificados. Si los residuos varían aleatoriamente alrededor de 0, la función lineal es una función de regresión válida.
  • Homoscedasticidad: La varianza de los errores se mantiene constante para todos los valores de X. Se puede verificar observando los gráficos de dispersión y los gráficos de residuos.
  • Normalidad de los Errores: Los errores deben seguir una distribución normal. Esto se verifica con el histograma de residuales o el gráfico P-P. No debe haber valores extremos (residuos tipificados fuera del rango [-3, 3]). Si existen datos extremos, es recomendable considerarlos o eliminarlos, ya que la regresión es muy sensible a ellos.
  • Independencia o Falta de Autocorrelación: Los errores deben ser independientes entre sí. Esto se verifica con el estadístico de Durbin-Watson, que debe ser próximo a 2.

Inferencia bajo las Condiciones Verificadas

Bajo estas condiciones, se pueden realizar las siguientes inferencias:

  1. Estimación Puntual de b₀, b₁ y de la función de regresión.
  2. Significación del Modelo: Verificar si la variable X aporta información estadísticamente relevante para predecir Y, o si, por el contrario, X e Y son linealmente independientes. Esto se realiza mediante un test de hipótesis:
    • H₀: R² = 0 (X e Y son linealmente independientes)
    • H₁: R² ≠ 0 (X aporta información para predecir Y)
  3. Estimación por Intervalo para b₀, para b₁, para la función de regresión y para los valores individuales.

El test de significación del modelo evalúa:

  • H₀: R² = 0 (La relación lineal no es significativa)
  • H₁: R² ≠ 0 (La relación lineal es significativa)

Si el p-valor del test es menor que el nivel de significación α (p-valor < α), se rechaza H₀. Esto implica que la relación lineal entre X e Y es estadísticamente significativa.

Entradas relacionadas: