Fundamentos de Regresión Lineal: Variables Dummy, Estimadores y Supuestos
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en
con un tamaño de 3,04 KB
Regresión lineal con variables Dummy
Las variables dummy se utilizan cuando en la regresión lineal se incluyen variables cualitativas, como el sexo o la zona de residencia. Esto implica que, en las ecuaciones, los coeficientes correspondientes a cada variable se multiplican por el valor de la respuesta asignado:
- 1: Presencia de la característica.
- 0: Referencia o ausencia en la ecuación.
Si existen más de dos categorías de respuesta, se incluyen todas con el valor 0, asignando el valor 1 únicamente a la categoría que corresponde.
Estimaciones MICO: Estimación de coeficientes beta
Teorema de Gauss-Markov
Para que el modelo presente coeficientes beta óptimos, debe cumplir con dos condiciones fundamentales:
- Insesgados: Las estimaciones deben aproximarse al parámetro poblacional (valor real).
- Eficientes: Su varianza se aproxima al parámetro poblacional.
Estimadores MELI
Los estimadores MELI (Mejores Estimadores Lineales Insesgados) requieren el cumplimiento de nueve supuestos para garantizar la calidad de los coeficientes. Estos se basan en la distribución del error, el cual debe cumplir lo siguiente:
- Distribución normal: De lo contrario, aumenta la varianza entre estimadores.
- Media cero: Dado que el error se incluye en la ecuación, su media debe ser cero para no modificar el intercepto (el valor donde se intersecta el eje Y), ya que el modelo de regresión no busca explicar el error.
Además, se debe considerar que:
- Las variables x no son fijas; si lo son, están distribuidas de forma independiente al error.
- Parsimonia: Es el principio de simpleza. Su función es explicar más con menos variables, recurriendo siempre a la teoría.
- Bondad de ajuste (R cuadrado): Representa el porcentaje de variación de la variable dependiente explicada por la variable independiente. Debe poseer poder explicativo.
- Poder predictivo: El modelo debe corroborarse con la experiencia. Se debe verificar que la forma funcional sea lineal, realizando una variación funcional para incluir la variable.
Errores comunes en la especificación
- Error de sobreespecificación: Se agregan variables no relevantes al modelo.
- Error de subespecificación: Se excluyen variables relevantes del modelo.
Consideraciones para una estimación precisa
- Multicolinealidad: Ocurre cuando dos variables independientes utilizadas para explicar una dependiente presentan valores coincidentes. Si esto sucede, no es posible determinar el efecto individual de cada una por separado.
- Endogeneidad: Se presenta cuando no es posible distinguir claramente cuál es la variable dependiente y cuál es la independiente.