Fundamentos de Econometría Avanzada: Modelos Clave y Corrección de Sesgos
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en
español con un tamaño de 6,95 KB
I. Ecuaciones Simultáneas y Endogeneidad
El problema central en la estimación de sistemas de ecuaciones es la endogeneidad por simultaneidad, donde $\text{Cov}(X, \text{error}) \neq 0$. Esto provoca que el estimador de Mínimos Cuadrados Ordinarios (MCO u OLS) sea sesgado e inconsistente.
Identificación y la Condición de Orden
Para estimar correctamente, se requiere la Identificación, sujeta a la Condición de Orden:
$$K_{\text{excl}} \geq G_{\text{incl}} - 1$$
- $K_{\text{excl}}$: Número de variables exógenas excluidas de la ecuación específica.
- $G_{\text{incl}}$: Número de variables endógenas incluidas en la ecuación específica.
Según el resultado de esta condición:
- Si $K_{\text{excl}} < G_{\text{incl}} - 1$: El sistema está subidentificado (no estimable).
- Si $K_{\text{excl}} = G_{\text{incl}} - 1$: El sistema está exactamente identificado (se puede usar MCI o 2SLS).
- Si $K_{\text{excl}} > G_{\text{incl}} - 1$: El sistema está sobreidentificado (se recomienda 2SLS).
Métodos de Estimación
- Mínimos Cuadrados Indirectos (MCI): Estima la forma reducida del sistema y luego despeja los coeficientes estructurales. Es adecuado principalmente cuando el sistema está exactamente identificado.
- Mínimos Cuadrados en Dos Etapas (2SLS): Limpia la endogeneidad en dos pasos utilizando variables instrumentales adecuadas. Es el método estándar para sistemas sobreidentificados.
- Mínimos Cuadrados en Tres Etapas (3SLS): Combina la lógica de 2SLS con la estimación de la matriz de covarianzas de errores entre ecuaciones (SUR). Gana eficiencia si los errores del sistema están correlacionados.
II. Modelos de Elección Discreta
Estos modelos se basan en la teoría de la Utilidad, donde $U = V + \text{error}$. La elección se realiza maximizando esta utilidad.
Diferencias entre Logit y Probit
- Logit: Asume que el término de error sigue una distribución Logística (con colas más pesadas, $\sigma \approx 1.8$).
- Probit: Asume que el término de error sigue una distribución Normal Estándar ($\sigma = 1$).
Debido al problema de escala (no se pueden estimar simultáneamente $\beta$ y $\sigma$), los coeficientes $\beta$ estimados solo indican el signo y la significancia de la relación, no la magnitud del efecto.
Magnitud del Efecto
Para interpretar la magnitud, se deben calcular los Efectos Marginales (EM):
$$\frac{d(\text{Prob})}{dX_k} = f(\mathbf{X}\beta) \beta_k$$
donde $f(\cdot)$ es la función de densidad de probabilidad correspondiente (Logística o Normal).
Supuesto IIA
El modelo Logit Multinomial (MNL) asume la propiedad de Independencia de Alternativas Irrelevantes (IIA). Si este supuesto se viola (es decir, la introducción de una nueva opción afecta desproporcionadamente las probabilidades relativas de las opciones existentes), se deben emplear modelos más flexibles como el Logit Anidado o el Logit Mixto.
III. Variables Limitadas y Sesgo de Selección
Censura (Modelo Tobit)
La Censura ocurre cuando observamos las variables $X$ para todas las unidades, pero la variable dependiente $Y$ está limitada (ej. $Y=0$ si la utilidad latente es negativa). En el modelo Tobit, la función de verosimilitud mezcla la densidad de la variable continua con la probabilidad acumulada de la parte censurada.
Truncamiento y Sesgo de Selección (Heckman)
El Truncamiento ocurre cuando no observamos ni $X$ ni $Y$ para las unidades que quedan fuera de la muestra (ej. solo observamos salarios de personas que deciden trabajar). Esto genera una muestra no aleatoria.
El modelo de Heckman corrige el sesgo de selección en dos etapas:
- Etapa 1 (Probit de Participación): Se estima un modelo Probit para predecir la probabilidad de estar en la muestra. Se calcula el Ratio Inverso de Mills ($\lambda$).
- Etapa 2 (OLS Aumentado): Se estima la regresión de interés aumentada con el ratio de Mills: $Y = X\beta + \delta\lambda + u$.
Si el coeficiente $\delta$ asociado a $\lambda$ es significativo, se concluye que el sesgo de selección ha sido corregido exitosamente.
IV. Modelos de Conteo (Poisson)
Los modelos de conteo se utilizan para variables dependientes que son enteros no negativos ($Y \in \{0, 1, 2, \dots\}$).
Distribución Poisson
La probabilidad de observar $y$ eventos es:
$$P(Y=y) = \frac{e^{-\lambda}\lambda^y}{y!}$$
donde el parámetro de tasa $\lambda$ se modela como $\lambda = e^{\mathbf{X}\beta}$.
Supuesto de Equidispersión
El modelo Poisson asume Equidispersión: $\text{Media} = \text{Varianza} = \lambda$.
- Si $\text{Varianza} > \text{Media}$, existe Sobredispersión. Se recomienda usar errores estándar robustos o migrar al modelo de Binomial Negativa.
Los coeficientes $\beta$ en Poisson son semi-elasticidades: un cambio unitario en $X_k$ resulta en un cambio porcentual aproximado en la media esperada de $Y$. El vínculo logarítmico asegura que las predicciones de $\lambda$ sean siempre positivas.
V. Series de Tiempo
Estacionariedad
Una serie es estacionaria si su media, varianza y autocovarianza son constantes a lo largo del tiempo.
Test Dickey-Fuller Aumentado (ADF)
El test ADF evalúa la presencia de una raíz unitaria:
- Hipótesis Nula ($H_0$): La serie tiene una raíz unitaria (es No estacionaria).
- Decisión: Si el estadístico $t$ es menor que el valor crítico de ADF, se rechaza $H_0$ y se concluye que la serie es estacionaria.
Cointegración y Corrección de Errores (ECM)
La Cointegración implica que dos o más variables no estacionarias $I(1)$ tienen una relación de equilibrio de largo plazo.
El Modelo de Corrección de Errores (ECM) modela la dinámica de corto plazo:
$$\Delta Y_t = \alpha \Delta X_t - \lambda (Y_{t-1} - \beta X_{t-1}) + u_t$$
- El término $(Y_{t-1} - \beta X_{t-1})$ es el error de desequilibrio del período anterior.
- $\lambda$ es la velocidad de ajuste hacia el equilibrio de largo plazo. Para que el sistema converja, $\lambda$ debe ser negativo y estadísticamente significativo.