Econometric Techniques: Comparing First Differences and Fixed Effects in Panel Data

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 10,71 KB

1. Primeras Diferencias: Cortes Transversales vs. Datos de Panel

¿Por qué no se pueden usar primeras diferencias cuando se tienen cortes transversales independientes en dos años, contrariamente a los datos de panel?

Porque en cortes transversales independientes, las muestras son independientes para cada período de tiempo (t). Por lo tanto, tendrán distintas características y dispersiones. Debido a esto, la muestra en el tiempo t=2 no depende de la muestra en t=1, y no tiene sentido calcular primeras diferencias entre observaciones de individuos distintos.

En cambio, en datos de panel, se utiliza la misma muestra de individuos a lo largo del tiempo. Por lo tanto, sí se puede usar la técnica de primeras diferencias (PD) para eliminar efectos fijos individuales constantes en el tiempo, ya que se resta la observación del mismo individuo en t-1 de la observación en t.

2. Variables Constantes en el Tiempo y Primeras Diferencias

Supón que se desea estimar el efecto de varias variables sobre el ahorro anual y se tiene una base de datos de panel sobre personas, recolectada el 31 de enero de 1990 y el 31 de enero de 1992. Si se incluye una variable binaria para 1992 y se utiliza la primera diferenciación, ¿es posible incluir además la edad en el modelo original?

No es posible incluir la edad directamente en un modelo estimado por primeras diferencias si la edad cambia de forma constante para todos los individuos. La edad es una variable que, típicamente, cambia en una unidad cada año para todas las personas en la muestra. Al aplicar primeras diferencias, la variable transformada para la edad (ΔEdad = Edadt - Edadt-1) será constante (igual a 2 años en este caso, asumiendo que t=1990 y t=1992) para todos los individuos.

Esta variación constante provoca que la variable ΔEdad sea perfectamente colineal con el término constante (o el efecto del tiempo capturado por la diferencia de la variable binaria de año) en la regresión diferenciada. Esto impide obtener un estimador separado y fiable para el efecto de la edad; el modelo sufriría de multicolinealidad perfecta.

3. Diseño Experimental: Programa de Tutorías

Supón que se evalúa un programa de clases extra para estudiantes con promedio menor a 80. Cuentas con un listado de estudiantes que participan en el programa de tutores. Describe el experimento.

  • Unidad de Análisis: Calificación final de semestre de los alumnos.
  • Población de Interés: Alumnos con promedio inicial menor a 80.
  • Grupo de Tratamiento: Alumnos (con promedio < 80) que recibirán las clases extra.
  • Grupo de Control: Alumnos (con promedio < 80) que no recibirán las clases extra. (Nota: La descripción original mencionaba incorrectamente que el grupo de control eran alumnos con promedio >= 80, lo cual no permitiría un diseño experimental válido para evaluar el efecto sobre los de promedio < 80. Se asume una asignación aleatoria o cuasi-experimental dentro del grupo con promedio < 80).

Especificación Econométrica (Diferencia en Diferencias):

Yᵢₜ = β₀ + δ₀d₂ + β₁dᵀᵢ + δ₁(d₂ * dᵀᵢ) + αᵢ + uᵢₜ

Donde:

  • Yᵢₜ: Calificación final del alumno i en el semestre t.
  • d₂: Variable binaria (dummy) que vale 1 para el semestre con el programa (post-tratamiento), 0 antes.
  • dᵀᵢ: Variable binaria que vale 1 si el alumno i pertenece al grupo de tratamiento, 0 si pertenece al grupo de control.
  • d₂ * dᵀᵢ: Término de interacción entre la variable de tiempo y la variable de tratamiento.
  • β₀: Intercepto (calificación promedio grupo control antes del programa).
  • δ₀: Efecto del tiempo (cambio promedio en calificación para el grupo control).
  • β₁: Diferencia promedio inicial entre grupos antes del programa.
  • δ₁: Estimador de Diferencia en Diferencias (DiD) - el efecto causal promedio del programa.
  • αᵢ: Efecto fijo individual (inobservable, constante en el tiempo).
  • uᵢₜ: Término de error idiosincrático.

4. Parámetro de Interés en el Modelo DiD

Con base en la regresión anterior, ¿cuál es el parámetro de interés y qué mide?

El parámetro de interés es δ₁, el coeficiente del término de interacción d₂ * dᵀᵢ.

Este parámetro mide el efecto promedio del tratamiento (las clases extras) sobre la calificación de los estudiantes que las recibieron, controlando por diferencias preexistentes entre los grupos y tendencias temporales comunes. Es el estimador de Diferencia en Diferencias (DiD). Nos mostraría cómo cambió la diferencia en las calificaciones entre el grupo de tratamiento y el grupo de control después de la implementación del programa, comparado con la diferencia que existía antes.

5. Transformación de Primeras Diferencias (FD)

Sea la ecuación: Yᵢₜ = β₁Xᵢₜ₁ + β₂Xᵢₜ₂ + αᵢ + uᵢₜ, con t=1, 2. Obtén la transformación de primeras diferencias (FD) para datos de panel.

Modelo original en el tiempo t:

Yᵢₜ = β₁Xᵢₜ₁ + β₂Xᵢₜ₂ + αᵢ + uᵢₜ

Modelo en el tiempo t=2:

Yᵢ₂ = β₁Xᵢ₂₁ + β₂Xᵢ₂₂ + αᵢ + uᵢ₂

Modelo en el tiempo t=1:

Yᵢ₁ = β₁Xᵢ₁₁ + β₂Xᵢ₁₂ + αᵢ + uᵢ₁

Restando la ecuación de t=1 de la ecuación de t=2:

Yᵢ₂ - Yᵢ₁ = (β₁Xᵢ₂₁ + β₂Xᵢ₂₂ + αᵢ + uᵢ₂) - (β₁Xᵢ₁₁ + β₂Xᵢ₁₂ + αᵢ + uᵢ₁)

Yᵢ₂ - Yᵢ₁ = β₁(Xᵢ₂₁ - Xᵢ₁₁) + β₂(Xᵢ₂₂ - Xᵢ₁₂) + (αᵢ - αᵢ) + (uᵢ₂ - uᵢ₁)

La transformación de primeras diferencias es:

ΔYᵢ = β₁ΔXᵢ₁ + β₂ΔXᵢ₂ + Δuᵢ

Donde Δ indica el cambio entre t=2 y t=1 (e.g., ΔYᵢ = Yᵢ₂ - Yᵢ₁). Nótese que el efecto fijo individual αᵢ se elimina.

(Nota: Si el modelo original incluyera un intercepto β₀ y/o un efecto temporal agregado δ₀d₂, la ecuación diferenciada podría tener un intercepto Δβ₀ o δ₀.)

6. Transformación de Efectos Fijos (FE) o Intra-Grupos

Obtén la transformación de efectos fijos (Within Transformation).

Modelo original:

Yᵢₜ = β₁Xᵢₜ₁ + β₂Xᵢₜ₂ + αᵢ + uᵢₜ

Primero, se calcula la media temporal para cada individuo i sobre todas las T observaciones:

Ȳᵢ = β₁X̄ᵢ₁ + β₂X̄ᵢ₂ + αᵢ + ūᵢ

Donde Ȳᵢ, X̄ᵢ₁, X̄ᵢ₂, ūᵢ son las medias temporales para el individuo i (e.g., Ȳᵢ = (1/T) Σt=1T Yᵢₜ).

Luego, se resta la ecuación de medias de la ecuación original para cada observación (i, t):

Yᵢₜ - Ȳᵢ = (β₁Xᵢₜ₁ + β₂Xᵢₜ₂ + αᵢ + uᵢₜ) - (β₁X̄ᵢ₁ + β₂X̄ᵢ₂ + αᵢ + ūᵢ)

Yᵢₜ - Ȳᵢ = β₁(Xᵢₜ₁ - X̄ᵢ₁) + β₂(Xᵢₜ₂ - X̄ᵢ₂) + (αᵢ - αᵢ) + (uᵢₜ - ūᵢ)

La transformación de efectos fijos (variables centradas respecto a su media individual) es:

(Yᵢₜ - Ȳᵢ) = β₁(Xᵢₜ₁ - X̄ᵢ₁) + β₂(Xᵢₜ₂ - X̄ᵢ₂) + (uᵢₜ - ūᵢ)

O usando la notación de variables "demeaned" (desviadas respecto a la media):

Ỹᵢₜ = β₁X̃ᵢₜ₁ + β₂X̃ᵢₜ₂ + ũᵢₜ

Esta transformación también elimina el efecto fijo individual αᵢ.

7. Relación entre Estimadores de Efectos Fijos (FE) y Primeras Diferencias (FD)

¿Cómo se relacionan los estimadores de efectos fijos y primeras diferencias?

  • Cuando el número de períodos de tiempo es T=2, los estimadores de Efectos Fijos (FE) y Primeras Diferencias (FD), así como sus estadísticos de prueba, son numéricamente idénticos.
  • Cuando T ≥ 3, los estimadores FE y FD son diferentes. La elección entre ellos depende de las propiedades del término de error uᵢₜ.
  • Si los errores uᵢₜ no están serialmente correlacionados (para cada i), el estimador de FE es más eficiente que el de FD.
  • Si los errores uᵢₜ están serialmente correlacionados (especialmente si siguen un camino aleatorio, uᵢₜ = uᵢ,ₜ₋₁ + εᵢₜ), el estimador de FD puede ser preferible o más eficiente, ya que la diferenciación puede eliminar o reducir esta correlación serial en los errores transformados (Δuᵢ).

8. Criterio de Decisión: Efectos Fijos vs. Primeras Diferencias

¿Cuál es el criterio de decisión para usar efectos fijos sobre primeras diferencias y viceversa?

El criterio principal se basa en la presencia y estructura de la correlación serial en los errores idiosincráticos uᵢₜ, asumiendo T ≥ 3:

  • Poca o ninguna correlación serial: Se prefiere el estimador de Efectos Fijos (FE) porque es el estimador lineal insesgado óptimo (BLUE) bajo las hipótesis estándar (incluida la no correlación serial). Es más eficiente.
  • Mucha correlación serial (especialmente tipo camino aleatorio): Se prefiere el estimador de Primeras Diferencias (FD). La diferenciación de los errores (Δuᵢ) tiende a reducir o eliminar la correlación serial, lo que puede llevar a estimadores más eficientes y estadísticos de prueba más fiables que los de FE aplicados a errores serialmente correlacionados.

En resumen:

  • Si uᵢₜ no está serialmente correlacionado → Preferir FE.
  • Si uᵢₜ está fuertemente correlacionado serialmente → Preferir FD.

Entradas relacionadas: