Deducción de F y consecuencias de E y X en modelos econométricos
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en español con un tamaño de 13,35 KB
DEDUCCION DE F
Para el caso en el que la varianza del término de error del modelo, σ², es desconocida, existe un método alternativo al test de Wald expuesto hasta ahora. Para derivarlo, en primer lugar, tenemos que tener en cuenta (no es difícil de demostrar) que si el término de perturbación del modelo se distribuye como una Normal, con media cero, es homocedástica y no presenta problemas de autocorrelación, es decir, si se cumple que ε ~ N(0; σ²I) , entonces se tiene que:
FORMULA
y es independiente de la expresión (4.2) de la diapositiva 59. Dado que las dos distribuciones chi-cuadrado son independientes, entonces:
FORMULA
El estadístico F se utiliza exactamente de la misma manera que el test de Wald. Así, para contrastar la hipótesis nula Aβ = c, los pasos que hay que seguir son los siguientes:
- En primer lugar, se estima el modelo y = Xβ + ε por MCO, obteniéndose tanto el vector de coeficientes estimados de los parámetros β como (X´X)–1.
- En segundo lugar, se estima la varianza de la perturbación aleatoria del modelo como ya dijimos antes, es decir, como:
FORMULA
- En tercer lugar, se calcula el estadístico F a través de la expresión obtenida antes:
FORMULA
- En cuarto y último lugar, se compara con el valor crítico de una distribución F con m grados de libertad en el numerador y n – k grados de libertad en el denominador al nivel de significatividad deseado y se actúa como siempre: si el estadístico cae a la derecha del valor crítico se rechaza H0, no rechazándose si cae a la izquierda.
FORMULA
1ºCASO ESPECIAL: contraste de significatividad individual
Por lo tanto, el contraste de significatividad individual puede llevarse a cabo, de manera equivalente, a través de una t de Student con n – k grados de libertad. El procedimiento es el siguiente:
- En primer lugar, se calcula el estadístico de contraste:
FORMULA
Se calcula el valor absoluto del estadístico porque normalmente el contraste de significatividad individual se hace a dos colas, es decir, H1: βj ≠ 0.
- En segundo lugar, se compara este estadístico con el valor crítico de una tn–k.
2ºCASO ESPECIAL: contraste de significatividad global
En el Modelo Lineal General, dado por la expresión:
FORMULA
Si, una vez estimado por MCO, supongamos que queremos comprobar si alguna de las variables independientes son capaces de explicar el comportamiento de la variable dependiente, es decir, estamos interesados en realizar el contraste de significatividad global:
FORMULA
donde fijémonos que, en la hipótesis nula, no se incluye el parámetro asociado al término constante del Modelo Lineal General. En este caso concreto, la expresión del estadístico F se reduce a:
FORMULA
siendo el R² el coeficiente de determinación estudiado anteriormente.
3ºCONSECUENCIAS DE E NO RUIDO BLANCO
1ºCASO: OMISIÓN DE VARIABLES RELEVANTES
Imaginemos que especificamos el siguiente modelo econométrico:
FORMULA
Sin embargo, supongamos que el verdadero modelo no es éste, sino el siguiente:
FORMULA
que es el mismo que el anterior, salvo por el hecho de que en el primero hemos omitido la variable explicativa xt,4, que es una variable relevante. En el modelo (2.2) se tiene que at es Ruido Blanco, mientras que, comparando los modelos (2.1) y (2.2) tendríamos, sin embargo, que:
FORMULA
Tomando esperanzas en la expresión anterior se tiene que:
FORMULA
Es decir, un error de especificación del modelo (haber omitido una variable relevante) llevaría a que la esperanza de la perturbación no fuera nula.
2ºCASO: AUTOCORRELACION DEL TERMINO DE PERTURBACIÓN:
Consideremos que tenemos el siguiente modelo econométrico:
FORMULA
donde se tiene que:
FORMULA
En este caso el término de perturbación εt no es independiente de su pasado, puesto que, como podemos observar, εt es función de εt– 1. Entonces, si calculamos la autocovarianza entre εt y εt– 1 se tendría que:
FORMULA
Demostraremos en Econometría II que:
FORMULA
con lo que la autocovarianza entre εt y εt– 1 no es nula y, por lo tanto, no se cumple el supuesto de ausencia de autocorrelación. En la expresión anterior se tiene que:
FORMULA
3ºCASO: Heterocedasticidad en el termino de perturbación
Consideremos que tenemos el siguiente modelo econométrico:
FORMULA
en el cual se cumple que:
FORMULA
es decir, que la varianza no es constante, sino que varía o bien entre individuos o bien a lo largo del tiempo (en función del tipo de datos que estemos manipulando). Además, sabemos que la varianza de la perturbación se comporta conforme al siguiente modelo:
FORMULA
siendo zt alguna variable que explica el movimiento o variabilidad de la varianza del término de perturbación, εt. Si esto ocurre, entonces se incumple el supuesto de homocedasticidad. Se dice entonces que tenemos un problema de heterocedasticidad en el término de perturbación del modelo εt.
CONSECUECNIAS DE X ESTOCASTICA
Las variables independientes deben cumplir dos propiedades:
- En primer lugar, tienen que ser no estocásticas.
- En segundo lugar, tienen que ser independientes. Se supone que las variables x = (x1, x2, …, xk) deben ser variables deterministas, esto es, deben ser previsibles con total certidumbre. Este supuesto es bastante irreal en la mayor parte de los casos prácticos aunque, sin embargo, si las variables x = (x1, x2, …, xk) no están correlacionadas con el término de error ε, entonces las consecuencias pueden no ser muy graves. Además, las variables x = (x1, x2, …, xk) deben ser linealmente independientes, es decir, ninguna variable independiente ha de poder ser expresada como una combinación lineal exacta de las restantes. Si, por ejemplo, tenemos como variables explicativas el nivel de importaciones, el nivel de exportaciones, y las exportaciones netas, a las que llamaremos x1, x2 y x3, respectivamente, entonces es claro que se incumpliría este supuesto, dado que x3 = x2 – x1.
PROPIEDAS ALGEBRAICAS: R^2
Definición: Definimos el coeficiente de determinación o R cuadrado como el cociente entre la varianza muestral de la variable dependiente estimada por MCO y la varianza de la variable dependiente, es decir:
FORMULA
Debido a que las varianzas, por definición, no pueden ser negativas, entonces el coeficiente de determinación debe ser un número positivo. Además, tal y como se desprende de la expresión (3.3) de la dispositiva anterior, la varianza muestral de la variable dependiente tiene que ser mayor o igual que la varianza muestral de la variable dependiente estimada por el método MCO y, debido a ello, el coeficiente de determinación es un número comprendido entre cero y uno. Debido a que R² ϵ[0, 1], entonces el mismo se puede interpretar como un porcentaje, como el porcentaje de la variabilidad de la variable dependiente que es explicada por la variabilidad de las variables independientes x = (x1, x2, …, xk).
Definición: Definimos el coeficiente de determinación corregido como una medida de bondad de ajuste del modelo econométrico que, a diferencia del coeficiente de determinación, tiene en cuenta los grados de libertad del modelo, penalizando la incorporación de un mayor número de variables explicativas en el mismo. Se calcula como:
FORMULA
Al aumentar el número de variables explicativas en el Modelo Lineal General aumentamos la variabilidad de la variable dependiente estimada por el método MCO y, consecuentemente, provocamos que el R cuadrado crezca acercándose a la unidad. Pero, sin embargo, puede que la capacidad explicativa de las nuevas variables independientes acerca del comportamiento de la variable dependiente sea inexistente. Por ello se calcula el coeficiente de determinación corregido, que sirve para compararlo con el R²:
- Si son similares en magnitud se concluye que no hay problemas con los grados de libertad del modelo y el R² puede interpretarse de manera estándar.
- Si son muy diferentes, entonces el R² exagera la capacidad explicativa de las variables independientes.
INTERPRETRACION DE COEFICIENTES
Vamos a estudiar cómo se interpretan los coeficientes del Modelo Lineal General en función de cómo sean las variables independientes y de cómo sea la variable dependiente:
FORMULA
- Las variables independientes, xt,j, j = 2, 3, …, k, están expresadas en niveles y son variables continuas, mientras que la variable dependiente está en niveles:
FORMULA
Puesto que uno de los supuestos del Modelo Lineal General es que la variable dependiente, yt, es una variable continua, entonces, se cumple que:
FORMULA
es decir, el coeficiente βj, asociado a la variable explicativa xt,j, j = 2, 3, …, k, es el efecto marginal que la variable explicativa xt,j produce sobre la variable que queremos explicar, yt. Dicho de otra manera, si la variable xt,j se incrementa en una unidad, entonces la variable dependiente, yt, varía en βj unidades (incrementa, si el signo de βj es positivo, y disminuye, si el signo de βj es negativo).
- Alguna de las variables explicativas, xt,j, j = 2, 3, …, k, están expresadas en logaritmos neperianos y son variables continuas, mientras que la variable dependiente está, también, en logaritmos neperianos: Por ejemplo, sea el modelo:
FORMULA
En este caso, se tiene que:
FORMULA
es decir, el coeficiente βj, asociado a la variable explicativa xt,j, j = 2, 3, …, k, es una elasticidad constante de la variable explicativa xt,j sobre la variable a explicar, yt. Dicho de otra manera, si la variable xt,j se incrementa en un 1%, entonces la variable dependiente, yt, varía en un βj % (incrementa, si el signo de βj es positivo, y disminuye, si el signo de βj es negativo).
- Las variables independientes, xt,j, j = 2, 3, …, k, están expresadas en niveles y son variables continuas, mientras que la variable dependiente está en logaritmos neperianos: Por ejemplo, sea el modelo:
FORMULA
En este caso, se tiene, por un lado, que:
FORMULA
es decir, el coeficiente βj, asociado a la variable explicativa xt,j, j = 2, 3, …, k, es una semielasticidad constante de la variable explicativa xt,j sobre la variable a explicar, yt. Dicho de otra manera, si la variable xt,j se incrementa en una unidad, entonces la variable dependiente, yt, varía en (100 × βj )% unidades (incrementa, si el signo de βj es positivo, y disminuye, si el signo de βj es negativo).
4. 4.Las variables independientes, xt,j, j = 2, 3, …, k, están expresadas en niveles y son variables dicotómicas, mientras que la variable dependiente está, también, en niveles:
FORMULA
Por ejemplo, sea el modelo: donde si la variable xt,j = 1, j = 2, 3, …, k, indica que dicha variable presenta una característica determinada, mientras que si xt,j = 0, j = 2, 3, …, k, indica la ausencia de dicha característica. Si nos centramos en el efecto de una sola variable explicativa sobre la variable dependiente, por ejemplo, la variable xt,2, entonces si xt,2 = 1 se tiene que:
FORMULA
mientras que si xt,2 = 0, entonces se tiene que:
FORMULA
Si restamos las dos expresiones vemos que el coeficiente es, en este caso, la diferencia de comportamiento entre dos grupos diferentes: aquellos que tienen la característica y los que no la tienen:
FORMULA