Fundamentos de Econometría: El Término de Perturbación y Problemas de Especificación del Modelo
Enviado por Programa Chuletas y clasificado en Matemáticas
Escrito el en
español con un tamaño de 8 KB
ui
:
trmino d prturbacion alatoria. St trmino rcog la alatoriedad prsnt en ls rlacions entr variabls económicas. Al introducir ui la ecuación s stocastica en lugar d dtrminista7 y, x tanto, + adcuada xa rprsntar la ralidad económica. Razons concrtas x ls q introducir ui en la ecuación: ui s la suma d innumrabls factors d pqña magnitud q incidn globalmnt sobr la variabl dpndient y q no stan prsnts en la ecuación. s dcir, rprsnta la suma d to2 aqyos factors explicativos d y
q, x cualkier razón, no stan contni2 en ls rgrsors xji, también s justifica su introducción x la existncia d errors d mdida en ls variabls, q ac q la rlacion entryas no sa prfcta. Y, x ultimo, x la agrgacion d ls datos económicos, lo q también provoca q ls rlacions entr variabls no sa prfcta.
rspcto a la distribución d probabilidad d ui: tien spranza nula: e(ui) = 0, i = 1, ..., n. Sto significa q aunql trmino d prturbacion ui pued tomar valors positivos y ngativos d forma alatoria, d mdia val cro, s dcir, no toma sistmaticamnt valors positivos ni ngativos. Rcog, pus, multitud d factors d pqña magnitud q, d mdia, valn cro. Su incumplimiento afcta al procso d stimacion. Matricialmnt, sta ipotsis s rprsnta cm e(u) = 0. Ui s omoscdastico (tien varianza constant). S dcir, ls trminos d prturbacion d todas ls obsrvacions tienn la misma varianza: var(ui) =e(ui)2 = ?^2 i = 1, ...N. La disprsion d ls valors dl trmino d prturbacion xa cada obsrvacion en torno a su mdia no va a dpndr d ls valors q toman ls explicativas, sino q va a sr constant a lo largo d todol rcorrido d ls mis+. Intuitivamnt, st supusto significa q ls factors inobsrvabls q rcog "u" tienn igual variabilidad xa todas ls obsrvacions d la mustra.L incumplimiento d sta ipotsis s dnomina etroscdasticidad. Formalmnts rprsnta x var(ui) = ?^2 i, i = 1, ...N. S trata d 1a situación en la cual la disprsion d ls valors d 1a dtrminada variabl xji dpnd d ls valors q toma dixa variabl. Ui no sta autocorrlacionado. S dcir, ls trminos d prturbacion corrspondients a 2 obsrvacions difrnts no stan rlaciona2. Formalmnt: cov(ui, us) = e(uius) = 0, i ? s, i, s = 1, ..., n. St supusto significa q ls factors inobsrvabls rcogi2 enl trmino d prturbacion corrspondients a 2 obsrvacions mustrals no stan rlaciona2.L incumplimiento d sta ipotsis s dnomina autocorrlacion, s rprsnta cm cov(ui, us) = e(uius) = ?^2 ? 0, i ? S, i, s = 1, ..., n. Conjuntamnt, ls supustos omoscdasticidad y no autocorrlacion originan q la matriz d varianzas y covarianzas d u sa scalar y, en concrto, la siguient: var(u) = e(uu') =?^2* i. ui sigue 1 modlo d probabilidad normal. Considrando, ad+, q tien mdia cro y varianza constant, podmos scribir sta ipotsis cm ui ?N(0, ?^2 ). Matricialmnt, añadiendo la no autocorrlacion, podmos scribir q u?N(0, ?^2* i). S dcir, dado q ui s la suma d multtud d factores d pqña magnitud tiene sentido considerar k sigue 1 modelo de probabilidad normal
Definición R^2:
El coeficinete de determinación se define a partir de la denominada descomposición de la suma de cuadrados.
R^2= sce/sct ó 1-(scr/sct), siendo sce: ?(yi-y)^2 suma de cuadrados explicada por el modelo. Sct: ?(yi-y)^2, suma cuadrados total. Scr: ?Ei^2 suma cuadrados de los residuos. R^2 tmb se puede definir como R^2= s^2y/s^2y = 1-(se^2/s^2y). Es un coeficiente adimensional y solo puede tomar valores entre 0-1. Cuando= o el modelo ajustado no explica a y, el ajuste es nulo y la representatividad del modelo ajustado es nula. Cuando la S^2y se explica totalmente por X. La varianza residual es cero, por tanto, no se generan residuos. Diríamos por tanto, el coeficiente de determinación tendrá una doble interpretación: Como la parte de la S^2y explicada por X.Como medida de la bondad del ajuste realizado. R2 *100 : es el porcentaje de la varianza de y explicado por el modelo, es decir, porl as variables independientes.
R`^2 corregido:
1-(scr/(n-k))/sct/(n-1) = 1-(n-1)(n-k)*(1-R^2). El coeficiente de determ corregido se utiliza para comparar modelos con igual variable dependiente e igual forma funcional. Penaliza la perdida de grados de libertad al incluir varibles indep adicionales. R^2?R^2; R^2 e[-?,1], mejor próximo a 1
Hipótesis k debn cumplirse para obtener stimador ?
mco
obsrvando la exprsion dl stimador mco vmos q su existncia va a dpndr d la existncia d la matriz (x'x)-1 por eso, la uniica ipotsis q s a d cumplir s q x sea 1a matriz no singular, sto s, dbe cumplirs q |x'x|=0. En s caso, s vrifica ql rango d X s igual al numro d xamtros dl modlo, P(x)=k y, x tanto, exist la matriz (x'x)-1
Multicolinealidad perfecta:
en el modelo lineal existe cuando uno de los regresores del mismo se puede expresar como una correlación lineal perfecta del resto de regresores(o alguno), matricialmente |x|=0, es decir x es una matriz singular, p(x)<k, en consecuencia|x'x|=0 no se puede obtner la inversa de |x'x| no se puede obtener estimadores de los coef del modelo, ? No exist.
Multicolinealidad de grado: aparece cuando los regresores presentan una elevada correlación lineal. No implica incumplimiento d ninguna hipótesis del modelo, es 1 pbm de los datos, es 1pbm grave del modelo econométrico y no tiene facl solución, aparece en los datos reales como consecuencia de elevada correlación existente n las variables económicas. formalmente implica k |x'x| 0 en consecuencia los elementos ajj que aparecen en la diagonal ppal (x'x)^-1 sean muy elevados. Como consecuencia los errores estándar son sensiblemente superiores a los k existirían en ausencia de mult. Cuando r próximo a (1-1) Sbj aumenta. Consecuencia: aumento importante de los errores estándares de los estimadores, tendremos k aceptar k las variables indep no son explicativas cuando en realidad lo son, aumenta los intervalos de confianza y predicción, podemos obtenr signos erróneos para los coef estimados y estos serán muuy sensibles a la muestra, estimadores no independientes correlación no nula entre estimadores, síntomas de multicolinealidad en un modelo son : vbles no explicativas en contra de lo esperado, signos de los coeficientes estimados incorrectos, elevada correlación lineal entre regresores
errores de expecificacion:
A) error por omisión de vable relevante ( con carga explicativa)->consecuencias: 1)se van a estimar sesgadamente los parámetros de las vables incluidas, desaparece el sesgo cuando x2 y x3 sson ortogonales, 2)la varianza de las perturbaciones ( ) se va a estimar tmb de forma sesgada, se estima al alza, se sobreestima no desaparece ni cuando x2x3 son ortogonales por lo k los procedimientos de inferencia t y f quedan invalidados. 3)la varianza estimada del estimador de ?J en el modelo incorrecto difiere de la verdadera, cabe esperar k sea superior pero no se puede asegurar. B) inclusión de vble irrelevante: se sobre estima la varianza del estimador, se pierde precisión en la estimación
obtención de suma de cuadrados de residuos: yi=yi+ei-> partiendo de esta expresión, rstando en ambos miembros media y y elevándolo al cuadrado y sumando para las n observaciones, quedaría: