Heterocedasticidad
Enviado por stifler3w • 24 de Septiembre de 2013 • 6.804 Palabras (28 Páginas) • 527 Visitas
HETEROSCEDASTICIDAD
Un supuesto importante del modelo clásico de regresión lineal plantea que las perturbaciones Ui de la función de regresión poblacional son homocedasticas, es decir, que todas tienen la misma varianza independientemente del valor que tome Xi. (ver grafico 1).
Var (Yi | Xi) = σ2 = E( Ui2) ................................... ( 1 )
En contraste cuando la varianza condicional cambia a medida que Xi cambia, en este caso las varianzas de Yi ya no son las mismas. Por tanto existe heteroscedasticidad
Var(Yi | Xi) = σi2 = E( Ui2 ) ....................................... ( 2 )
Note que el subíndice de σ2 indica que la varianza condicionada de Yi no continua siendo constante.
¿Qué es la Heteroscedasticidad?
Es un problema que surge cuando NO se cumple el supuesto de homocedasticidad, el cual establece que las varianzas condicional de Yi dado un valor de Xi es igual independientemente del valor que tome X. Así con heteroscedasticidad E( Ui2 ) = σi2 es decir depende del valor que tome X, por lo tanto no se cumple el supuesto y los elementos de la diagonal de la matriz E(UU’) no son iguales o son infinitas. Para ejemplificar este problema ponga atención a lo siguiente.
Considere el siguiente modelo de apredizaje, el cual se plantea también en forma gráfica. Como es de su conocimiento, a medida que las personas aprenden, sus errores de comportamiento se hacen menores con el tiempo. En este caso, se espera que σi2 se reduzca . Si se considera el caso de una joven secretaría inexperta a la cual se le evalúa el número de errores cometidos en una prueba de mecanografía durante un periodo dado. A medida que aumentan el número de horas de práctica, el número promedio de errores de mecanografía se reduce, al igual que sus varianzas (diversidad de tipo de errores). (ver figura 2)
¿Por qué surge la heteroscedasticidad?
Puede surgir como resultado de la presencia de factores atípicos. Una observación o factor atípico es aquella que es muy diferente (muy pequeña o muy grande) con relación a las demás observaciones en la muestra. La inclusión o exclusión de una observación de este tipo, especialmente si el tamaño de la muestra es pequeño, puede alterar sustancialmente los resultados del análisis de regresión.
Otra fuente de heteroscedasticidad surge de la violación del supuesto que establece que el modelo de regresión está correctamente especificado o error de especificación. Con mucha frecuencia, lo que parece ser heteroscedasticidad puede deberse al hecho de que algunas variables importantes son omitidas del modelo. Así, en la función de demanda de un bien, si no se incluyen los precios de los bienes que le son complementarios o de los que compiten con éste (sesgo por variable omitida), los residuos obtenidos de la regresión pueden dar la clara impresión de que la varianza del error no es constante. Pero si las variables omitidas son incluidas en el modelo, esa impresión puede desaparecer.
Otra fuente es la asimetría en la distribución de una o mas variables incluidas en el modelo. Los ejemplos los constituyen variables económicas como el ingreso, la riqueza y la educación. Es bien sabido que la distribución del ingreso y la riqueza en la mayoría de las sociedades es desigual, pues la mayor parte de estos elementos le corresponden a unos cuantos individuos pertenecientes a los estratos superiores.
Es más común en la información de corte transversal que en la información de series de tiempo. En la información de corte transversal, generalmente se trata con miembros de una población en un momento dado del tiempo, tal como consumidores individuales o sus familias, empresas, industrias o subdivisiones geográficas tales como estados, países, ciudades, etc. Además, estos miembros pueden ser de diferentes tamaños como por ejemplo empresas pequeñas, medianas o grandes o ingresos bajos, medios o altos. En las series de tiempo, por el contrario, las variables tienden a ser de órdenes de magnitud similares porque generalmente se recopila información sobre el mismo fenómeno o hecho durante un periodo. Como ejemplo el PIB, el gasto de consumo, el ahorro o el empleo en México, durante el periodo 1970 a 2000.
¿Cuáles son las consecuencias teóricas de la heteroscedasticidad?
La heteroscedasticidad no destruye las propiedades de insesgamiento y de consistencia de los estimadores Mínimo Cuadráticos estimados . Sin embargo, estos estimadores no poseen varianza mínima, no siendo por ende eficientes y dejan de ser MELI, para obtener estos se utiliza el Método de Mínimos Cuadrados Generalizados (MCG).
Método de Mínimos Cuadrados Generalizados (MCG).
Ante el problema de heteroscedasticidad es deseable que las observaciones que surgen de poblaciones de mayor variabilidad, reciban menos peso que aquellas que provienen de poblaciones con menor variabilidad, esto permite estimar la FRP en forma más precisa. Desafortunadamente, el método de MCO usual no sigue esta estrategia y , por consiguiente, no hace uso de la información contenida en la variabilidad desigual de la variable dependiente Y. Pero existe un método conocido como Mínimos Cuadrados Generalizados que toma en cuenta esta información y por consiguiente, es capaz de producir estimadores que son MELI.
En MCO se minimiza Σe2i = Σ (Yi - - Xi)2 ............................... ( 3 )
En MCG se minimiza la expresión Σ wi e2i = Σ wi (Yi - - Xi )2 .................. ( 4 )
donde wi= es un ponderador, estas ponderaciones son inversamente proporcionales a las varianzas de ei ó Yi.
Por lo tanto MCG minimiza la suma ponderada de los residuales al cuadrado, en wi representa la ponderación. En MCG la ponderación asignada a cada observación es inversamente proporcional a su σi ; en otras palabras, observaciones provenientes de una población con un σi mayor recibirán una ponderación relativamente menor que aquellas provenientes de una población con un σi más pequeño, a las cuales se les asignará una ponderación proporcionalmente mayor. Ejemplo: En MCO cada e2i asociado con los puntos A, B y C recibirá la misma ponderación, sin embargo, en MCG la observación extrema C recibirá una ponderación relativamente más pequeña que las restantes dos observaciones; está es una estrategia correcta puesto que para estimar la función de regresión poblacional (FRP) en forma más confiable nos gustaría asignarles una mayor ponderación a las observaciones que estén agrupadas
...