Analisis Residual
Enviado por missaelist • 18 de Septiembre de 2012 • 390 Palabras (2 Páginas) • 1.660 Visitas
ANÁLISIS RESIDUAL
Como se ha indicado anteriormente, el análisis de los residuos es básico para chequear si se verifican las hipótesis del modelo de regresión. Por ello, a continuación se exponen las propiedades matemáticas de los mismos. Considérese el modelo de regresión lineal múltiple
Los residuos mínimo-cuadráticos vienen dados por:
O en forma matricial
Como = H , siendo H= X -1Xtla matriz de proyección ortogonal. Es fácil probar que la matriz H es idempotente y simétrica . En base a esto
= - = -H = =
= X + -HX -H = ,
Donde se utilizó que HX =X. Se calcula la matriz de varianzas de los residuos,
Por tanto, ei es una variable aleatoria con distribución
donde hii es el valor de influencia de i. que mide la “distancia estadística” de i. a . Un residuo “grande” indica que la observación está lejos del modelo estimado y, por tanto, la predicción de esta observación es mala. Las observaciones con residuos grandes se denominan observaciones atípicas o heterogéneas. Como los residuos tienen varianza variable y son dimensionados (tienen las unidades de la variable Y), normalmente se tipifican
Los residuos tipificados siguen una distribución normal estándar, pero como 2es desconocido, se sustituye por su estimador, la varianza residual R2 y se obtienen los residuos estandarizados, definidos como:
Por la hipótesis de normalidad los residuos estandarizados siguen una distribución t con n- grados de libertad. Como ya se indicó en el estudio del modelo de regresión lineal simple, en el cálculo de ri existe el problema de que hay una relación de dependencia entre el numerador y el denominador de ri. Para evitar esto, con mayor esfuerzo computacional, se calcula para cada i, i = 1,...,n, el estimador R, , la varianza residual del modelo de regresión obtenido a partir de la muestra en la que se ha eliminado la observación .Ahora se definen los residuos estudentizados como
Los residuos estudentizados siguen una distribución t con - grados de libertad. Si el tamaño muestral es grande, los residuos estandarizados y los estudentizados son casi iguales y muy informativos, pudiéndose considerar grandes los residuos estandarizados tales que > 2.
...