Análsis de regresión lineal múltiple
Enviado por lialu • 31 de Octubre de 2012 • 1.007 Palabras (5 Páginas) • 2.794 Visitas
REGRESIÓN LINEAL MÚLTIPLE
La regresión lineal nos permite trabajar con una variable a nivel de intervalo o razón, así también se puede comprender la relación de dos o más variables y nos permitirá relacionar mediante ecuaciones, una variable en relación a otras variables llamándose Regresión múltiple. Constantemente en la práctica de la investigación estadística, se encuentran variables que de alguna manera están relacionados entre si, por lo que es posible que una de las variables puedan relacionarse matemáticamente en función de otra u otras variables.
Maneja varias variables independientes. Cuenta con varios parámetros. Se expresan de la forma:6
(13)
donde es el error asociado a la medición del valor y siguen los supuestos de modo que (media cero, varianza constante e igual a un y con ).
MATRIZ DE VARIANZA-COVARIANZA
Sea un experimento de n variables (X1, X2,...Xn). Podemos ordenar en una matriz las diferentes covarianzas entre variables y varianzas de variables.
a. Recordemos que las varianzas se definen como las sumas de cuadrados promediadas
Significado de la varianza y la covarianza
Sean dos nubes de puntos (representadas como en la figura, por elipsoides que las rodean). La varianza es una medida de la dispersión. Las variables X e Y tienen ambas la misma varianza en el caso de la elipse y del círculo, pero la covarianza en el círculo es cero y la de la elipse es más o menos alta, y positiva.
Prueba de hipótesis para coeficiente de regresión
H0 : = 0 (equivale a plantear que no hay relación entre Y y Xi )
H1 : 0 (equivale a plantear que sí hay relación entre Y y Xi )
Si se acepta la de hipótesis nula, se está aceptando que no hay relación entre Y yXi , por lo tanto, ésta variable se debe sacar del modelo.
La estadística de trabajo se resuelve suponiendo que la hipótesis nula (H0 ) es verdadera. Dicha estadística de trabajo es:
Regla de decisión. Si el número de observaciones es mayor que 30, los valores de Z se hallan en la distribución normal. Si el número de observaciones es menor o igual a 30, los valores de Z se hallan en la distribución t con n-k-1 grados de libertad. Siendo k el número de variables independientes en el modelo.
Figura 4.6 Regla de decisión, prueba de hipótesis para
Si < T < se acepta la hipótesis nula, en caso contrario se rechaza (figura 4.6).
Una vez elegidas las variables independientes que realmente influyen en el comportamiento de Y, se pueden construir intervalos de confianza para cada uno de los coeficientes de regresión poblacional ( )
Este intervalo nos proporciona, con una confiabilidad del (1- )%, los valores dentro de los cuales variará Y si Xi varía en una unidad y las demás variables permanecen constantes. El intervalo se construye así:
Como en el caso de la prueba de hipótesis, si n ³ 30 los valores de Z se hallan en la distribución normal, y si n < 30 los valores de Z se hallan en la distribución t con n-k-1 grados de libertad.
la
...