REGRESIÓN LINEAL MÚLTIPLE
Enviado por ssafggg • 26 de Junio de 2013 • Tesis • 788 Palabras (4 Páginas) • 668 Visitas
REGRESIÓN LINEAL MÚLTIPLE
Introducción
Es evidente que lo más económico y rápido para modelar el comportamiento de una variable Y es usar una sola variable preeditora y usar un modelo lineal. Pero algunas veces es bastante obvio de que el comportamiento de Y es imposible que sea explicada en gran medida por solo una variable.
Por ejemplo, es imposible tratar de explicar el rendimiento de un estudiante en un
examen, teniendo en cuenta solamente el número de horas que se preparó para ella. Claramente, el promedio académico del estudiante, la carga académica que lleva, el año de estudios, son tres de las muchas otras variables que pueden explicar su rendimiento. Tratar de explicar el comportamiento de Y con más de una variable preeditora usando una funcional lineal es el objetivo de regresión lineal múltiple.
Frecuentemente, uno no es muy familiar con las variables que están en juego y basa sus
conclusiones solamente en cálculos obtenidos con los datos tomados.
Es decir, si ocurre que el coeficiente de determinación R 2 sale bajo (digamos menor de un 30%) , considerando además que su valor no se ha visto afectado por datos anormales, entonces el modelo es pobre y para mejorarlo hay tres alternativas que frecuentemente se usan:
a) Transformar la variable preeditora, o la variable de respuesta Y, o ambas y usar luego un
modelo lineal.
b) Usar regresión polinómica con una variable preeditora.
c) Conseguir más variables preeditoras y usar una regresión lineal múltiple.
En el primer caso, se puede perder el tiempo tratando de encontrar la transformación más
adecuada y se podría caer en “overfitting”, es decir, encontrar un modelo demasiado optimista, que satisface demasiado la tendencia de los datos tomados pero que es pobre para hacer predicciones debido a que tiene una varianza grande.
En el segundo caso el ajuste es más rápido, pero es bien fácil caer en “overfitting” y, además se pueden crear muchos problemas de cálculo ya que pueden surgir problemas de colinealidad, es decir relación lineal entre los términos del modelo polinomio.
El tercer caso es tal vez la alternativa más usada y conveniente. Tiene bastante analogía con el caso simple, pero requiere el uso de vectores y matrices.
En el siguiente ejemplo se mostrará el uso interactivo de las tres alternativas a través de seis
modelos de regresión y servirá como un ejemplo de motivación para introducirnos en regresión
lineal múltiple.
El modelo de regresión lineal múltiple
El modelo de regresión lineal múltiple con p variables predictoras y basado en n observaciones
tomadas es
...