Supuestos
Enviado por cicisss • 10 de Septiembre de 2013 • 670 Palabras (3 Páginas) • 256 Visitas
Regresión lineal simple y múltiple
1.1. Regresión Lineal simple
INTRODUCCION
El término "regresión" fue acuñado por Sir Francis Galton (1822-1911), primo de Charles Darwin. Galton estudiaba la eugénica, término también introducido por sí mismo para definir el estudio de la mejora de la raza humana a partir de los caracteres hereditarios.
Galton estudió la altura de los hijos con relación a la altura de sus padres, y probó que la altura de hijos altos “regresaba” hacia la media de la altura de la población a lo largo de sucesivas generaciones. En otras palabras, hijos de padres extraordinariamente altos tendían a ser en promedio más bajos que sus padres, e hijos de padres muy bajos tendían a ser en promedio más altos que sus padres. En la actualidad, el término de regresión se utiliza siempre que se busca predecir una variable en función de otra, y no implica que se esté estudiando si se está produciendo una regresión a la media. Anteriormente a Galton se debe mencionar a Legendre (1752-1833), quien introdujo el método de los mínimos cuadrados utilizándolos para definir la longitud de 1 metro como una diez millonésima parte del arco meridional. Con posterioridad a Galton, las propiedades de las técnicas de regresión fueron estudiadas por Edgeworth, Pearson y Yule.
La técnica de regresión lineal simple está indicada cuando se pretende explicar una variable respuesta cuantitativa en función de una variable explicativa cuantitativa también llamada variable independiente, variable regresora o variable predictora. Por ejemplo, se podría intentar explicar el peso en función de la altura. El modelo intentaría aproximar la variable respuesta mediante una función lineal de la variable explicativa.
Las suposiciones que se realizan al aplicar las técnicas de regresión lineal son:
-El modelo propuesto es lineal (es decir existe relación entre la variable explicativa y la variable explicada, y esta relación es lineal). Es decir se asume que:
var.respuesta0var. explicativa1β
Siendo 0el término independiente (constante o ”intercept”), 1el coeficiente de regresión de la variable explicativa (pendiente o “slope”) y es una variable aleatoria que se llama error residual.
-La variable explicativa se ha medido sin error.
-El valor esperado de del modelo es cero.
-La varianza de (y por lo tanto de la variable respuesta) es constante.
-Los son independientes entre sí.
-Si se desean realizar contrastes de hipótesis sobre los parámetros (coeficientes) o sobre el modelo, también es necesario que la distribución de sea normal.
Para estudiar la validez del modelo es necesario confirmar estas hipótesis mediante el estudio de los residuos
...