Regresion Lineal Simple Y Correlacion
Enviado por karlaaguilar9193 • 4 de Noviembre de 2013 • 2.359 Palabras (10 Páginas) • 674 Visitas
REGRESION LINEAL SIMPLE Y CORRELACION.
MODELO DE REGRESION LINEAL.
Regresión lineal. Permite determinar el grado de dependencia de las series de valores X e Y, prediciendo el valor y estimado que se obtendría para un valor x que no esté en la distribución.
Regresión lineal simple se basa en estudiar los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas variables que puede ser establecida por una expresión lineal, es decir, su representación gráfica es una línea recta. Es decir, se esta en presencia de una regresión lineal simple cuando una variable independiente ejerce influencia sobre otra variable dependiente.
Ejemplo: Y = f(x)
En estadística la regresión lineal o ajuste lineal es un método matemático que modela la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:
: variable dependiente, explicada o regresando.
: variables explicativas, independientes o regresores.
: parámetros, miden la influencia que las variables explicativas tienen sobre el regresando.
donde es la intersección o término "constante", las son los parámetros respectivos a cada variable independiente, y es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.
SUPUESTOS
Para poder crear un modelo de regresión lineal, es necesario que se cumpla con los siguientes supuestos:3
La relación entre las variables es lineal.
Los errores en la medición de las variables explicativas son independientes entre sí.
Los errores tienen varianza constante. (Homocedasticidad)
Los errores tienen una esperanza matemática igual a cero (los errores de una misma magnitud y distinto signo son equiprobables).
El error total es la suma de todos los errores.
Los valores de la variable independiente X son fijos, medidos sin error.
La variable Y es aleatoria
Para cada valor de X, existe una distribución normal de valores de Y (subpoblaciones Y)
Las variancias de las subpoblaciones Y son todas iguales.
Todas las medias de las subpoblaciones de Y están sobre la recta.
Los valores de Y están normalmente distribuidos y son estadísticamente independientes.
DETERMINACION DE LA ECUACION DE REGRESION
Primeramente, para determinar la ecuación de la regresión lineal hay que plantearlo, que es la siguiente:
Y=β_0+β_1 (x)
Donde:
β_0=la interseccion con el eje "y"
β_1=al grado de la pendiente de la recta.
X= es un valor que se obtiene de datos que nos da el problema.
Para obtener β_0 y β_1, se utiliza la formula de los minimos cuadrados que son las siguientes:
Para β_0 es:
β_0=y ̅-β_1 (x ̅)
Para β_1 es:
β_1=(Σxy-((Σx)(Σy))/n)/(Σx^2 ((Σ〖x)〗^2)/n)
Aplicando un ejemplo determinaremos los siguientes variables:
n=numero de datos
Σx=sumatoria de la columna "x"
Σx^2=sumatoria de la columna x^2
x ̅=promedio de las variables x
Σy=sumatoria de la columna "y"
Σy^2=sumatoria de la columna y^2
y ̅=promedio de las variables
Σxy=sumatoria de la multiplicacion de la columna "x" y "y
1.4 DETERMINACIÓN DEL COEFICIENTE DE CORRELACIÓN.
El coeficiente de correlación lineal es el cociente entre la covarianza y el producto de las desviaciones típicas de ambas variables. El coeficiente de correlación lineal se expresa mediante la letra r.
Propiedades.
1. El coeficiente de correlación no varía al hacerlo la escala de medición.
Es decir, si expresamos la altura en metros o en centímetros el coeficiente de correlación no varía.
2. El signo del coeficiente de correlación es el mismo que el de la covarianza.
Si la covarianza es positiva, la correlación es directa.
Si la covarianza es negativa, la correlación es inversa.
Si la covarianza es nula, no existe correlación.
3. El coeficiente de correlación lineal es un número real comprendido entre −1 y 1.
−1 ≤ r ≤ 1
4. Si el coeficiente de correlación lineal toma valores cercanos a −1 la correlación es fuerte e inversa, y será tanto más fuerte cuanto más se aproxime r a −1.
5. Si el coeficiente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y será tanto más fuerte cuanto más se aproxime r a 1.
6. Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es débil.
7. Si r = 1 ó −1, los puntos de la nube están sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional.
La formula que se emplean para determina el coeficiente de correlacion es:
r=σ_xy/(σ_x σ_y )
Donde hay que determinar
σ_xy= ( Σxy)/n-(x ̅)(y ̅)
σ_y=√((Σy^2)/n-(y ̅ ) ) σ_x=√((Σx^2)/n-(x ̅ ) )
CALCULO DE LOS COEFICIENTES DE CORRELACION Y DETERMINACION
Una vez ajustada la recta de regresión a la nube de observaciones es importante disponer de una medida que mida la bondad del ajuste realizado y que permita decidir si el ajuste lineal es suficiente o se deben buscar modelos alternativos. Como medida de bondad del ajuste se utiliza el coeficiente de determinación, definido como sigue
(6.15)
o bien
Como scE < scG, se verifica que 0 < R2 < 1.
El coeficiente de determinación mide la proporción de variabilidad total de la variable dependiente respecto a su media que es explicada por el modelo de regresión. Es usual expresar esta medida en tanto por ciento, multiplicándola por cien.
Por otra parte, teniendo en cuenta que i - = 1 , se se obtiene
(6.16)
Dadas dos variables aleatorias cualesquiera X e Y , una medida de la relación lineal que hay entre ambas variables es el coeficiente de correlación definido por
(6.17)
donde representa la desviación típica de la variable X (análogamente para ). Un buen estimador de este parámetro es el coeficiente de correlación lineal muestral (o coeficiente de correlación de Pearson), definido por
(6.18)
Por tanto, r . Este coeficiente es una buena medida de la bondad del ajuste de la recta de regresión. Evidentemente,
...