Protocolo
Enviado por Xhuna94 • 20 de Diciembre de 2014 • 961 Palabras (4 Páginas) • 320 Visitas
Una vez ajustada la recta de regresión a la nube de observaciones es importante disponer de una medida que mida la bondad del ajuste realizado y que permita decidir si el ajuste lineal es suficiente o se deben buscar modelos alternativos. Como medida de bondad del ajuste se utiliza el coeficiente de determinación, definido como sigue
sum n 2
2 scE i=1 (y^i- y)
R = scG--= sum n------2-
(yi- y)
i=1
(6.15)
o bien
scR n - 2 ^s2 R2 = 1
-----= 1- ----- -R2-
scG n - 1 ^sY
Como scE < scG, se verifica que 0 < R2 < 1.
El coeficiente de determinación mide la proporción de variabilidad total de la variable dependiente (Y ) respecto a su media que es explicada por el modelo de regresión. Es usual expresar esta medida en tanto por ciento, multiplicándola por cien.
Por otra parte, teniendo en cuenta que y^ i -y = ^a1(xi- x), se se obtiene
s2 R2 = -2XY2
sX sY
(6.16)
Dadas dos variables aleatorias cualesquiera X e Y , una medida de la relación lineal que hay entre ambas variables es el coeficiente de correlación definido por
Cov(X, Y) r = -----------
s (X) s(Y)
(6.17)
donde s(X) representa la desviación típica de la variable X (análogamente para s(Y )). Un buen estimador de este parámetro es el coeficiente de correlación lineal muestral (o coeficiente de correlación de Pearson), definido por
sXY-- V~ -2- r = sX
sY = signo(^a1) R .
(6.18)
Por tanto, r (- [-1,1]. Este coeficiente es una buena medida de la bondad del ajuste de la recta de regresión. Evidentemente, existe una estrecha relación entre r y ^a1 aunque estos estimadores proporcionan diferentes interpretaciones del modelo:
* r es una medida de la relación lineal entre las variables X e Y.
* a^1 mide el cambio producido en la variable Y al realizarse un cambio de una unidad en la variable X.
De las definiciones anteriores se deduce que:
s = 0 <==> ^a = 0
<==> r = 0.
XY 1
Es importante estudiar si r es significativo (distinto de cero) ya que ello implica que el modelo de regresión lineal es significativo. Desafortunadamente la distribución de r es complicada pero para tamaños muestrales mayores que 30 su desviación típica es s(r) -~ 1/ V~ n, y puede utilizarse la siguiente regla
2 |r| > V~ n ==> r
es significativo (con a = 0'05)
En la interpretación del coeficiente de correlación se debe tener en cuenta que:
· r = ±1 indica una relación lineal exacta positiva (creciente) o negativa (decreciente),
· r = 0 indica la no existencia de relación
...