Probabilidad Y Estadistica
Enviado por zpu221291 • 11 de Junio de 2012 • 868 Palabras (4 Páginas) • 725 Visitas
6.8 Coeficiente de determinación. Coeficiente de correlación.
Una vez ajustada la recta de regresión a la nube de observaciones es importante disponer de una medida que mida la bondad del ajuste realizado y que permita decidir si el ajuste lineal es suficiente o se deben buscar modelos alternativos. Como medida de bondad del ajuste se utiliza el coeficiente de determinación, definido como sigue
(6.15)
o bien
Como scE < scG, se verifica que 0 < R2 < 1.
El coeficiente de determinación mide la proporción de variabilidad total de la variable dependiente respecto a su media que es explicada por el modelo de regresión. Es usual expresar esta medida en tanto por ciento, multiplicándola por cien.
Por otra parte, teniendo en cuenta que i - = 1 , se se obtiene
(6.16)
Dadas dos variables aleatorias cualesquiera X e Y , una medida de la relación lineal que hay entre ambas variables es el coeficiente de correlación definido por
(6.17)
donde representa la desviación típica de la variable X (análogamente para ). Un buen estimador de este parámetro es el coeficiente de correlación lineal muestral (o coeficiente de correlación de Pearson), definido por
(6.18)
Por tanto, r . Este coeficiente es una buena medida de la bondad del ajuste de la recta de regresión. Evidentemente, existe una estrecha relación entre r y 1 aunque estos estimadores proporcionan diferentes interpretaciones del modelo:
* r es una medida de la relación lineal entre las variables X e Y.
* 1 mide el cambio producido en la variable Y al realizarse un cambio de una unidad en la variable X.
De las definiciones anteriores se deduce que:
Es importante estudiar si r es significativo (distinto de cero) ya que ello implica que el modelo de regresión lineal es significativo. Desafortunadamente la distribución de r es complicada pero para tamaños muestrales mayores que 30 su desviación típica es 1/ , y puede utilizarse la siguiente regla
En la interpretación del coeficiente de correlación se debe tener en cuenta que:
• r = ±1 indica una relación lineal exacta positiva (creciente) o negativa (decreciente),
• r = 0 indica la no existencia de relación lineal estocástica, pero no indica independencia de las variables ya que puede existir una relación no lineal incluso exacta,
• valores intermedios de r (0 < r < 1 ó -1 < r < 0) indican la existencia de una relación lineal estocástica, más fuerte cuanto más próximo a +1 (ó -1) sea el valor de r.
Para poder interpretar con mayor facilidad el coeficiente de correlación muestral se exponen varias nubes de observaciones y el ajuste lineal obtenido:
Figura 6.7. Existe una dependencia funcional lineal, las
...