Correlacion
Enviado por chorron23 • 21 de Noviembre de 2012 • 6.493 Palabras (26 Páginas) • 440 Visitas
COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON
1.1.- Introducción ..........................................................................................................2
1.2.- Coeficiente de correlación lineal de Pearson........................................................ 2
1.3.- Formula utilizada .................................................................................................. 5
1.4.- Significación del coeficiente de correlación...................................................... 11
1.5.- Interpretación del coeficiente de correlación ......................................................14
1.6.- Correlación y causalidad ....................................................................................15
1.7.- Aplicación Informática .......................................................................................17
Bibliografía ..................................................................................................................19
COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON
1.1- Introducción
Antes de introducirnos en el modelo de regresión lineal, que hace referencia a la naturaleza de la relación entre distintas variables, pasaremos a exponer el estadístico utilizado para medir la magnitud de la relación (supuestamente lineal) entre dichas variables. Tiene sentido darle un tratamiento aparte por su importancia y las continuas referencias que ofreceremos a lo largo de este texto. Comenzaremos su desarrollo, por razones de simplicidad, para el caso particular de dos variables.
1.2.- Coeficiente de correlación lineal de Pearson
El coeficiente de correlación de Pearson, pensado para variables cuantitativas (escala mínima de intervalo), es un índice que mide el grado de covariación entre distintas variables relacionadas linealmente. Adviértase que decimos "variables relacionadas linealmente". Esto significa que puede haber variables fuertemente relacionadas, pero no de forma lineal, en cuyo caso no proceder a aplicarse la correlación de Pearson. Por ejemplo, la relación entre la ansiedad y el rendimiento tiene forma de U invertida; igualmente, si relacionamos población y tiempo la relación será de forma exponencial. En estos casos (y en otros muchos) no es conveniente utilizar la correlación de Pearson. Insistimos en este punto, que parece olvidarse con cierta frecuencia.
El coeficiente de correlación de Pearson es un índice de fácil ejecución e, igualmente, de fácil interpretación. Digamos, en primera instancia, que sus valores absolutos oscilan entre 0 y 1. Esto es, si tenemos dos variables X e Y, y definimos el coeficiente de
correlación de Pearson entre estas dos variables como rxy
entonces:
0 rxy 1
Hemos especificado los términos "valores absolutos" ya que en realidad si se contempla el signo el coeficiente de correlación de Pearson oscila entre –1 y +1. No obstante ha de indicarse que la magnitud de la relación vienen especificada por el valor numérico del coeficiente, reflejando el signo la dirección de tal valor. En este sentido, tan fuerte es una relación de +1 como de -1. En el primer caso la relación es perfecta positiva y en el segundo perfecta negativa. Pasamos a continuación a desarrollar algo más estos conceptos.
Decimos que la correlación entre dos variables X e Y es perfecta positiva cuando exactamente en la medida que aumenta una de ellas aumenta la otra. Esto sucede cuando la relación entre ambas variables es funcionalmente exacta. Difícilmente ocurrirá en psicología, pero es frecuente en los ciencias físicas donde los fenómenos se ajustan a leyes conocidas, Por ejemplo, la relación entre espacio y tiempo para un móvil que se desplaza a velocidad constante. Gráficamente la relación ser del tipo:
1500,00
1000,00
500,00
0,00
0,00 5,00 10,00 15,00 20,00
Tiempo
Se dice que la relación es perfecta negativa cuando exactamente en la medida que aumenta una variable disminuye la otra. Igual que en el caso anterior esto sucede para relaciones funcionales exactas, propio de las ciencias físicas. Por ejemplo, la relación entre presión y volumen se ajusta a este caso. El gráfico que muestra la relación sería del tipo:
20,00
15,00
10,00
5,00
0,00
0,00 5,00 10,00 15,00 20,00
Presion
En los fenómenos humanos, fuertemente cargados de componentes aleatorios, no suelen ser posible establecer relaciones funcionales exactas. Dado un cierto valor en la variable X no encontraremos uno y solo un único valor en la variable Y. Por ejemplo, si relacionamos horas de estudio con el rendimiento académico obtendremos mayor rendimiento a mayor inteligencia, pero será prácticamente imposible saber con exactitud la puntuación que obtendrá un sujeto para unas horas determinadas. Dado un cierto número de personas con un mismo número de horas, por ejemplo 10, no todos
obtendrán exactamente la misma puntuación en rendimiento. Unos obtendrán más o menos en función de otras variables, tales como motivación o personalidad. Si relacionásemos ambas variables dada una muestra de sujetos tendríamos un gráfico de las siguientes características:
10,000
8,000
6,000
4,000
2,000
5,000 10,000 15,000 20,000 25,000
Horas de estudio
Se observa que para un mismo valor en inteligencia existen diferentes posibles valores en rendimiento. Se trata de una correlación positiva pero no perfecta. Este conjunto de
...