Correlacion
Enviado por karmele2 • 18 de Diciembre de 2012 • 562 Palabras (3 Páginas) • 298 Visitas
1. Concepto de correlación y covarianza
1.1. Relación y variación conjunta
El concepto de relación en estadística coincide con lo que se entiende por relación en el
lenguaje habitual: dos variables están relacionadas si varían conjuntamente. Si los sujetos tienen
valores, altos o bajos, simultáneamente en dos variables, tenemos una relación positiva. Por ejemplo
peso y altura en una muestra de niños de 5 a 12 años: los mayores en edad son también los más altos y
pesan más, y los más jóvenes son los que pesan menos y son más bajos de estatura; decimos que peso
y altura son dos variables que están relacionadas porque los más altos pesan más y los más bajos pesan
menos.
Si los valores altos en una variable coinciden con valores bajos en otra variable, tenemos una
relación negativa; por ejemplo edad y fuerza física en una muestra de adultos de 30 a 80 años de edad:
los mayores en edad son los menores en fuerza física; hay una relación, que puede ser muy grande,
pero negativa: según los sujetos aumentan en una variable (edad) disminuyen en la otra (fuerza física).
La correlación se define por lo tanto por la co-variación (co = con, juntamente: variar a la vez).
Correlación y covarianza son términos conceptualmente equivalentes, expresan lo mismo. La
covarianza es también una medida de relación, lo mismo que el coeficiente de correlación.
Habitualmente se utiliza el coeficiente de correlación (r de Pearson), pero es útil entender
simultáneamente qué es la covarianza, y entenderlo precisamente en este contexto, el de las medidas
de relación.
El concepto de relación y qué se mide exactamente con estos coeficientes, lo veremos mejor con
un ejemplo (tabla 1) donde tenemos los datos de tres situaciones o casos distintos:
1) En cada caso tenemos cuatro sujetos (ejemplo reducido para poder ver todos los datos con
facilidad) con puntuaciones en dos variables, X (un test de inteligencia) e Y (una prueba
objetiva de rendimiento).
2) Junto a la puntuación de cada sujeto en las dos variables, X e Y, ponemos su número de orden:
1º al que tenga la puntuación más alta, 2º al que tenga la siguiente más alta, etc.:
Caso 1º Caso 2º Caso 3º
X nº de
orden Y nº de
orden X nº de
orden Y nº de
orden X nº de
orden Y nº de
orden
50 1º 13 1º 50 1º 10 4º 50 1º 12 2º
49 2º 12 2º 49 2º 11 3º 49 2º 10 4º
48 3º 11 3º 48 3º 12 2º 48 3º 13 1º
47 4º 10 4º 47 4º 13 1º 47 4º 11 3º
En el caso 1º los sujetos
tienen el mismo orden en
las dos variables: el tener
más de X coincide con
tener más de Y. Entre X e
Y existe una relación
...