Relación entre variables cuantitativas

camiloarenas510 de Noviembre de 2012

2.123 Palabras (9 Páginas)895 Visitas

Página 1 de 9

Pita Fernández S., Pértega Díaz S.

Unidad de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Juan Canalejo. A Coruña.

Cad Aten Primaria 1997; 4: 141-144. Actualización 30/03/2001.

____________________________________

En el análisis de los estudios clínico-epidemiológicos surge muy frecuentemente la necesidad de

determinar la relación entre dos variables cuantitativas en un grupo de sujetos. Los objetivos de dicho

análisis suelen ser:

a. Determinar si las dos variables están correlacionadas, es decir si los valores de una variable

tienden a ser más altos o más bajos para valores más altos o más bajos de la otra variable.

b. Poder predecir el valor de una variable dado un valor determinado de la otra variable.

c. Valorar el nivel de concordancia entre los valores de las dos variables.

Correlación

En este artículo trataremos de valorar la asociación entre dos variables cuantitativas estudiando el método

conocido como correlación. Dicho cálculo es el primer paso para determinar la relación entre las

variables. La predicción de una variable. La predicción de una variable dado un valor determinado de la

otra precisa de la regresión lineal que abordaremos en otro artículo.

La cuantificación de la fuerza de la relación lineal entre dos variables cuantitativas, se estudia por medio

del cálculo del coeficiente de correlación de Pearson (1-3). Dicho coeficiente oscila entre –1 y +1. Un

valor de –1 indica una relación lineal o línea recta positiva perfecta. Una correlación próxima a cero

indica que no hay relación lineal entre las dos variables.

El realizar la representación gráfica de los datos para demostrar la relación entre el valor del coeficiente

de correlación y la forma de la gráfica es fundamental ya que existen relaciones no lineales.

El coeficiente de correlación posee las siguientes características (4):

a. El valor del coeficiente de correlación es independiente de cualquier unidad usada para medir las

variables.

b. El valor del coeficiente de correlación se altera de forma importante ante la presencia de un valor

extremo, como sucede con la desviación típica. Ante estas situaciones conviene realizar una

transformación de datos que cambia la escala de medición y modera el efecto de valores

extremos (como la transformación logarítmica).

c. El coeficiente de correlación mide solo la relación con una línea recta. Dos variables pueden

tener una relación curvilínea fuerte, a pesar de que su correlación sea pequeña. Por tanto cuando

analicemos las relaciones entre dos variables debemos representarlas gráficamente y

posteriormente calcular el coeficiente de correlación.

d. El coeficiente de correlación no se debe extrapolar más allá del rango de valores observado de

las variables a estudio ya que la relación existente entre X e Y puede cambiar fuera de dicho

rango.

e. La correlación no implica causalidad. La causalidad es un juicio de valor que requiere más

información que un simple valor cuantitativo de un coeficiente de correlación (5).

El coeficiente de correlación de Pearson (r) puede calcularse en cualquier grupo de datos, sin embargo la

validez del test de hipótesis sobre la correlación entre las variables requiere en sentido estricto (4): a) que

las dos variables procedan de una muestra aleatoria de individuos. b) que al menos una de las variables

tenga una distribución normal en la población de la cual la muestra procede. Para el cálculo válido de un

intervalo de confianza del coeficiente de correlación de r ambas variables deben tener una distribución

normal. Si los datos no tienen una distribución normal, una o ambas variables se pueden transformar

(transformación logarítmica) o si no se calcularía un coeficiente de correlación no paramétrico

(coeficiente de correlación de Spearman) que tiene el mismo significado que el coeficiente de correlación

de Pearson y se calcula utilizando el rango de las observaciones.

Investigación: Relación entre variables cuantitativas 2/8

www.fisterra.com Atención Primaria en la Red

El cálculo del coeficiente de correlación (r) entre peso y talla de 20 niños varones se muestra en la tabla 1.

La covarianza, que en este ejemplo es el producto de peso (kg) por talla (cm), para que no tenga

dimensión y sea un coeficiente, se divide por la desviación típica de X (talla) y por la desviación típica de

Y (peso) con lo que obtenemos el coeficiente de correlación de Pearson que en este caso es de 0.885 e

indica una importante correlación entre las dos variables. Es evidente que el hecho de que la correlación

sea fuerte no implica causalidad. Si elevamos al cuadrado el coeficiente de correlación obtendremos el

coeficiente de determinación (r2=0.783) que nos indica que el 78.3% de la variabilidad en el peso se

explica por la talla del niño. Por lo tanto existen otras variables que modifican y explican la variabilidad

del peso de estos niños. La introducción de más variable con técnicas de análisis multivariado nos

permitirá identificar la importancia de que otras variables pueden tener sobre el peso.

Tabla 1. Cálculo del Coeficiente de correlación de Pearson entre las

variables talla y peso de 20 niños varones

Peso (Kg)

Talla (cm)

5.65

9.65

-7.35

1.65

-6.35

-8.35

3.65

-1.35

-12.35

16.65

-2.35

-0.35

-5.35

-0.35

-9.35

14.65

-7.35

4.65

-4.35

8.65

1.4

2.4

-1.6

0.4

2.4

-2.6

0.4

-0.6

-3.6

3.4

-0.6

-1.6

0.4

-2.6

3.4

-2.6

1.4

-1.6

2.4

7.91

23.16

11.76

0.66

-15.24

21.71

1.46

0.81

44.46

56.61

1.41

0.21

8.56

-0.14

24.31

49.81

19.11

6.51

6.96

20.76

Sx = Desviación típica x = 8.087

Sy = Desviación típica y = 2.137

Investigación: Relación entre variables cuantitativas 3/8

www.fisterra.com Atención Primaria en la Red

Test de hipótesis de r

Tras realizar el cálculo del coeficiente de correlación de Pearson (r) debemos determinar si dicho

coeficiente es estadísticamente diferente de cero. Para dicho calculo se aplica un test basado en la

distribución de la t de student.

Si el valor del r calculado (en el ejemplo previo r = 0.885) supera al valor del error estándar multiplicado

por la t de Student con n-2 grados de libertad, diremos que el coeficiente de correlación es significativo.

El nivel de significación viene dado por la decisión que adoptemos al buscar el valor en la tabla de la t de

Student.

En el ejemplo previo con 20 niños, los grados de libertad son 18 y el valor de la tabla de la t de student

para una seguridad del 95% es de 2.10 y para un 99% de seguridad el valor es 2.88. (Tabla 2)

Como quiera que r = 0.885 > a 2.10 * 0.109 = 2.30 podemos asegurar que el coeficiente de correlación es

significativo (p<0.05). Si aplicamos el valor obtenido en la tabla de la t de Student para una seguridad del

99% (t = 2.88) observamos que como r = 0.885 sigue siendo > 2.88 * 0.109 = 0.313 podemos a su vez

asegurar que el coeficiente es significativo (p<0.001). Este proceso de razonamiento es válido tanto para

muestras pequeñas como para muestras grandes. En esta última situación podemos comprobar en la tabla

de la

...

Descargar como (para miembros actualizados) txt (15 Kb)

Leer 8 páginas más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com