Correlacion
Enviado por shavahero • 29 de Mayo de 2013 • 1.194 Palabras (5 Páginas) • 339 Visitas
Correlación de rango
En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos variables estadísticas. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad
El objetivo de este tema es conocer cómo se relacionan dos variables mediante el coeficiente de correlación. Primeramente se desarrollara el coeficiente de correlación muestral (r) como una medida de que tan fuerte es la relación de dos variables x y y en una muestra y luego se relaciona r con el coeficiente de correlación poblacional P.
Coeficiente de correlación muestral r
Dados n pares numéricos (x1,y1), (x2,y2), (x3,y3)….(xn,yn), es natural hablar de que x y y tienen una relación positiva si las x grandes se aparean con y grandes y las x pequeñas con y pequeñas. Asimismo, si las x grandes se aparean con y pequeñas y las x pequeñas se aparean con las y grandes, entonces implica una relación negativa entre las variables.
S_xy=∑_(i=1)^n▒〖(xi-x ̅ )(yi-y ̅ )= ∑_(i=1)^n▒x_i 〗 y_i-((∑_(i=1)^n▒〖x_i)〗(∑_(i=1)^n▒〖y_i)〗)/n
La relación S_xy es positiva si los valores de x por encima de la media se aparean con las y por encima de la media y los valores de x por debajo de la media también se aparean con las y por debajo de la media. Cuando la relación es negativa S_xy también es negativa, puesto que la mayoría de los productos (x_i-x ̅ )(y_i-y ̅) serán negativos.
Aunque S_xy parece ser una medida plausible de la fuerza de relación, aun no se sabe que tan positiva o negativa puede ser. Una condición razonable para imponer cualquier medida de que tan fuerte es la relación de x y y es que la medida calculada no deberá depender de las unidades particulares utilizadas para medirlas. Esta condición se cumple modificando S_xy para obtener el coeficiente de correlación muestral.
Propiedades de r
Las propiedades más importantes son las siguientes:
El valor de r no depende de cuál de las dos variables estudia es x y cual es y.
El valor de r es independiente de las unidades en que x y y estén medidas.
-1≤r≤1
R=1 si y solo si todos los pares (xi,yi) quedan en una recta con pendiente positiva, y r=-1 si y solo si los pares (xi,yi) quedan en una recta con pendiente negativa.
El cuadrado del coeficiente de correlación muestral da el calor del coeficiente de determinación que resultaría de ajustar el modelo de regresión lineal simple en símbolos 〖(r)〗^2= r^2
Una pregunta frecuentemente planteada es, “¿Cuándo se puede decir que existe una correlación fuerte entre las variables y cuando es débil?”. He aquí una regla de oro informal para caracterizar el valor de r.
Débil -.5 ≤r≤.5
Moderada si-.8<r<-.5 o .5<r<.8
Fuerte si r ≥.8 o r≤-.8
Inferencias sobre el coeficiente de correlación de una población
El coeficiente de correlación r mide que tan fuerte es la relación entre x y y en la muestra observada. Se puede pensar que los pares (x,y) se sacaron de una población de pares bivariantes, con (Xi,Yi)teniendo alguna función masa de probabilidad conjunta (Xi,Yi) teniendo alguna.
El coeficiente de correlación p se define como:
p = p(X, Y)= (Cov (X,Y))/σ_(x∙σ_y )
Donde:
∑_x ∑_y (x-μx)(y-μy)p(x,y) (X,Y)discreto
cov (X, Y)=
∫_(-∞)^∞▒∫_(-∞)^∞▒〖(x-μx)(y-μ)f(x,y)dxdy (X,Y)continuo〗
Si se considera que p(x,y) o f (x,y) describen la distribución de pares de valores dentro de toda la población, p se transforma en una medida de que tan fuerte están relacionadas x y y en toda la población.
El coeficiente de correlación de la población p es un parámetro o característica de la población, así que se puede utilizar el coeficiente de correlación muestral para hacer varias inferencias sobre p. En particular, r es una estimación puntual de p y el estimador correspondiente es :
p ̂=R= (∑▒〖(X_i-X ̅)(Y_i-Y ̅)〗)/(√(∑▒〖〖(X〗_i-X ̅)〗^2 ) √(∑▒〖〖(Y〗_i-Y ̅)〗^2 ))
Ejemplo 1:
Una evaluación precisa de la productividad del suelo es crítica para una planificación racional de uso del suelo. Desafortunadamente, como el autor del artículo “Productivity Ratings Base don Soil Series” argumenta, no es fácil obtener un índice de productividad del suelo
...