Corelacion Y Regresion
Enviado por XxrextarxX • 6 de Mayo de 2014 • 1.170 Palabras (5 Páginas) • 294 Visitas
CORRELACION Y REGRESION
1.-Correlacion Lineal:
La correlación trata de establecer la relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional.
Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables están correlacionadas o que hay correlación entre ellas. En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias.
Por ejemplo, podemos preguntarnos si hay alguna relación entre las notas de la asignatura Estadística I y las de Matemáticas I. Una primera aproximación al problema consistiría en dibujar en el plano R2 un punto por cada alumno: la primera coordenada de cada punto sería su nota en estadística, mientras que la segunda sería su nota en matemáticas. Así, obtendríamos una nube de puntos la cual podría indicarnos visualmente la existencia o no de algún tipo de relación (lineal, parabólica, exponencial, etc.) entre ambas notas.
Otro ejemplo, consistiría en analizar la facturación de una empresa en un periodo de tiempo dado y de cómo influyen los gastos de promoción y publicidad en dicha facturación. Si consideramos un periodo de tiempo de 10 años, una posible representación sería situar un punto por cada año de forma que la primera coordenada de cada punto sería la cantidad en euros invertidos en publicidad, mientras que la segunda sería la cantidad en euros obtenidos de su facturación. De esta manera, obtendríamos una nube de puntos que nos indicaría el tipo de relación existente entre ambas variables. En particular, nos interesa cuantificar la intensidad de la relación lineal entre dos variables.
El parámetro que nos da tal cuantificación es el coeficiente de correlación lineal de Pearson r, cuyo valor oscila entre –1 y +1 :
2.-Coeficinete de correlación de Pesaron:
Este coeficiente nos informa del grado de relación entre dos variables. Si la relación es lineal perfecta, r será 1 ó -1. El coeficiente r será positivo si la relación es positiva (al aumentar x aumenta y), y r será negativo en el caso contrario (si al aumentar x, disminuye y).
En general, valores (absolutos) de r > 0,80 se consideran altos, aunque esto depende del número de parejas de datos con las que hemos realizado el cálculo y del nivel de seguridad con el que queramos extraer nuestras conclusiones. No vamos a entrar en el estudio del nivel de significación del coeficiente r , pero como indicación: para 11 parejas de datos, y si admitimos un 5% de posibilidades de equivocarnos, con r>0,553 ya podemos decir que ambas series de datos no son independientes (parece que tienen algún tipo de relación). Si tuviéramos 50 parejas de datos, nos bastaría r>0,273 para sacar la misma conclusión (siempre considerando el valor absoluto de r) Si nos ponemos más estrictos, y queremos sacar la conclusión de que las dos series no son independientes con un 99% de seguridad (sólo un 1% de posibilidad de error), con 11 parejas necesitamos que r>0,684 y con 50 parejas r>0,354
Precauciones:
1. El que estemos seguros de que ambas series están relacionadas, no quiere decir que la relación sea tan estrecha como para estimar valores de y desconocidos a partir de valores de x conocidos; eso dependerá del error de estimación que aceptemos.
2. La existencia de una correlación no indica relación causa-efecto
3.-Rango de Spermann:
Este coeficiente se emplea cuando una o ambas escalas de medidas de las variables son ordinales, es decir, cuando una o ambas escalas de medida son posiciones. Ejemplo: Orden de llegada en una carrera y peso de los atletas.
Se calcula aplicando la siguiente ecuación:
Nota: Los datos hay que traducirlos u ordenarlos en rangos. A los puntajes más elevados le asignamos el rango 1 al siguiente el rango 2 y así sucesivamente. Si se repiten dos puntajes o más se calculan las medias aritméticas.
Ejemplo ilustrativo N° 1: La siguiente tabla muestra el rango u orden obtenido en la primera evaluación (X) y el rango o puesto obtenido en las egunda evaluación (Y) de 8 estudiantes universitarios en la asignatura de Estadística.
Calcular
...