Regresión Y Correlación
Enviado por Lizmacor • 14 de Abril de 2014 • 1.399 Palabras (6 Páginas) • 235 Visitas
Inga. Patricia Juárez
1
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA
FACULTAD DE CIENCIAS MÉDICAS
ESTADISTICA
REGRESIÓN Y CORRELACIÓN
Analizaremos como ajustar un modelo simple a un conjunto de datos, mediante un análisis de regresión, el cual utiliza un modelo matemático para obtener estimaciones y la predicción de una variable dada en función de valores conocidos de otras variables. El grado de correlación entre dos variables es fundamental del análisis de regresión.
REGRESIÓN:
Es la relación entre sí de dos o más variables. La cual indica que la variable dependiente se produce sobre la base de una variable independiente.
CORRELACIÓN:
Mide la intensidad de la relación existente entre las variables de estudio, es decir si una variable dada depende de la otra variable entonces existe una correlación; por el contrario una variable que es independiente de otra variable se dice que no hay correlación o bien que la correlación es nula.
DIAGRAMA DE DISPERSIÓN:
Es la representación gráfica sobre un plano cartesiano de los valores de la variable dependiente e independiente, que es el punto de partida para el análisis de regresión y correlación, así se determina la linealidad o no linealidad
REGRESIÓN LINEAL:
La regresión lineal utiliza un modelo lineal de la forma:
Y = a + bX
Y es el valor sobre el eje vertical, X valor sobre el eje horizontal, a el punto donde la recta cruza el eje vertical y b indica la cantidad con la cual Y cambia por cada unidad del cambio de X. La ordenada al origen es a y b es la pendiente de la recta.
2014
Inga. Patricia Juárez
2
Donde las constantes a y b se determinan mediante el sistema de ecuaciones:
Y = a n + b X
XY = a X + b X²
ANÁLISIS DE CORRELACIÓN:
Mide la intensidad con la que se relacionan linealmente las variables entre sí. La correlación no presupone relación funcional alguna, sino tan solo se emplea para indicar el grado de relación entre las variables. Esta puede ser positiva o negativa.
COEFICIENTE DE CORRELACION:
Es una medición abstracta del grado de relación entre las variables. Una cuantificación del grado en que un modelo teórico se ajusta a los datos reales de dos variables, nos indica si es aplicable o no el modelo de regresión.
r = n XY – ( X) ( Y ) .
√[n ( X² ) – ( X) ² ] [n ( Y² ) – ( Y ) ² ]
El rango del coeficiente de correlación es – 1 < r < + 1, si las dos variables tienen una relación lineal perfecta y cada una aumenta en forma proporcional respecto a la otra, tendría un coeficiente de correlación a 1, en tal caso se le llama correlación directa y perfecta, cuando una aumenta la otra disminuye en proporción, tendría un coeficiente de correlación igual –1 en tal caso se le llama correlación inversa perfecta. El valor 0 significa que no existe correlación entre las variables X & Y, o bien que la correlación es nula.
2014
Inga. Patricia Juárez
3
Interpretación del coeficiente de correlación
Valor de r
Correlación
Signo positivo
Signo negativo
1.0
Perfecta
Positiva/directa
0.9 - 0.99
Muy alta
Positivo
negativo
0.7 - 0.89
Moderada
0.4 - 0.69
Baja
0.20 - 0.39
Baja
Positivo
Negativo
0.01 – 0.19
Muy baja
0
Nula
-1
perfecta
Negativa/inversa
ERROR TIPICO DE ESTIMACIÓN:
Es análogo a la desviación típica, se obtiene de la relación que existe entre los puntos de un diagrama de dispersión y la curva de ajuste obtenida por el método de mínimos cuadrados.
Para la regresión lineal de Y sobre X, el error típico de estima se calcula con la siguiente formula:
S yx = √ [( Y² – a Y – b XY) / n ]
NOTA:
Es importante indicar que cuando los valores de a y b son muy pequeños, deberán tomarse por lo menos 5 o 6 decimales.
COEFICIENTE DE DETERMINACIÓN:
Si los datos se dispersan ampliamente respecto a la ecuación de regresión, el grado de ajuste es bajo. Sin embargo, si los puntos se acumulan muy cerca de la línea de regresión, el ajuste es alto. La medida estadística que se usa para medir el grado de ajuste se llama coeficiente de determinación.
El coeficiente de determinación de la muestra mide la proximidad del ajuste de la regresión de la muestra a los valores observados de Y.
rd = r²
2014
Inga. Patricia Juárez
4
Ejemplo:
Un grupo de psicólogos decidieron analizar el comportamiento de horas de estudio a la semana con la nota que obtuvieron en el examen parcial.
X = Horas de estudio (variable independiente)
Y = Nota del examen (variable dependiente)
a) Determinar la ecuación de la recta de regresión de Y sobre X.
Horas Notas
X Y X² Y² XY
3 57 9 3249 171
4 78 16 6084 312
4 72 16 5184 288
2 58 4 3364 116
5 89 25 7921 445
3 63 9 3969 189
4 73 16 5329 292
5 84 25 7056 420
3 75 9 5625 225
2
...