Estadistica. Los análisis de regresión y correlación
Enviado por ivianny • 30 de Junio de 2015 • 1.360 Palabras (6 Páginas) • 332 Visitas
Los análisis de regresión y correlación nos mostraran como determinar tanto la naturaleza como la fuerza de una relación entre dos variables, de esta forma aprenderemos a pronosticar con cierta precisión, el valor de una variable desconocida basándonos en observaciones anteriores de esa y otras variables.
El termino regresión fue utilizado por primera vez fue utilizado por primera vez como un concepto estadístico en 1.877 por sir Francis Galton, quien llevo a cabo un estudio que mostro que la estatura de los niños nacidos de padres altos tienden a retroceder o “regresar” hacia la estatura media de la población.
En el análisis de regresión, desarrollamos una ecuación de estimación, esto es, una formula matemática que relaciona las variables conocidas con la variable desconocida. Después de conocer el patrón de esta relación, podremos aplicar el análisis de correlación para determinar el grado en el que las variables se relacionan. El análisis de correlación entonces, nos indica que tan bien la ecuación de estimación describe realmente la relación.
Tipos de relación
El análisis de regresión y de correlación se basa en la relación, o asociación, entre dos (o más) variables. La variable (o variables) conocida (s) se llama variable(s) independiente(s); la que se trata de predecir es la variable dependiente.
En regresión, podemos tener solo una variable dependiente en la ecuación de estimación. Sin embargo podemos usar mas de una variable independiente. A menudo cuando agarramos variables independientes, mejoramos la exactitud de la predicción. Al incrementar la variable independiente, la variable dependiente también los hace. Podemos graficar una relación directa de este tipo colocando la variable independiente en el eje X y la variable dependiente en el eje Y; la pendiente de la recta sube cuando X toma valores más grandes, se dice que la pendiente de esa recta es positiva, porque Y crece si X crece. Las variaciones pueden también ser inversas en vez de directas, en esos caso la variable dependiente disminuye al aumenta la variable independiente; se caracteriza por una pendiente negativa (la variable dependiente Y disminuye al aumentar la variable independiente X). La variable independiente “causa” cambios en la variable dependiente.
Por esta razón, es importante considerar que las relaciones encontradas por la regresión son relacione de asociación, pero no necesariamente de causa y efecto. A menos que tenga razones especificas para creer que los valores de la variable dependiente se originan por los valores de las variables independientes, no infiera causalidad en las relaciones encontradas por la regresión.
Diagramas de dispersión
El primer paso para determinar si existe una relación entre dos variables es examinar la grafica de los datos observados (o conocidos). Esta grafica, o dibujo se llama diagrama de dispersión. Un diagrama de dispersión nos puede dar dos tipos de información. Visualmente, podemos identificar patrones que indiquen que las variables están relacionadas. Si esto sucede podemos ver qué tipo de línea, o ecuación de estimación, describe esta relación. La línea trazada a través de los puntos representa una relación directa, porque Y se incrementa al aumenta X, la relación discreta de los puntos está bien descrita por una línea recta. Por tanto podemos decir que es una relación lineal.
La relación entre las variables X y Y también puede tomar la forma de una curva, los especialistas en estadística la llaman relación curvilínea.
La dirección de la curva puede indicar si la relación curvilínea es directa o inversa. La curva de esta grafica describe una relación inversa porque Y disminuye al aumentar X.
Figura 12-4
Podemos repasar las graficas posibles en un diagrama de dispersión; las graficas (a) y (b) muestran relaciones lineales directas e inversas, la grafica (c) y (d) son ejemplos de relaciones curvilíneas que indican asociaciones directas e inversas entre variables, la grafica (e) ilustra una relación lineal inversa con un patrón de puntos ampliamente disperso; esta mayor dispersión indica que existe menor grado de asociación entre las variables independiente y dependiente que el que existe en la grafica (b); el patrón de puntos en la grafica (f) parece indicar que no existe relación entre las dos variables , por lo tanto, conocer el pasado referente a una variable no nos permitirá pronosticar ocurrencias futuras de la otra.
Figura 12-5
Estimación mediante la recta de estimación
Aprenderemos a calcular la línea de regresión
...