ESTADISTICAS
Enviado por OLIVIAMEJIA • 10 de Noviembre de 2012 • 4.307 Palabras (18 Páginas) • 405 Visitas
UNIDAD 1 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
La Regresión y la correlación son dos técnicas estadísticas que se pueden utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna Relación Funcional entre dos o más variables, donde una variable depende de la otra variable. Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un modelo de Regresión Simple.
"Y es una función de X"
Y = f(X)
Como Y depende de X,
Y es la variable dependiente, y
X es la variable independiente.
En el Modelo de Regresión es muy importante identificar cuál es la variable dependiente y cuál es la variable independiente. En el Modelo de Regresión Simple se establece que Y es una función de sólo una variable independiente, razón por la cual se le denomina también Regresión Divariada porque sólo hay dos variables, una dependiente y otra independiente y se representa así:
Y = f (X)
"Y está regresando por X"
La variable dependiente es la variable que se desea explicar, predecir. También se le llama REGRESANDO ó VARIABLE DE RESPUESTA.
La variable Independiente X se le denomina VARIABLE EXPLICATIVA ó REGRESOR y se le utiliza para EXPLICAR Y.
ANÁLISIS ESTADÍSTICO: REGRESIÓN LINEAL SIMPLE
En el estudio de la relación funcional entre dos variables poblacionales, una variable X, llamada independiente, explicativa o de predicción y una variable Y, llamada dependiente o variable respuesta, presenta la siguiente notación:
Y = a + b X + e
Donde:
a es el valor de la ordenada donde la línea de regresión se intercepta con el eje Y.
b es el coeficiente de regresión poblacional (pendiente de la línea recta)
e es el error
SUPOSICIONES DE LA REGRESIÓN LINEAL
1. Los valores de la variable independiente X son fijos, medidos sin error.
2. La variable Y es aleatoria
3. Para cada valor de X, existe una distribución normal de valores de Y (su poblaciones Y)
4. Las variancias de las su poblaciones Y son todas iguales.
5. Todas las medias de las su poblaciones de Y están sobre la recta.
6. Los valores de Y están normalmente distribuidos y son estadísticamente independientes.
ESTIMACIÓN DE LA ECUACIÓN DE REGRESIÓN MUESTRAL
Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir, encontrar los valores de a y b con los datos observados de la muestra. El método de estimación es el de Mínimos Cuadrados, mediante el cual se obtiene:
Luego, la ecuación de regresión muestral estimada es
Que se interpreta como:
a es el estimador de a
Es el valor estimado de la variable Y cuando la variable X = 0
b es el estimador de b , es el coeficiente de regresión
Está expresado en las mismas unidades de Y por cada unidad de X. Indica el número de unidades en que varía Y cuando se produce un cambio, en una unidad, en X (pendiente de la recta de regresión).
Un valor negativo de b sería interpretado como la magnitud del decremento en Y por cada unidad de aumento en X.
Las técnicas de regresión y correlación cuantifican la asociación estadística entre dos o más variables. La regresión lineal simple expresa la relación entre una variable dependiente Y y una variable independiente X, en términos de la pendiente y la intersección de la línea que mejor se ajuste a las variables.La correlación simple expresa el grado o la cercanía de la relación entre las dos variables en términos de un coeficiente de correlación que proporciona una medida indirecta de la variabilidad de los puntos alrededor de la mejor línea de ajuste- Ni la regresión ni la correlación dan pruebas de relaciones causa – efecto.
1.1 MODELO DE REGRESIÓN SIMPLE
Regresión: El modelo de regresión lineal simple toma la forma
Y = a + bx,
Donde
y = variable dependiente
x = variable independiente.
Los valores de la pendiente b y la intersección a se obtienen usando las ecuaciones normales escritas en la forma conveniente.
Correlación
El coeficiente de correlación lineal simple r es un número entre -1 y 1 que indica qué tan bien describe la ecuación lineal la relación entre las dos variables. Como se muestra en la siguiente figura, r se designa como positiva si Y se incrementa cuando lo hace X, y negativa si Y decrece al incrementarse X. Una r de cero indica una ausencia de relación entre las dos variables.
La desviación de todos los puntos (Y) de la línea de regresión (Yc) consiste en la desviación contabilizada por la línea de regresión (explicada) y la variación aleatoria (no explicada).
Variación total = explicada + no explicada
El coeficiente de determinación r2 es la razón de la variación explicada a la variación total:
El coeficiente de correlación r es la raíz cuadrada del coeficiente de determinación:
Cuando el tamaño de la muestra es lo suficientemente grande (v.g., mayor de 50); el valor de r puede ser calculado más directamente con base en:
1.2 SUPUESTOS MODELO DE REGRESIÓN SIMPLE.
La significancia de cualesquier valor de r puede probarse estadísticamente con una hipótesis para mostrar que no existe correlación. Para probarlo, el valor de r es comparado con un valor de tablas para un tamaño de muestra y un nivel de significancia dados.
Ejemplo
El gerente general de una planta de producción de materiales de construcción considera que la demanda de embarques de aglomerado puede estar relacionada con el número de permisos de construcción emitidos en el municipio durante el trimestre anterior.
El gerente ha recolectado los datos que se muestran en la tabla.
Permisos de Embarques de
construcción (X) conglomerado (Y)
15 6
9 4
40 16
20 6
25 13
25 9
15 10
35 16
• Si se pide determinar una estimación de los embarques cuando el número de permisos de construcción es 30.
En el siguiente diagrama de dispersión se puede ver que los datos no son perfectamente lineales; sin embargo, se puede hacer un enfoque lineal sobre este periodo corto.
Se realizan los cálculos como se muestra en la siguiente tabla
N X Y XY X2 Y2
1 15 6 90 225 36
2 9 4 36 81 16
...