Aplicación De Regresion Lineal Simple.
Enviado por day.mosnths • 17 de Septiembre de 2014 • 1.602 Palabras (7 Páginas) • 913 Visitas
aplicación de regresión lineal simple.
Sólo se maneja una variable independiente, por lo que sólo cuenta con dos parámetros. Son de la forma:4
donde es el error asociado a la medición del valor y siguen los supuestos de modo que (media cero, varianza constante e igual a un y con )
Análisis
Dado el modelo de regresión simple, si se calcula la esperanza (valor esperado) del valor Y, se obtiene:5
Derivando respecto a y e igualando a cero, se obtiene:5
Obteniendo dos ecuaciones denominadas ecuaciones normales que generan la siguiente solución para ambos parámetros:4
Problema resuelto:
“Los datos de la tabla adjunta muestran el tiempo de impresión de trabajos que se han imprimido en impresoras de la marca PR. Se está interesado en estudiar la relación existente entre la variable de interés “tiempo de impresión de un trabajo” y la variable explicativa “número de páginas del trabajo”. Hacer el estudio en base a los datos obtenidos en el muestreo y que son los de la tabla adjunta”.
Solución Problema 4.3.
Se calculan los estadísticos básicos de las variables X e Y,
Que permiten calcular las estimaciones de los parámetros de la recta de regresión
Ahora, se pueden calcular las predicciones i
La suma de cuadrados de los residuos es
Que permite calcular la varianza residual
Las varianzas de los parámetros son
De donde se deducen los siguientes intervalos de confianza (al 90%) y contrastes de hipótesis:
Intervalo de confianza para 2
732 < < 732
54'3245 < < 94'0592
85'325 < 2 < 147'735
Intervalo de confianza para 1
t73 < < t73
- 1'6664 < < 1'6664
1 8'108 ± 0'7142 =
Intervalo de confianza para 0
t73 < < t73
- 1'6664 < < 1'6664
0 13'515 ± 4'378 =
Contraste de hipótesis para 1
1 = = = 18'917 ~ t n-2
p - valor = 0'0000 Se rechaza H 0
Contraste de hipótesis para 0
0 = = = 5'144 ~ t n-2
p - valor = 0'0000 Se rechaza H 0
El coeficiente de correlación es
En el siguiente gráfico se representa la nube de puntos y la recta ajustada
Nube de observaciones y recta ajustada.
El gráfico de residuos frente a las predicciones se observa en el siguiente gráfico,
Gráfico de residuos
Se calcula la tabla ANOVA del modelo y se obtiene
scR = i = 175ei2 = 8025'61
scG = i = 175 2 = 75 . sy2 = 47.368'95
scE = i = 175 2 = V T - V NE = 39.343'34
que permite construir la siguiente tabla
A partir de esta tabla se puede realizar el contraste de regresión
Se rechaza la hipótesis nula y se asume que el modelo ajustado es significativo.
En este problema para cada valor de x se dispone de varias observaciones de Y, se puede hacer elcontraste de linealidad
Para ello se descompone la scR en dos términos:
scR1 = i = 175 2 = 2.765'84
scR2 = i = 175 2 = 5.259'77
scR = i = 175ei2 = i = 175 2 = 8.025'61
Que permite construir la siguiente tabla ANOVA más completa
Se rechaza la hipótesis nula y se deduce que el modelo lineal no es el que mejor se ajusta a la nube deobservaciones.
Predicciones.
“Calcular intervalos de confianza al 90% para el tiempo medio de impresión de los trabajos que tienen 6 y 12 hojas respectivamente.
Calcular, también, intervalos de predicción al 90% para el tiempo de impresión de un trabajo que tiene 6 hojas. Calcular el intervalo de predicción para el tiempo de impresión de un trabajo de 12 hojas”.
Sea xt = 6, su valor de influencia (leverage) es
ht = = 0'013857
nt = = 72'1651 (es el número de observaciones equivalente).
La varianza del estimador de la media condicionada mt = E es
V ar = = 1'5235
= 1'2343.
El estimador de la media condicionada es
De ambos resultados se obtiene que el intervalo de confianza al 90% es
mt 62'163 ± t 73 . 1'2343
mt 62'163 ± 2'0568 = .
La predicción para xt = 6 es
Con varianza
V ar = + 109'94 = 111'4635
= 10'5576.
Por tanto, el intervalo de predicción al 90% es
yt 62'163 ± t 73 . 10'5576
yt 62'163 ± 17'593 = .
Análogamente, se realizan los cálculos para xq = 12, su valor de influencia es
hq == 0'08523
nq = = 11'7323 (es el número de observaciones equivalente).
Por tanto, la varianza del estimador de la media condicionada mq = E es
V ar = = 9'3707
= 3'0612.
El estimador es
y el intervalo de confianza al 90% se obtiene como
mq 110'811 ± t 73 . 3'0612
mq 110'811 ± 5'1011 = .
La predicción para xq = 12 es
V ar = 109'94 = 119'31
= 10'923.
y el intervalo de predicción al 90% es
yq 110'811 ± t 73 . 10'923
yq 110'811 ± 18'202 = .
En resumen, al comparar las longitudes de los intervalos calculados se obtiene
Ejemplos propuestos de regresión lineal simple.
Problema 1.
“En la tabla adjunta se presentan el número de páginas y el precio de doce libros técnicos:
________________________________________ ________________________________________ ________________________________________ ________________________________________ ________________________________________ ________________________________________
páginas precio páginas precio páginas precio
________________________________________ ________________________________________ ________________________________________ ________________________________________ ________________________________________ ________________________________________
310 3'50 400 8'00 420 2'50
________________________________________ ________________________________________ ________________________________________ ________________________________________ ________________________________________ ________________________________________
...