PROBLEMAS DE REGRESION LINEAL SIMPLE
Enviado por karina_mp • 17 de Octubre de 2011 • 4.486 Palabras (18 Páginas) • 6.285 Visitas
6. En una etapa inicial de procesamiento mecánico de piezas de acero, se sabe que una herramienta sufre un deterioro gradual que se refleja en cierto diámetro de las piezas manufacturadas. Para predecir el tiempo de vida útil de la herramienta se tomaron datos de horas de uso y el diámetro promedio de cinco piezas producidas al final de la jornada. Los datos obtenidos para una herramienta se muestran a continuación:
Horas de uso Diámetro (mm)
16
32
48
64
80
96
112
128
144
160
176
192
208
224
240
256
272
288
304
320 26.2
25.7
26.0
27.7
28.3
29.5
30.1
31.8
31.4
33.4
33.6
32.7
35.0
36.1
35.7
36.2
36.8
39.1
38.7
39.2
¿En este problema cual variable se considera independiente y cual dependiente?
La variable independiente es el diámetro y la variable dependiente son las horas de uso.
Mediante un diagrama de dispersión analice la relación entre estas dos variables. ¿Qué tipo de relación observa y cuales son algunos hechos especiales?
La gráfica muestra que entre el diámetro y las horas de uso existe una correlación lineal positiva, ya que cuando aumenta x también aumenta y.
Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis y verifique residuos).
La línea recta que mejor explica la relación entre el diámetro y las horas de uso, esta dada por:
Y = - 519 + 21.0 x
Coef.
Predictor Coef de EE T P
Constante -519.40 25.20 -20.61 0.000
x 21.0470 0.7647 27.52 0.000
S = 14.8168 R-cuad. = 97.7% R-cuad.(ajustado) = 97.5%
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 166288 166288 757.45 0.000
Error residual 18 3952 220
Total 19 170240
A continuación se muestran los valores ajustados para Y y el de los residuos e.
x Y Y e = y – Y
26.2 16 31.2 -15.2
25.7 32 20.7 11.3
26 48 27 21
27.7 64 62.7 1.3
28.3 80 75.3 4.7
29.5 96 100.5 -4.5
30.1 112 113.1 -1.1
31.8 128 148.8 -20.8
31.4 144 140.4 3.6
33.4 160 182.4 -22.4
33.6 176 186.6 -10.6
32.7 192 167.7 24.3
35 208 216 -8
36.1 224 239.1 -15.1
35.7 240 230.7 9.3
36.2 256 241.2 14.8
36.8 272 253.8 18.2
39.1 288 302.1 -14.1
38.7 304 293.7 10.3
39.2 320 304.2 15.8
Se acepta la H0, debido a que el valor de p= 0.000.
¿La calidad del ajuste es satisfactoria? Argumente.
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.98832566
Coeficiente de determinación R2 0.97678761
R2 ajustado 0.97549803
Error típico 0.69576713
Observaciones 20
La calidad de ajuste si es satisfactoria, debido a que el valor del coeficiente de determinación R2 es muy cercano a R2 ajustado.
Si en diámetro máximo tolerado es de 45, ¿Cuántas horas de uso estima que tiene esa herramienta?
Y = - 519 + 21.0 x
= - 519 + 21(45) = - 519 + 945 = 426
Horas de uso Diámetro (mm)
426 45
Señale el valor de la pendiente de la recta e interprételo en términos prácticos.
Sxy = 7900.8
Sxx = 375.4
Por lo tanto β1 = 21.0
El valor de la pendiente de la recta es: 21.0
Obtenga el error estándar de estimación y comente que relación tiene este con la calidad de ajuste.
σ =√(Syy- β1(Sxy/(n-2))) =√(170240-21( 7900.8/18) ) = √(4323.2/18) =√240.17 = 15
¿Cuál es el propósito general del análisis de regresión?
Modelar en forma matemática el comportamiento de una variable de respuesta en función a una o más variables independientes (factores).
7. En un proceso de extracción se estudia la relación entre tiempo de extracción y rendimiento. Los datos obtenidos se muestran en la siguiente tabla.
Tiempo (minutos) Rendimiento (%)
10 64
15 81.7
20 76.2
8 68.5
12 66.6
13 77.9
15 82.2
12 74.2
14 70
20 76
19 83.2
18 85.3
¿En este problema cual variable se considera independiente y cual dependiente?
Se debe considerar el tiempo de extracción como variable (x) y al rendimiento como la variable dependiente (y), dado que el rendimiento siempre va a variar conforma el tiempo y no viceversa.
Mediante un diagrama de dispersión analice la relación entre estas dos variables. ¿Qué tipo de relación observa y cuales son algunos hechos especiales?
Existe una correlación lineal positiva ya que conforme aumenta el tiempo de extracción también aumenta el rendimiento.
Haga un análisis de regresión (ajuste de línea recta a estos datos, aplique pruebas de hipótesis y verifique residuos).
La línea recta que mejor explica la relación entre el tiempo y el rendimiento, esta dada por:
y = 58.0 + 1.19 x
Coef.
Predictor Coef de EE T P
Constante 57.958 6.284 9.22 0.000
x 1.1949 0.4150 2.88 0.016
S = 5.42100 R-cuad. = 45.3% R-cuad.(ajustado) = 39.9%
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 243.68 243.68 8.29 0.016
Error residual 10 293.87 29.39
Total 11 537.56
Se rechaza la prueba de Ho ya que mi valor de P=0. Por lo tanto se acepta la alternativa.
X Y Ajuste Ajuste SE Residuo Residuo estándar
10 64.00 69.91 2.49 -5.91 -1.23
15 81.70 75.88 1.57 5.82 1.12
...