Residuos RLS y Analisis RLM
Enviado por EKYM • 5 de Julio de 2021 • Apuntes • 2.594 Palabras (11 Páginas) • 75 Visitas
[pic 1][pic 2]
[pic 3] [pic 4]
INSTITUTO TECNOLÓGICO SUPERIOR DE MISANTLA I.T.S.M
NOMBRE
NÚÑEZ SÁNCHEZ DAVID MOISÉS
ASIGNATURA ESTADISTICA INFERENCIAL II
EJERCICIO
DOC.YODAIRA BORROTO PENTON
SEMESTRE: 4º GRUPO: “A”
CARRERA: INGENIERÍA INDUSTRIAL
MISANTLA, VERACRUZ 22 DE MARZO 2021
1)
[pic 5]
Analizando cada una de las graficas
Grafica de probabilidad normal: En esta grafica los puntos deben estar lo más cercano posible a la línea recta que se forma, de esa manera podemos decir que los residuos están normalmente distribuidos, ya que muestra los residuos vs sus valores esperados cuando la distribución es normal. En este caso la gráfica nos indica que los puntos están asociados a la línea recta que se presenta, entonces se puede comprobar lo mencionado anteriormente y decir que los residuos están normalmente distribuidos.
Grafica vs ajustes: Esta grafica muestra a los residuos en el eje Y y a los valores ajustados en el eje X, aquí verificamos que los residuos están distribuidos aleatoriamente y tienen una varianza constante. En el grafico lo podemos comprobar que están distribuidos aleatoriamente alrededor del 0 y por lo que tendrían una varianza constante.
Histograma: El histograma de residuos nos muestra la distribución de los residuos para todas las observaciones; aquí podemos determinar si los datos son asimétricos o incluyen valores atípicos, no es confiable utilizar el histograma para evaluar la normalidad de los residuos, puesto que la apariencia del histograma depende del número de intervalos usados para agrupar los datos.
Grafica vs Orden: Se utiliza para verificar el supuesto de que los residuos son independientes entre sí. Los residuos independientes no muestran tendencias ni patrones cuando se muestran en orden cronológico; lo ideal debería ser que los residuos que se muestran en la gráfica se ubiquen
aleatoriamente alrededor de la línea central; en la gráfica obtenida es cierto que los datos están dispersos de la línea central por lo que los residuos son independientes.
Una vez analizado los gráficos podemos decir que los residuos se ajustan de manera normal y se puede ajustar el modelo de regresión lineal simple.
2)
[pic 6]
Las técnicas de Regresión lineal múltiple parten de k+1 variables cuantitativas: La variable respuesta o dependiente (Y) Las variables explicativas (X1 ,…, Xk ) Y tratan de explicar la Y mediante una función lineal de las x1 ,…, xk representada por el hiperplano:
𝑌̂ = 𝑏 + 𝑏𝑥1 + ⋯ + 𝑏𝑘𝑥𝑘
Modelo para la Regresión Lineal Múltiple
𝜇𝑌𝑥1,𝑥2…..𝑥𝑘 = 𝛽0 + 𝛽1𝑥1 + ⋯ + 𝛽𝑘𝑥𝑘
Formulación de Hipótesis
𝐻0: 𝐵𝑗 = 0 (𝑋𝑖 𝑛𝑜 𝑖𝑛𝑓𝑙𝑢𝑦𝑒 𝑠𝑜𝑏𝑟𝑒 𝑌)
𝐻1: 𝐵𝑗 ≠ 0 (𝑋𝑖 𝑖𝑛𝑓𝑙𝑢𝑦𝑒 𝑠𝑜𝑏𝑟𝑒 𝑌)
La partición de la suma total de cuadrados en sus componentes, la suma de cuadrados de regresión y del error desempeña un papel importante. Puede efectuarse un análisis de varianza que arroje luz sobre la calidad de la ecuación de regresión. Una hipótesis que sirve para determinar si el modelo explica una cantidad significativa de variación, es la siguiente:
𝐻0: 𝛽1 = 𝛽2 = 𝛽3 = ⋯ = 𝛽𝑘 = 0
El análisis de varianza implica una prueba F, mediante una tabla, como la siguiente:
[pic 7]
Se trata de una prueba de cola superior. El rechazo de H0 significa que la ecuación de regresión difiere de una constante. Es decir, al menos una variable regresora es importante. En las secciones que siguen se estudia más el uso del análisis de varianza.
Se calcula el estadístico t anterior y no se rechaza 𝐻0 si −𝑡𝖺⁄2 < 𝑡 < 𝑡𝖺⁄2 donde
𝑡𝖺⁄2𝑡𝑖𝑒𝑛𝑒 𝑛 − 𝑘 − 1 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
El experimentador que utiliza análisis de regresión también está interesado en eliminar variables cuando la situación impone que, además de llegar a una ecuación de pronóstico funcional, debe encontrar la “mejor regresión” que implique sólo variables que sean predictores útiles. Se dispone de varios programas de cómputo que llegan en secuencia a la denominada mejor ecuación de regresión, dependiendo de ciertos criterios. Un criterio que suele utilizarse para ilustrar lo adecuado de un modelo ajustado de regresión es el coeficiente de determinación múltiple o 𝑅2.
[pic 8]
En este punto la explicación podría ser más clara, toda vez que ahora nos centramos en SCR como la variabilidad explicada. La cantidad 𝑅2 tan sólo indica qué proporción de la variación total de la respuesta Y es explicada por el modelo ajustado. Con frecuencia los experimentadores reportan R2 × 100% e interpretan el resultado como el porcentaje de variación explicado con el modelo propuesto. La raíz cuadrada de 𝑅2 se denomina coeficiente de correlación múltiple entre Y y el conjunto 𝑥1, 𝑥2, … 𝑥𝑘 .
...