Taller de Regresión Lineal Múltiple
Enviado por Mian17 • 23 de Marzo de 2021 • Práctica o problema • 1.205 Palabras (5 Páginas) • 81 Visitas
Taller de Regresión Lineal Múltiple
Base de datos: Pesca
Fuente: Revista de Educación Estadística (Journal of Statistics Education)
Resumen Descriptivo: Se capturan y miden 159 peces de 7 especies. En total hay 8 variables. Todos los peces son capturados en el mismo lago. (Laengelmavesi) cerca de Tampere en Finlandia.
Objetivo: Estudiar cómo influyen las variables o que variables presentan mejor el peso de las diferentes especies de peces.
- Identifique la variable respuesta de interés y las variables regresoras.
- Variable respuesta: Peso: Peso del pescado (en gramos)
- Variables regresoras:
- Longitud 1: Longitud desde la nariz hasta el inicio de la cola (en cm)
- Longitud 2: Longitud desde la nariz hasta la muesca de la cola (en cm)
- Longitud 3: Longitud desde la nariz hasta el final de la cola (en cm)
- Altura:
- Ancho:
___/////___ _
/ \ ___ |
/\ \_ / / H
< ) __) \ |
\/_\\_________/ \__\ _
|------- L1 -------|
|------- L2 ----------|
|------- L3 ------------|
- Calcule la correlación entre las variables y grafique la relación entre ellas.
[pic 1]
[pic 2]
De lo analizado hasta ahora podemos concluir que:
- Las variables que tienen mayor relación lineal con la variable respuesta (PESO) son: LONGITUD 1 con un r=0.91, LONGITUD 2 con un r=0.92 y LONGITUD 3 con un r=0.92
- Se puede observar una alta colinealidad entre las variables regresoras
- LONGITUD 1 y LONGITUD 2 con un r= 0.997
- LONGITUD 2 y LONGITUD 3 con un r=0.994
Por lo que posiblemente no sea útil introducir ambos pares de variables regresoras en el modelo.
- La distribución de las variables parece acercarse bastante a una distribución normal, dado el número de observaciones con las que disponemos.
- Ajuste el mejor modelo de regresión lineal para estas las variables.
- Plantee el modelo de regresión (Poblacional y muestral) con sus supuestos. Estime y escriba el modelo ajustado por Mínimos Cuadrados Ordinarios – MCO.
- Modelo General
[pic 3]
[pic 4]
[pic 5]
[pic 6]
[pic 7]
[pic 8]
[pic 9]
[pic 10]
[pic 11]
[pic 12]
[pic 13]
[pic 14]
∈~N (0, σ2)
[pic 15]
De lo analizado hasta ahora se puede concluir que:
- El modelo con todas las variables regresoras es capaz de explicar el 86.74% de la variabilidad presente en el peso de los peces con un lo que indica que el modelo tiene variables regresoras útiles. [pic 16]
- El p-value del modelo es significativo por lo que podemos decir que el modelo en conjunto es significativo. [pic 17]
- Las variables de longitud (1,2,3) según podemos detallar en los resultados arrojados por el VIF evidencian que estas variables están muy correlacionadas.
- Mejor modelo ajustado
En este caso emplee el método Stepwise mixto para determinar el mejor modelo, el resultado fue:
[pic 18]
[pic 19]
[pic 20]
[pic 21]
[pic 22]
[pic 23]
[pic 24]
[pic 25]
∈~N (0, σ2)
[pic 26]
De lo analizado hasta ahora se puede concluir que:
- El modelo reajustado es capaz de explicar el 86.6% de la variabilidad presente en el peso de los peces con un lo que indica que el modelo tiene variables regresoras significativas. [pic 27]
- El p-value del modelo es significativo por lo que podemos decir que el modelo en conjunto es significativo. [pic 28]
- Con in intervalo de confianza del 95% la longitud desde la nariz hasta la muesca de la cola del pez estará contenida en el intervalo [28.44;32.33], es decir, la longitud estará entre 28cm a 32 cm.
- Interprete cada uno de los parámetros del modelo (beta 0, beta1 y sigma o el error estándar residual).
- [pic 29]
- [pic 30]
- [pic 31]
- [pic 32]
[pic 33]
[pic 34]
- Verifique si la relación entre X y Y es significativa usando el modelo. Hágalo usando IC y Valor-p. Plantee las hipótesis, interprete y concluya.
- Análisis de Significancia del modelo
[pic 35]
[pic 36]
Nivel de Significancia: 0.05
p-value:2.2e-16
[pic 37]
[pic 38]
- Análisis de significancia de los parámetros
[pic 40] [pic 41] |
[pic 43] [pic 44] |
[pic 46] [pic 47] |
Nivel de Significancia: 0.05 p-value:2e-16 Como Vp < por lo tanto no se rechaza y se concluye con una confianza del 95% que el parámetro no es significativo para el modelo[pic 48][pic 49][pic 50] | Nivel de Significancia: 0.05 p-value:2e-16 Como Vp < por lo tanto se rechaza y se concluye con una confianza del 95% que el parámetro es significativo para el modelo[pic 51][pic 52][pic 53] | Nivel de Significancia: 0.05 p-value:2.81e-6 Como Vp < por lo tanto se rechaza y se concluye con una confianza del 95% que el parámetro es significativo para el modelo[pic 54][pic 55][pic 56] |
...