TALLER METODOS REGRESION
Enviado por Javier Pesantes • 13 de Julio de 2022 • Práctica o problema • 382 Palabras (2 Páginas) • 110 Visitas
[pic 1]
Taller Regresión
Consulte los datos Baseball 2009, donde se reporta información sobre los 30 equipos de la Liga Mayor de Béisbol de la temporada 2009. Sea el número de juegos ganados la variable dependiente, y las siguientes variables, las independientes: promedio de bateo del equipo, número de bases robadas, número de errores cometidos, promedio de carreras del equipo, número de jonrones, y si el equipo juega en la liga Nacional o en la americana.
[pic 2]
- Formule una matriz de correlación. ¿Qué variables independientes tienen correlaciones fuertes o débiles con la variable dependiente? ¿Detecta algunos problemas con la multicolinealidad?
- Existen dos variables que tienen una correlación positiva débil con respecto a la variable dependiente, estas variables son Promedio de Bateo (r=0.186) y Cuadrangulares (r=0.25377).
- No se evidencian problemas de multicolinealidad ya que ninguna de las correlaciones entre las variables es mayor a 0.7
- Utilice un paquete de software estadístico para determinar la ecuación de regresión múltiple. Encuentre el coeficiente de determinación de este grupo de variables independientes.
b) Coeficiente de determinación 0.73054720458146 Ecuación de Regresión:
Y= 78.1887737212279 + 282.500977126082*(promedio de bateo del equipo)+( -0.0443105236735418*Bases robadas)+( 0.0647122101769468*Errores)+( -19.5658855356636*Promedio de carreras)+( 0.0445130537327896* cuadrangulares)+( 0.761903402421829*Liga (Americana=1; Nacional=0)
C) Realice una prueba global en el conjunto de variables independientes. Interprétela.
- 0.0000134779455345334 ES MENOR A P Value 0.05 y como es menor a 0.05 entonces la prueba global me dice que el coeficiente de determinacion es estadisticamente significativo osea distinto de cero y que al menos una de estas variables será significativa.
- Realice una prueba de hipótesis en cada una de las variables independientes.
¿Consideraría eliminar algunas de las variables? Si es así, ¿cuáles?
Estas son las variables que deberían eliminarse por ser mayores a 0.05
[pic 3]
e) Vuelva a efectuar el análisis hasta que sólo permanezcan coeficientes de regresión netos significativos. Identifique estas variables. ¿El número de victorias se ve afectado si el equipo juega en la liga ¿Nacional o en la americana? Si es así, interprete el coeficiente.
- Después de obtener los coeficientes de regresión netos significativos las variables para el modelo serian las siguientes y la nueva ecuación seria esta:[pic 4]
[pic 5]
- El número de victorias no se ve afectado si el equipo juega en la Liga Nacional o Americana.
...