Guía de tarea estudio Econometria
Enviado por july skzvote • 5 de Agosto de 2023 • Monografía • 1.885 Palabras (8 Páginas) • 39 Visitas
Universidad Nacional Jorge Basadre Grohmann
Facultad de Ciencias Jurídicas y Empresariales
[pic 1]Escuela Profesional de Ingeniería Comercial
GUÍA DE TAREA RSTUDIO
ECONOMETRIA
06-05434
Presentado por:
Ingrid Korayma Serrano Condori 2021-106058
Dr. Pedro Pablo Chambi Condori
30 de Julio de 2023
Caso de Aplicación Regresión Multiple
El análisis nos va permitir expresar la relación entre una variable de interés (la respuesta) y un conjunto de variables predictoras relacionadas. A continuación, se ejecutará la siguiente base de datos que contiene 1030 datos correspondiente:
- Y: Cement
- X1: Slag
- X2: Ash
- X3: Water
- X4: Coarseagg
- X5: Fineagg
- X5: Age
- X5: Strength
Base de Datos
[pic 2]
Se pide determinar lo siguiente:
- Obtenga el modelo que cumpla la condición de significancia estadística.
- Obtenga la matriz de correlación
- Haga la evaluación de homocedasticidad del caso
- Haga la evaluación de autocorrelación del caso
- Haga la evaluación de multicolinealidad
- Haga la formulación matricial del modelo de regresión.
Leyendo Archivos .csv
Los archivos .csv tienen las mismas ventajas que los archivos .txt sobre los archivos de Excel. Este tipo de archivos se pueden leer con la función read.csv ().
Una de las principales ventajas que brinda el uso de este tipo de archivos es que facilita el intercambio de datos en distintos programas.
En este caso el código será el siguiente para nuestro caso de ejemplo:
# leyendo el archivo .csv[pic 3]
#como resultado se obtiene el siguiente reporte:[pic 4]
# Luego para inspeccionar el tipo de dato que tiene la tabla:[pic 5]
str (BASE1)
#Se obtiene como resultado:
[pic 6]
Comando summary [pic 7]
summary (BASE1)
#como resultado se obtiene los datos descriptivos de la tabla:
[pic 8]
# Luego para poder visualizar la tabla de datos[pic 9]
view (BASE1)
fix (BASE1)
- Es importante tener en cuenta que la función “VIEW” se utiliza para visualizar un conjunto de datos en una ventana de visualización interactiva. Esta función es útil para explorar y examinar los datos de una manera más fácil y rápida. Al utilizar, se abre una nueva ventana en la que se muestra el conjunto de datos en forma de tabla, lo que permite ver todas las variables y observaciones de una manera clara y organizada.
- Por otro lado, la función “FIX” se utiliza para editar un conjunto de datos. Esta función es útil para corregir errores en los datos o para realizar cambios específicos en los datos.
# Como resultado debe aparecer así:
[pic 10]
[pic 11]
1. Obtenga el modelo que cumpla la condición de significancia estadística.
# Regresión: Se utilizo el siguiente comando [pic 12]
#Resultado[pic 13]
El modelo lineal esta expresado de la forma:
Y = 2300.7777-1.302(x1)-1.2106(x2)-2.5835(x3)-0.4860(x4)-0.7447(x5)-0.9327(x6)-0.1885(x7)+1.3625(x8)
Pero también podemos obtener el resumen de todo el proceso de regresión, haciendo:[pic 14]
S
Obteniendo como resultado:
[pic 15]
- Aplicación de remedio usando STEPWISE
El remedio Stepwise es una técnica utilizada en la regresión múltiple para seleccionar las variables independientes más relevantes para el modelo. Esta técnica se basa en la eliminación iterativa de variables que no contribuyen significativamente a la explicación de la variable dependiente (JoaquinAmatRodrigo, 2020).
Al observar los p-valor de las variables vemos que X2, X5 y X6 no cumplen con la condición de significancia.
#Para corregir el modelo se aplica la función STEPWISE de R
[pic 16]
Dando como resultado:[pic 17]
En este nuevo modelo no se eliminaron las variables, pero se eliminará SUPERPLASTIC (X4) , ya que su pvalor es mayor a 0.05 de significancia.
2.- Obtenga la matriz de correlación
[pic 18]
Obtenemos lo siguiente:[pic 19]
Para obtener el gráfico[pic 20]
# Como resultado se obtiene este gráfico:[pic 21]
- Cuando r = 0, significa que no hay una asociación lineal entre las variables. Sin embargo, puede haber una relación no lineal presente.
- Cuando r = 1, significa que hay una relación lineal positiva perfecta entre las variables. Todos los individuos muestreados se encuentran exactamente en la línea de mejor ajuste con una pendiente positiva.
- Cuando r = -1, significa que hay una relación lineal negativa perfecta entre las variables. Todos los individuos muestreados se encuentran exactamente en la línea de mejor ajuste con una pendiente negativa.
3. Haga la evaluación de homocedasticidad del caso
- Diagrama de dispersión
Es importante tener en cuenta que, el diagrama de dispersión es una herramienta gráfica útil para visualizar la relación entre dos variables. En R Studio, se puede crear un diagrama de dispersión utilizando la función plot() y personalizarlo según las necesidades del usuario. El diagrama de dispersión es una herramienta importante en la regresión lineal y puede ser utilizado en diferentes campos para explorar patrones y relaciones entre variables.
...