Regresión Lineal Múltiple
Enviado por Anthony Cardoza • 5 de Agosto de 2021 • Trabajo • 3.406 Palabras (14 Páginas) • 262 Visitas
UNIVERSIDAD NACIONAL DE PIURA
Facultad de Ciencias
Escuela Profesional de Matemática[pic 1][pic 2]
Tema: Regresión Lineal Múltiple
Curso: Modelos Estadísticos
Docente: Dr. Ana Marilú León Silva
Integrantes:
CU: 1302015039; José Miguel Palacios Ochoa
CU: 1302016029; Antoni Flores Risco
CU: 1302016016; Bianca Daniela Vilela Calderón
CU: 1302015035; Darwin Jhoel Calderón Vilchez
CU: 130201
de septiembre del 2020, Piura, Perú
PROBLEMAS
- ¿Cuáles son las características de una buena variable explicativa?
- Las variables explicativas generalmente se representan en el eje X.
- Las variables explicativas explican, describen o predicen la(s) variable(s) dependiente(s).
- Las variables explicativas son también llamadas independientes o predictoras, en ocasiones se le asignan valores arbitrarios.
- ¿Cuáles son los supuestos asociados con el modelo de regresión múltiple?
- Linealidad: La relación entre cada variable independiente con la variable dependiente debe ser lineal.
- Multicolinealidad: es la situación en la cual las variables independientes de una ecuación de regresión múltiple están sumamente intercorrelacionadas. Es decir, existe una relación lineal entre dos o más variables independientes.
- Homocedasticidad: la varianza de los errores de medición es igual para todas las variables independientes.
- Normalidad: los errores siguen una distribución normal.
- ¿Qué mide el coeficiente de regresión parcial o neto, en la regresión múltiple?
Mide el cambio promedio de la variable dependiente por unidad de cambio en la variable independiente relevante, cuando se mantienen constantes las demás variables independientes.
- ¿Qué mide el error estándar de la estimación en la regresión múltiple?
El error estándar de la estimación mide la cantidad en que los valores reales de (Y) difieren de los valores estimados (Y ajustado). Es decir, mide la dispersión típica de los valores de Y alrededor de la función de regresión ajustada.
- Su ecuación de la regresión múltiple estimada es . Pronostique el valor de si y .[pic 3][pic 4][pic 5][pic 6]
=7.52 + 3(20) – 12(7) =17.88[pic 7]
- Explique cada uno de los siguientes conceptos:
- matriz de correlación: es una matriz cuadrada constituida por los coeficientes de correlación de cada pareja de variables. Esto permite determinar la relación entre cualquier par de variables.[pic 8]
- : el coeficiente de determinación mide la proporción de variación de la variable dependiente explicada por la variable independiente.[pic 9]
- multicolinealidad: es la situación en la cual las variables independientes en una ecuación de regresión múltiple están estrechamente intercorrelacionadas. Es decir, existe una relación lineal entre dos o más variables independientes.
- residuo: el residuo es una estimación del componente de error del modelo.
- variable ficticia: una variable ficticia sirve para determinar las relaciones entre variables independientes cualitativas y una variable dependiente.
- regresión por pasos: permite a las variables explicativas entrar o salir de la función de regresión en diferentes etapas de su desarrollo. Una variable independiente se elimina del modelo si no continúa haciendo una contribución significativa cuando se agrega una nueva variable.
- La mayoría de las soluciones por computadora para la regresión múltiple inician con una matriz de correlación. El examen de esta matriz a menudo es el primer paso cuando se analiza un problema de regresión que implica más de una variable independiente. Conteste las siguientes preguntas relacionadas con matriz de correlación de la siguiente tabla. [pic 10]
- ¿Por qué todas las entradas que se encuentran sobre la diagonal principal son iguales a 1.00?
Porque en la diagonal vemos unos porque la correlación de cada variable consigo misma es perfecta, la tabla de la matriz de correlación es simétrica
- ¿Por qué la mitad de la matriz debajo de la diagonal principal se encuentra en blanco?
Porque si yo correlaciono el sub índice 1 y el segundo sub índice 2, indica la relación que existe entre ellas, es por eso que solo se pone los datos de una parte de la matriz en muchos casos coloca solo la parte que está por debajo de la diagonal principal.[pic 11]
- Si la variable 1 es la variable dependiente, ¿Cuáles variables independientes tienen el grado
más alto de asociación lineal con la variable 1?
Las variables independientes con el grado más alto de asociación son:
- La variable 5 y la variable 6
La variable 1 dependiente está altamente correlacionada tanto con la variable 5 como con la variable 6.
- ¿Qué clase de asociación existe entre las variables 1 y 4?
La variable 1 tiene una relación negativa del 51% con la variable 4, mientras que la variable 4 aumenta la variable 1 va a disminuir.
- ¿Esta matriz de correlación indica alguna evidencia de multicolinealidad?
- En su opinión, ¿Cuál variable o variables deberían incluirse en el mejor modelo de pronóstico? Explique.
- Si los datos presentados en esta matriz de correlación se corren en un programa de regresión por pasos, ¿Cuál variable independiente (2, 3, 4, 5 o 6) será la primera en entrar en la función de regresión?
- A Jennifer Dahl, supervisora de la cadena de descuento Circle O, le gustaría pronosticar el tiempo que se tardan los empleados en cobrarle a un cliente. Ella decide usar las siguientes variables independientes: número de artículos comprados e importe total de compra. Recopila datos para una muestra de 18 clientes, los cuales se presentan en la siguiente tabla.
[pic 12]
- Determine la mejor ecuación de regresión.
Jennifer Dahl considera un modelo de regresión múltiple que relaciona Tiempo de cobro (minutos) con el importe ($) y el número de artículos:
...