MODELO REGRESIÓN LINEAL MÚLTIPLE
Enviado por Juan Alejandro Aguirre • 16 de Marzo de 2021 • Informe • 2.006 Palabras (9 Páginas) • 126 Visitas
MODELO REGRESIÓN LINEAL MÚLTIPLE
Definición
La regresión lineal múltiple trata de ajustar modelos lineales o linealizables entre una variable dependiente y más de una variable independiente. En este tipo de modelos es importante testar la heterocedasticidad, la multicolinealidad y la especificación. Es particularmente importante entender lo que se está haciendo en cada momento porque estos principios sirven para prácticamente todos los modelos que se emprendan a continuación y después, con modelos más complejos y menos intuitivos, serán más difíciles de comprender; la regresión múltiple también nos puede servir para entender la relación funcional entre la variable dependiente y las variables independientes y estudiar cuales pueden ser las causas de la variación de . (Granados, 2016)[pic 1]
Especificación del modelo de regresión lineal múltiple
Nos permite explicar relaciones económicas en las que intervienen más de dos variables.
[pic 2]
Donde:
variable explicada o dependiente [pic 3]
término del intercepto[pic 4]
parámetro de la pendiente, se interpreta como el efecto parcial sobre de un cambio enceteris paribus.[pic 5][pic 6][pic 7]
son las variables explicativas, regresores o variables independientes.[pic 8]
término del error estocástico.[pic 9]
Tipos de variables
En regresión múltiple se trabaja con variables. Y lo que se hace es calcular siempre promedios (promedio de una variable, de una correlación, de una tendencia, de una función, de una ratio; promedios de variables estandarizadas, estudentizadas con cualquier otra función) y su desviación típica (la desviación típica es una denominación que se reserva a la muestra y a la población, cuando se refiere a un parámetro estimado - la media, la tendencia u otro - se suele denominar error estándar). (Granados, 2016, págs. 7-8)
Tabla Nro….
Tipo de Variable | Modelo |
Continua | Lineal |
Dicotómica | Logit o probit |
Recuento | Poison o Binomial |
Factor ordenado | Logit o probit Ordenada |
Factor | Logit o probit Multinomial |
Porcentaje | Regresión fraccional |
Fuente: Departamento de economía aplicada
VALIDACIÓN MODELO DE REGRESIÓN LINEAL MÚLTIPLE
Homocedasticidad
La hipótesis de homocedasticidad establece que la variabilidad de los residuos es independiente de las variables explicativas. En general, la variabilidad de los residuos estará en función de las variables explicativas, pero como las variables explicativas están fuertemente correlacionadas con la variable dependiente, de valores pronosticados versus residuos al cuadrado. (Rojo, 2007, pág. 22)
[pic 10]
Multicolinealidad
Si las variables explicativas se expresan como una combinación lineal se dice que existe un problema de multicolinealidad.
[pic 11]
Frecuentemente, este problema afecta cuando se va incrementando la varianza de los estimadores, este problema se detecta principalmente:
- Requiriendo el determinante de la matriz de varianzas-covarianzas, que estará cercano a cero.
- Calculando para cada variable el coeficiente de determinación () de dicha variable con las demás.[pic 12]
- La solución es eliminar del modelo aquellas variables explicativas que dependen unas de otras, en general los métodos de selección de variables solucionan automáticamente este problema. (Rojo, 2007, pág. 17)
Valores de influencia (leverage)
Se considera que una observación es influyente a priori si su inclusión en el análisis modifica sustancialmente el sentido de este. Una observación puede ser influyente si es un outlayer respecto a alguna de las variables explicativas: (Rojo, 2007, págs. 20-21)
Para detectar estos problemas se utiliza la medida de Leverage:
[pic 13]
Como analizar el modelo regresión lineal múltiple
- Significación de F-test: si es menor de 0,05 significa que el modelo es estadísticamente significativo y por tanto las variables independientes explican a la variable dependiente, cuánto “algo” es la R-cuadrado. (Cardenas, 2010)
- R cuadrado: es cuánto las variables independientes explican la variable dependiente, indica el porcentaje de la varianza de la variable dependiente explicado por el conjunto de variables independientes, cuanto mayor sea el más explicativo y mejor es el modelo estadístico. (Cardenas, 2010)[pic 14]
- Significación de t-test: si es menor de 0,05 significa que esa variable independiente se relaciona de forma significativa con la variable dependiente, por tanto, influye sobre ella, es explicativa. (Cardenas, 2010)
- Coeficiente beta (β): indica la intensidad y la dirección de la relación entre esa variable independiente VI y la variable dependiente VD. (Cardenas, 2010)
Primer Modelo Regresión Lineal Múltiple
[pic 15]
Análisis del Modelo
Si la talla y la edad de la madre son cero, el peso del neonato será de – 556,51 gramos por cada mil nacidos vivos.
Si la talla incrementa en una unidad, en promedio el peso incrementará en 61,68 gramos manteniendo constante la influencia la edad de la madre por cada mil nacidos vivos.
Si la edad de la madre incrementa en un año en promedio, el peso decrecerá en -2,20 gramos manteniendo constante la influencia de la talla por cada mil nacidos vivos.
...