ANÁLISIS DE REGRESIÓN LINEAL Y MÚLTIPLE
Enviado por Eduardo Villa • 28 de Mayo de 2019 • Resumen • 1.136 Palabras (5 Páginas) • 247 Visitas
Maestría en investigación y docencia universitaria
Curso: Estadística aplicada a la investigación
ANÁLISIS DE REGRESIÓN LINEAL Y MÚLTIPLE
- Introducción
EL análisis de regresión múltiple es una técnica en la que se utilizan diversas variables independientes para estimar el valor de una variable dependiente desconocida.En nuestro entorno, por lo general una variable está influenciada por dos, tres o más variables.
- El modelo de regresión lineal múltiple poblacional
[pic 1]
Donde:
y = variable respuesta que se quiere predecir
βo, β1, …., βp : son las constantes.
β1, …., βp coeficientes de regresión
x1,x2, ….. , xp : son variables predictoras o independientes que se miden sin error.
ε : error aleatorio para cualquier conjunto dado de valores x1,…xp
- Supuestos.
- La variable dependiente es una variable aleatoria.
- LINEALIDAD. La relación entre la variable dependiente (y) y cada variable independiente (xi) debe ser lineal.
- HOMOCEDASTICIDAD. Las varianzas de las distribuciones de la variable dependiente (y), para diversos valores de las variables independientes (xi), son iguales.
- NORMALIDAD. Las distribuciones para la variable dependiente(y) son normales.
- NO MULTICOLINEALIDAD. No relación entre las variables independientes (xi)
- Ecuación de regresión muestral
A partir de los datos de la muestra, se encuentran las estimaciones de los parámetros.
[pic 2]
Donde:
: Valor estimado de la variable dependiente[pic 3]
: estimaciones muestrales de los parámetros poblacionales [pic 4]
Son variables predictoras o independientes[pic 5]
- Prueba de hipótesis para la validez del modelo
Luego de analizar la matriz de correlaciones para determinar la importancia de cada variable X en el modelo, es que se realiza la prueba de hipótesis para todo el modelo en conjunto.
- Ho: (el modelo no es válido)[pic 6]
H1: Existe al menos una βi diferente a cero (el modelo si es válido)
- Nivel de significación ( dato ) alfa= 0.05
- P-valor , (ANVA) ( extraer del análisis de varianza. ANVA)
- SI p-valor ≤ α, SE RECHAZA LA Ho (hipótesis nula y se acepta la H1 ( hipótesis alterna[pic 7]
- Si p-valor > , SE ACEPTA LA Ho (hipótesis nula)
- Prueba de hipótesis para un βi.
p-valor que acompaña al estadístico t para cada una de las variables independientes
- Medidas de Bondad de Ajuste
Coeficiente de determinación múltiple (r2)
El coeficiente de determinación múltiple ajustado mide el porcentaje de la variabilidad que se puede explicar mediante las variables de predicción.
Un valor de r2 cercano a uno significa que la ecuación es muy exacta porque explica una gran porción de la variabilidad de y.
Coeficiente de determinación múltiple corregido o ajustado.
Sirve para comparar modelos con distintos números de variables independientes.
(1-R2)[pic 8]
EJEMPLO DE APLICACIÓN
Usando la siguiente base de datos,
Peso (Y) | Altura(X1) | Edad (X2) |
68 | 170 | 19 |
71 | 175 | 20 |
53 | 160 | 16 |
67 | 170 | 21 |
55 | 165 | 17 |
58 | 167 | 17 |
77 | 180 | 20 |
57 | 161 | 18 |
56 | 165 | 16 |
Encuentre lo siguiente:
- Realice la prueba de normalidad de errores
- Determine la ecuación de regresión líneal estimada
- Evalue la significación del modelo
- Realice la prueba de hipótesis para cada βi, para verificar la significación de cada variable independiente (X´s)
- Interprete el coeficiente de determinación
- Estimar el peso de un alumno de 18 años y 177 cms de altura.
SOLUCION
- El supuesto de normalidad de los errores.
Ruta: analizar /regresión / lineales/ dependiente: peso / independientes: altura y edad /
Guardar: residuos no estandarizados / aceptar
1° planteamiento de hipótesis
Ho: los errores tienen distribución normal
H1: los errores no tienen distribución normal
2° nivel de significación:α=0.05
3° p-valor = 0.200
4° decisión : (esto es aceptar o no aceptar la Ho nula)
como sig = 0.200< α=0.05, Se acepta la Ho
Conclusion: (en base al contexto de la Ho nula, lo q se afirma)
A un nivel de significación del 5%, los errores o residuos si tienen distribución normal.
:
:
- Determine la ecuación de regresión lineal múltiple estimada.
Coeficientesa | ||||||
Modelo | Coeficientes no estandarizados | Coeficientes estandarizados | t | Sig. | ||
B | Error estándar | Beta | ||||
1 | (Constante) | -117,473 | 21,050 | -5,581 | ,001 | |
altura | ,893 | ,165 | ,681 | 5,423 | ,002 | |
edad | 1,633 | ,573 | ,358 | 2,852 | ,029 | |
Ecuación matemática Y estimado= -117.473 + 0.893 X1 + 1.633 X2 Ecuación de regresión lineal multiple estimado: Peso estimado= -117.473 + 0.893 altura + 1.633 edad (Kg) (cm) (años) |
...