Regresión logística ¿Cuál es el objetivo de la Regresión Logística (RL)?
Enviado por AsecinOscurO • 25 de Octubre de 2017 • Documentos de Investigación • 863 Palabras (4 Páginas) • 222 Visitas
REGRESIÓN LOGÍSTICA
PREGUNTAS:
- ¿Cuál es el objetivo de la Regresión Logística (RL)?
El objetivo de la RL es predecir una determinada respuesta a partir de las variables predictoras o independientes. Lo que se pretende con la RL es expresar la probabilidad de que ocurra el evento en cuestión como función de ciertas variables.
- ¿Qué tipo de RL encuentra?
Se encuentra la “RL Binaria Multivariante”
- En una regresión RL binaria ¿Cómo son las variables dependientes e independientes?
Las variables dependientes e independientes son categóricas. La variable dependiente es dicotómica.
- ¿En qué consiste una variable Dummy?
Se le llama variable Dummy a una variable categórica no dicotómica que ha sido dicotomizada.
- Realice un análisis de RL con el archivo melanoma.sav
- Con los resultados del análisis explique:
- ¿Qué muestra el historial de iteraciones?
Historial de iteracionesa,b,c | |||
Iteración | -2 log de la verosimilitud | Coeficientes | |
Constante | |||
Paso 0 | 1 | 7973,555 | -,846 |
2 | 7969,134 | -,902 | |
3 | 7969,134 | -,903 | |
a. En el modelo se incluye una constante. | |||
b. -2 log de la verosimilitud inicial: 7969,134 | |||
c. La estimación ha finalizado en el número de iteración 3 porque las estimaciones de los parámetros han cambiado en menos de ,001. |
- El estadístico -2LL mide hasta qué punto un modelo se ajusta bien a los datos. El resultado de esta medición recibe también el nombre de "desviación". Cuanto más pequeño sea el valor, mejor será el ajuste. En este primer paso sólo se ha introducido el término constante en el modelo. Como habíamos solicitado en Opciones el historial de iteraciones, la salida del ordenador nos muestra un resumen del proceso iterativo de estimación del primer parámetro. El proceso ha necesitado tres ciclos para estimar correctamente el término constante, porque la variación de -2LL entre el segundo y tercer bucle ha cambiado en menos del criterio fijado por el programa (0,001). También nos muestra el valor del parámetro calculado (b0 = - 0.903).
- ¿Para qué sirve la prueba ómnibus?}
Pruebas omnibus sobre los coeficientes del modelo | ||||
Chi cuadrado | gl | Sig. | ||
Paso 1 | Paso | 1855,718 | 8 | ,000 |
Bloque | 1855,718 | 8 | ,000 | |
Modelo | 1855,718 | 8 | ,000 |
- La fila primera (PASO) es la correspondiente al cambio de verosimilitud (de -2LL) entre pasos sucesivos en la construcción del modelo, contrastando la H0 de que los coeficientes de las variables añadidas en el último paso son cero.
- La segunda fila (BLOQUE) es el cambio en -2LL entre bloques de entrada sucesivos durante la construcción del modelo. Si como es habitual en la práctica se introducen las variables en un solo bloque, (H0) el Chi Cuadrado del Bloque es el mismo que el Chi Cuadrado del Modelo.
- La tercera fila (MODELO) es la diferencia entre el valor de -2LL para el modelo sólo con la constante y el valor de -2LL para el modelo actual.
- En nuestro caso, a pesar de haber 4 covariables introducida en el modelo (además de la constante), coinciden los tres valores. La significación estadística (0,000) nos indica que el modelo con las nuevas variables introducidas mejora el ajuste de forma significativa.
- Cuál es la hipótesis para la cual se utiliza el estadístico de Wald?
Variables en la ecuación | |||||||||
B | E.T. | Wald | gl | Sig. | Exp(B) | I.C. 95% para EXP(B) | |||
Inferior | Superior | ||||||||
Paso 1a | sex(1) | ,528 | ,065 | 65,916 | 1 | ,000 | 1,696 | 1,493 | 1,926 |
stage | 639,544 | 3 | ,000 | ||||||
stage(1) | -3,758 | ,185 | 414,263 | 1 | ,000 | ,023 | ,016 | ,033 | |
stage(2) | -3,655 | ,174 | 439,949 | 1 | ,000 | ,026 | ,018 | ,036 | |
stage(3) | -1,624 | ,215 | 56,798 | 1 | ,000 | ,197 | ,129 | ,301 | |
year8594(1) | 1,340 | ,068 | 388,412 | 1 | ,000 | 3,820 | 3,344 | 4,365 | |
agegrp | 372,094 | 3 | ,000 | ||||||
agegrp(1) | -1,988 | ,111 | 319,992 | 1 | ,000 | ,137 | ,110 | ,170 | |
agegrp(2) | -1,622 | ,106 | 233,384 | 1 | ,000 | ,198 | ,160 | ,243 | |
agegrp(3) | -,976 | ,103 | 89,632 | 1 | ,000 | ,377 | ,308 | ,461 | |
Constante | 2,917 | ,191 | 233,669 | 1 | ,000 | 18,481 | |||
a. Variable(s) introducida(s) en el paso 1: sex, stage, year8594, agegrp. |
- La H0 para el estadístico de Wald es si los valores esperados son iguales a los valores observados.
- En que consiste la prueba de Hosner y Leneshow:
- Esta es otra prueba para evaluar la bondad del ajuste de un modelo de regresión logística. Parte de la idea de que si el ajuste es bueno, un valor alto de la probabilidad predicha (p) se asociará con el resultado 1 de la variable binomial dependiente, mientras que un valor bajo de p (próximo a cero) corresponderá –en la mayoría de las ocasiones- con el resultado Y=0. Se trata de calcular, para cada observación del conjunto de datos, las probabilidades de la variable dependiente que predice el modelo, ordenarlas, agruparlas y calcular, a partir de ellas, las frecuencias esperadas, y compararlas con las observadas mediante una prueba Χ2.
- Indique las pruebas de bondad de ajuste. Interprete para una de ellas.
- La prueba de bondad de ajuste de Hosner y Leneshow.
Prueba de Hosmer y Lemeshow | ||||||
Paso | Chi cuadrado | gl | Sig. | |||
1 | 14,546 | 8 | ,069 | |||
Tabla de contingencias para la prueba de Hosmer y Lemeshow | ||||||
Vital status at last date of contact = Alive | Vital status at last date of contact = Dead: cancer | Total | ||||
Observado | Esperado | Observado | Esperado | |||
Paso 1 | 1 | 568 | 568,627 | 37 | 36,373 | 605 |
2 | 636 | 631,785 | 55 | 59,215 | 691 | |
3 | 414 | 425,649 | 63 | 51,351 | 477 | |
4 | 515 | 531,636 | 102 | 85,364 | 617 | |
5 | 441 | 428,401 | 68 | 80,599 | 509 | |
6 | 422 | 406,480 | 89 | 104,520 | 511 | |
7 | 591 | 584,767 | 186 | 192,233 | 777 | |
8 | 469 | 463,632 | 203 | 208,368 | 672 | |
9 | 429 | 425,833 | 286 | 289,167 | 715 | |
10 | 235 | 253,191 | 824 | 805,809 | 1059 |
- P-valor es mayor a 0.05, por lo que no hay significación.
- Paso 1 nos muestra que aproximadamente 569 pacientes sobrevivieron y que aproximadamente 36 murieron.
- Interprete el modelo propuesto.
- El modelo nos ofrece predecir, en términos de probabilidad, cual es la probabilidad de que un paciente muera por cáncer teniendo en cuenta su sexo, el tipo de centro médico, la edad y la ubicación del tumor.
- Como resultados tenemos que la probabilidad de que un paciente muera por efectos del cáncer teniendo en cuenta su sexo, el tipo de centro médico, la edad y la ubicación del tumor es de 0.5
...