ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Regresión logística ¿Cuál es el objetivo de la Regresión Logística (RL)?


Enviado por   •  25 de Octubre de 2017  •  Documentos de Investigación  •  863 Palabras (4 Páginas)  •  222 Visitas

Página 1 de 4

REGRESIÓN LOGÍSTICA

PREGUNTAS:

  1. ¿Cuál es el objetivo de la Regresión Logística (RL)?

El objetivo de la RL es predecir una determinada respuesta a partir de las variables predictoras o independientes. Lo que se pretende con la RL es expresar la probabilidad de que ocurra el evento en cuestión como función de ciertas variables.

  1. ¿Qué tipo de RL encuentra?

Se encuentra la “RL Binaria Multivariante”

  1. En una regresión RL binaria ¿Cómo son las variables dependientes e independientes?

Las variables dependientes e independientes son categóricas. La variable dependiente es dicotómica.

  1. ¿En qué consiste una variable Dummy?

Se le llama variable Dummy a una variable categórica no dicotómica que ha sido dicotomizada.

  1. Realice un análisis de RL con el archivo melanoma.sav
  2. Con los resultados del análisis explique:
  1. ¿Qué muestra el historial de iteraciones?

Historial de iteracionesa,b,c

Iteración

-2 log de la verosimilitud

Coeficientes

Constante

Paso 0

1

7973,555

-,846

2

7969,134

-,902

3

7969,134

-,903

a. En el modelo se incluye una constante.

b. -2 log de la verosimilitud inicial: 7969,134

c. La estimación ha finalizado en el número de iteración 3 porque las estimaciones de los parámetros han cambiado en menos de ,001.

  • El estadístico -2LL mide hasta qué punto un modelo se ajusta bien a los datos. El resultado de esta medición recibe también el nombre de "desviación". Cuanto más pequeño sea el valor, mejor será el ajuste. En este primer paso sólo se ha introducido el término constante en el modelo. Como habíamos solicitado en Opciones el historial de iteraciones, la salida del ordenador nos muestra un resumen del proceso iterativo de estimación del primer parámetro. El proceso ha necesitado tres ciclos para estimar correctamente el término constante, porque la variación de -2LL entre el segundo y tercer bucle ha cambiado en menos del criterio fijado por el programa (0,001). También nos muestra el valor del parámetro calculado (b0 = - 0.903).
  1. ¿Para qué sirve la prueba ómnibus?}

Pruebas omnibus sobre los coeficientes del modelo

Chi cuadrado

gl

Sig.

Paso 1

Paso

1855,718

8

,000

Bloque

1855,718

8

,000

Modelo

1855,718

8

,000

 

  •  La fila primera (PASO) es la correspondiente al cambio de verosimilitud (de -2LL) entre pasos sucesivos en la construcción del modelo, contrastando la H0 de que los coeficientes de las variables añadidas en el último paso son cero.
  • La segunda fila (BLOQUE) es el cambio en -2LL entre bloques de entrada sucesivos durante la construcción del modelo. Si como es habitual en la práctica se introducen las variables en un solo bloque, (H0) el Chi Cuadrado del Bloque es el mismo que el Chi Cuadrado del Modelo.
  • La tercera fila (MODELO) es la diferencia entre el valor de -2LL para el modelo sólo con la constante y el valor de -2LL para el modelo actual.
  • En nuestro caso, a pesar de haber 4 covariables introducida en el modelo (además de la constante), coinciden los tres valores. La significación estadística (0,000) nos indica que el modelo con las nuevas variables introducidas mejora el ajuste de forma significativa.
  1. Cuál es la hipótesis para la cual se utiliza el estadístico de Wald?

Variables en la ecuación

B

E.T.

Wald

gl

Sig.

Exp(B)

I.C. 95% para EXP(B)

Inferior

Superior

Paso 1a

sex(1)

,528

,065

65,916

1

,000

1,696

1,493

1,926

stage

639,544

3

,000

stage(1)

-3,758

,185

414,263

1

,000

,023

,016

,033

stage(2)

-3,655

,174

439,949

1

,000

,026

,018

,036

stage(3)

-1,624

,215

56,798

1

,000

,197

,129

,301

year8594(1)

1,340

,068

388,412

1

,000

3,820

3,344

4,365

agegrp

372,094

3

,000

agegrp(1)

-1,988

,111

319,992

1

,000

,137

,110

,170

agegrp(2)

-1,622

,106

233,384

1

,000

,198

,160

,243

agegrp(3)

-,976

,103

89,632

1

,000

,377

,308

,461

Constante

2,917

,191

233,669

1

,000

18,481

a. Variable(s) introducida(s) en el paso 1: sex, stage, year8594, agegrp.

  • La H0 para el estadístico de Wald es si los valores esperados son iguales a los valores observados.

  1. En que consiste la prueba de Hosner y Leneshow:
  • Esta es otra prueba para evaluar la bondad del ajuste de un modelo de regresión logística. Parte de la idea de que si el ajuste es bueno, un valor alto de la probabilidad predicha (p) se asociará con el resultado 1 de la variable binomial dependiente, mientras que un valor bajo de p (próximo a cero) corresponderá –en la mayoría de las ocasiones- con el resultado Y=0. Se trata de calcular, para cada observación del conjunto de datos, las probabilidades de la variable dependiente que predice el modelo, ordenarlas, agruparlas y calcular, a partir de ellas, las frecuencias esperadas, y compararlas con las observadas mediante una prueba Χ2.

  1. Indique las pruebas de bondad de ajuste. Interprete para una de ellas.
  • La prueba de bondad de ajuste de Hosner y Leneshow.

Prueba de Hosmer y Lemeshow

Paso

Chi cuadrado

gl

Sig.

1

14,546

8

,069

Tabla de contingencias para la prueba de Hosmer y Lemeshow

Vital status at last date of contact = Alive

Vital status at last date of contact = Dead: cancer

Total

Observado

Esperado

Observado

Esperado

Paso 1

1

568

568,627

37

36,373

605

2

636

631,785

55

59,215

691

3

414

425,649

63

51,351

477

4

515

531,636

102

85,364

617

5

441

428,401

68

80,599

509

6

422

406,480

89

104,520

511

7

591

584,767

186

192,233

777

8

469

463,632

203

208,368

672

9

429

425,833

286

289,167

715

10

235

253,191

824

805,809

1059

  • P-valor es mayor a 0.05, por lo que no hay significación.
  • Paso 1 nos muestra que aproximadamente 569 pacientes sobrevivieron y que aproximadamente 36 murieron.

  1. Interprete el modelo propuesto.
  • El modelo nos ofrece predecir, en términos de probabilidad, cual es la probabilidad de que un paciente muera por cáncer teniendo en cuenta su sexo, el tipo de centro médico, la edad y la ubicación del tumor.
  • Como resultados tenemos que la probabilidad de que un paciente muera por efectos del cáncer teniendo en cuenta su sexo, el tipo de centro médico, la edad y la ubicación del tumor es de 0.5

...

Descargar como (para miembros actualizados) txt (7 Kb) pdf (223 Kb) docx (17 Kb)
Leer 3 páginas más »
Disponible sólo en Clubensayos.com