Metodología, variable de resultado
Enviado por Gabrielao dt Revelo Salgado • 14 de Junio de 2021 • Síntesis • 721 Palabras (3 Páginas) • 85 Visitas
Supóngase que se posee una variable de resultado , que toma los siguientes valores:[pic 1]
[pic 2]
La variable toma el valor de 1 si ocurre el evento y 0 caso contrario. Dado el interés de modelar como una función de variables independientes , no hay pérdida de generalización fijando el resultado con valores de 0 y 1. La función de probabilidad para la variable de resultado , es con y .[pic 3][pic 4][pic 5][pic 6][pic 7][pic 8][pic 9]
El modelo de regresión está formando por la parametrización de p que depende de una función de indicadores , donde es un vector de variables independientes y es un vector desconocido de parámetros. Este modelo de respuesta binaria estándar, la probabilidad condicional tiene la forma de:[pic 10][pic 11][pic 12][pic 13]
Eq. (1)[pic 14]
Donde, es una función paramétrica específica de , usualmente una función de distribución acumulada (CDF) en por cuanto esto asegura que el resultado satisfaga la condición .[pic 15][pic 16][pic 17][pic 18]
Si se elige la CDF logística, el modelo se denomina Logit. Formalmente, la probabilidad del modelo Logit se estima con la siguiente expresión:
Eq. (2)[pic 19]
Ajuste y validación
El ajuste de los modelos de respuesta binaria se puede evaluar a través de la Matriz de Confusión y a través de la Receiver Operating Curve (ROC). Complementariamente, se puede aplicar la prueba de Hosmer y Lemeshow en el cual se considera como hipótesis nula (H0) de que no existe diferencia entre los valores reales vs. los pronósticos.
Matriz de confusión
Es una matriz de 2x2, en la cual se cuantifican las estimaciones tanto correctas como incorrectas realizadas por el modelo, utilizando los datos originales. A continuación, se presenta la matriz de confusión construida a partir de la variable de resultado o independiente , que toma el valor de 1 si ocurre el evento, 0 caso contrario:[pic 20]
Matriz de confusión
Valor observado | |||
Pronóstico | 0 | 1 | |
Ocurrencia del evento | 0 | Correcto | Error tipo I |
1 | Error tipo II | Correcto |
Fuente:
...