REGRESIÓN LOGÍSTICA MULTINOMIAL | EJEMPLOS DE ANÁLISIS DE DATOS STATA
Enviado por Jorge Jimenez • 11 de Noviembre de 2018 • Resumen • 738 Palabras (3 Páginas) • 554 Visitas
REGRESIÓN LOGÍSTICA MULTINOMIAL | EJEMPLOS DE ANÁLISIS DE DATOS STATA
La regresión logística multinomial se usa para modelar variables de resultado nominales, en las que las probabilidades de registro de los resultados se modelan como una combinación lineal de las variables de predicción.
Ejemplos de regresión logística multinomial:
Ejemplo 1. Las elecciones ocupacionales de las personas pueden estar influenciadas por las ocupaciones de sus padres y su propio nivel de educación. Podemos estudiar la relación de la elección de una ocupación con el nivel de educación y la ocupación del padre. Las elecciones ocupacionales serán la variable de resultado que consiste en categorías de ocupaciones.
Ejemplo 2. Un biólogo puede estar interesado en las elecciones de alimentos que hacen los lagartos. Los caimanes adultos pueden tener diferentes preferencias que los jóvenes. La variable de resultado aquí será los tipos de alimentos, y las variables predictoras pueden ser el tamaño de los caimanes y otras variables ambientales.
Ejemplo 3. Los estudiantes que ingresan a la escuela secundaria hacen elecciones de programas entre el programa general, el programa vocacional y el programa académico. Su elección se puede modelar utilizando su puntaje de escritura y su estado económico social.
Descripción de los datos
Para nuestro ejemplo de análisis de datos, ampliaremos el tercer ejemplo utilizando el conjunto de datos hsbdemo . Primero leamos en los datos. El conjunto de datos contiene variables en 200 estudiantes. La variable de resultado es prog , tipo de programa. Las variables predictoras son el estado socioeconómico, ses, una variable categórica de tres niveles y puntaje de escritura, write, una variable continua. Comencemos con obtener algunas estadísticas descriptivas de las variables de interés.
[pic 1]
A continuación, usamos el comando mlogit para estimar un modelo de regresión logística multinomial. El “y” antes de ses indica que ses es una variable indicadora (es decir, variable categórica) y que debe incluirse en el modelo. También usamos la opción " base " para indicar la categoría que queremos usar para el grupo de comparación de referencia. En el modelo a continuación, hemos elegido usar el tipo de programa académico como la categoría de referencia.
En el resultado anterior, primero vemos el registro de iteración, que indica qué tan rápido convergió el modelo. La probabilidad de registro (-179.98173) puede usarse en comparaciones de modelos anidados, pero no mostraremos un ejemplo de comparación de modelos aquí
La razón de verosimilitud chi-cuadrado de 48.23 con un valor p <0.0001 nos dice que nuestro modelo como un todo encaja significativamente mejor que un modelo vacío (es decir, un modelo sin predictores)
El resultado anterior tiene dos partes, etiquetadas con las categorías de la variable de resultado prog. Corresponden a las dos ecuaciones siguientes:
[pic 2]
donde b segundo son los coeficientes de regresión.
- Un aumento de una unidad en la escritura variable se asocia con una disminución de .058 en las probabilidades de registro relativas de estar en el programa general frente al programa académico.
- Un aumento de una unidad en la escritura variable se asocia con una disminución de .1136 en las probabilidades de registro relativas de estar en el programa de vocación frente al programa académico.
- Las probabilidades log relativas de estar en el programa general vs. en el programa académico disminuirán en 1.163 si se pasa del nivel más bajo de ses ( ses == 1) al nivel más alto de ses ( ses == 3).
La relación de la probabilidad de elegir una categoría de resultado sobre la probabilidad de elegir la categoría de referencia a menudo se conoce como riesgo relativo (y también se la conoce como probabilidades, tal como acabamos de describir los parámetros de regresión anteriores). El riesgo relativo se puede obtener exponiendo las ecuaciones lineales anteriores, obteniendo coeficientes de regresión que son razones de riesgo relativo para un cambio de unidad en la variable de predicción. Podemos usar la opción rrr para el comando mlogit para mostrar los resultados de la regresión en términos de relaciones de riesgo relativo.
...