ANALISIS DE SOBREVIDA CON REGRESION DE COX EXPLORANDO LOS DATOS: ANALISIS UNIVARIADO
Enviado por Orhel • 19 de Diciembre de 2015 • Tarea • 16.232 Palabras (65 Páginas) • 150 Visitas
ANALISIS DE SOBREVIDA CON REGRESION DE COX
EXPLORANDO LOS DATOS: ANALISIS UNIVARIADO
En cualquier análisis de los datos es siempre una gran idea para hacer un análisis univariado antes de pasar a modelos más complicados. En el análisis de supervivencia es muy recomendable mirar las curvas de Kaplan-Meier para todos los predictores categóricos. Esto proporcionará información sobre la forma de la función de supervivencia para cada grupo y dar una idea de si o no los grupos son proporcionales (es decir, las funciones de supervivencia son aproximadamente paralelos). También consideramos las pruebas de la igualdad en todos los estratos para explorar si se incluye o no el predictor en el modelo final. Para las variables categóricas se utilizará la prueba de log-rank de la igualdad en todos los estratos, que es una prueba no paramétrica. Para las variables continuas, se utilizará una regresión de riesgos proporcionales de Cox univariante que es un modelo semi-paramétrico. Deberíamos considerar la inclusión del predictor si la prueba tiene un valor de p de 0,2 - 0,25 o menos. Estamos utilizando este esquema de eliminación, porque todos los predictores en el conjunto de datos son variables que podrían ser relevantes para el modelo. Si el predictor tiene un valor de p superior a 0,25 en el análisis univariado es muy poco probable que puedan hacer un aporte a un modelo que incluye otros predictores.
Veamos este ejemplo:
La prueba de log-rank de la igualdad en todos los estratos del predictor “treat” tiene un valor de p de 0,0091, por lo que “treat” se incluirá como un candidato potencial para el modelo final. En el gráfico vemos que la función de supervivencia para cada grupo de tratamiento no son perfectamente paralelas están separadas al principio y al final. La coincidencia en el final no debería causar demasiada preocupación porque está determinado sólo por un número muy limitado de temas censurados de una muestra de 628 sujetos. En general, la prueba de log-rank pone el énfasis más en las diferencias en las curvas a mayores valores de tiempo. Es por eso que tenemos un valor p pequeño a pesar de que las dos curvas de supervivencia parecen estar muy próximos entre sí por tiempo menores de 100 días.
sts graph, by(treat)
[pic 1]
sts test treat, logrank
failure _d: censor
analysis time _t: time
Log-rank test for equality of survivor functions
| Events Events
treat | observed expected
------+-------------------------
0 | 265 235.80
1 | 243 272.20
------+-------------------------
Total | 508 508.00
chi2(1) = 6.80
Pr>chi2 = 0.0091
La prueba de log-rank de la igualdad en todos los estratos para el predictor “Herco” tiene un valor de p de 0,1473, lo que “Herco! será incluido como posible candidato para el modelo final. De la gráfica se observa que los tres grupos no son paralelas y que en especial los grupos Herco = 1 y = 3 Herco se superponen para la mayor parte de la gráfica. Esta falta de paralelismo puede ser un problema cuando se incluye este predictor en el modelo de riesgos proporcionales de Cox, ya que una de las hipótesis es la proporcionalidad de los predictores.
sts graph, by(herco) noborder
[pic 2]
sts test herco
failure _d: censor
analysis time _t: time
Log-rank test for equality of survivor functions
| Events Events
herco | observed expected
------+-------------------------
1 | 228 242.14
2 | 100 84.19
3 | 180 181.67
------+-------------------------
Total | 508 508.00
chi2(2) = 3.83
Pr>chi2 = 0.1473
No es factible calcular una curva de Kaplan-Meier para los predictores continuos, ya que habría una curva para cada nivel del predictor y un predictor continuo simplemente tiene muchos diferentes niveles. En su lugar, considerar el modelo de riesgos proporcionales de Cox con un indicador único y continuo. Lamentablemente no es posible producir un diagrama o plots cuando se usa el comando stcox. En su lugar se considera la prueba de Chi-cuadrado para la variable “ndrugtx” que tiene un valor de p de 0,0003 así “ndrugtx” es un candidato potencial para el modelo final, ya que el valor de p es menor que nuestro valor de corte de 0,2. Especificamos la opción “nohr” para indicar que no deseamos ver el Hazard ratio (HR) más bien queremos mirar solo los coeficientes.
stcox ndrugtx, nohr
Cox regression -- Breslow method for ties
No. of subjects = 611 Number of obs = 611
No. of failures = 496
Time at risk = 143002
LR chi2(1) = 13.35
Log likelihood = -2868.299 Prob > chi2 = 0.0003
------------------------------------------------------------------------------
_t |
_d | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
ndrugtx | .029372 .0074979 3.92 0.000 .0146763 .0440676
------------------------------------------------------------------------------
En este modelo la prueba de Chi-cuadrado para la edad también tiene un p-valor inferior a 0,2 y por lo tanto es un candidato potencial para el modelo final.
stcox age, nohr
Cox regression -- Breslow method for ties
No. of subjects = 623 Number of obs = 623
...