Examen Bioestadística Descriptiva
Enviado por Carlos Tasigchana • 5 de Marzo de 2023 • Examen • 1.399 Palabras (6 Páginas) • 54 Visitas
Primer examen del curso de bioestadística II
Recomendaciones generarles:
- El examen es individual, por lo que recibir ayuda de cualquier tercero es considerado plagio.
- Debe adjuntar en la plataforma el documento con las respuestas antes de las 10 pm.
- En todas sus respuestas no use más de dos decimales, a menos que sea un p valor donde se recomienda el uso de 3 decimales. Sin embargo, se recomienda que en sus cálculos mantenga 4 decimales y solo aproxime hasta la respuesta final.
- En todas las preguntas donde se pida realizar una prueba de hipótesis usted debe:
- Escribir la hipótesis estadística que se está probando (Hoy Ha)
- Decir qué método utilizará para la prueba (por ejemplo, prueba t, prueba f, compara modelo completo vs. reducido, intervalo de confianza, evaluación visual, etc. )
- Escribir los resultados (por ejemplo valor de la prueba y p valor o valor crítico)
- Escribir una respuesta clara. Tips: interprete siempre a la luz del problema, use las mismas palabras de la pregunta, no acepte la hipótesis nula, y cuando corresponda no olvide mencionar el nivel de confianza.
Los datos del archivo “taller” corresponden a 152 pacientes a los cuales se les midieron las siguientes variables: edad (0. ≤50, 1. >50), talla (en metros), nivel de colesterol hdl (en mg/dl), nivel de colesterol ldl (en mg/dl), niveles de glucosa basal (en mg/dl), niveles de creatinina (en mg/dl), presión arterial diastólica (en mmHg) y presión arterial diastólica (en mmHg). El objetivo principal de este estudio era evaluar cuál de las variables estudiadas ayudaba a predecir mejor los niveles de creatinina de esa población de pacientes. A partir de esta información:
- Complete la siguiente tabla con un análisis exploratorio de las variables
(use máximo dos decimales)
Variable | Mínimo | Máximo | Mediana | Media | Desviación estándar |
Talla | 145 | 177 | 160 | 160.69 | 7.38 |
HDL | 22 | 97 | 57 | 57.31 | 14.18 |
LDL | 89 | 256 | 155 | 161.72 | 37.08 |
Glucosa | 78 | 128 | 97 | 97.51 | 11.94 |
PAS | 120 | 212 | 154 | 157.92 | 18.95 |
PAD | 70 | 113 | 95 | 93.88 | 10.10 |
Creatinina | 0.72 | 1.31 | 1.02 | 1.04 | 0.14 |
[pic 1][pic 2]
- Calcule la correlación de la creatinina con las demás variables. ¿Cuál es la variable con la correlación más alta? (use máximo dos decimales)
Variable | Correlación con creatinina |
Talla | 0.26 |
HDL | -0.22 |
LDL | 0.14 |
Glucosa | 0.34 |
PAS | 0.07 |
PAD | 0.12 |
La variable con la correlación más alta es Glucosa, con un coeficiente de correlación de Pearson de 0.34, lo que indica una asociación lineal débil entre la creatinina y la glucosa.
[pic 3][pic 4]
[pic 5]
- ¿Existe diferencia en los niveles de creatinina promedio entre los pacientes de 50 años o menos y los pacientes mayores de 50 años? (realice una prueba t, un análisis de varianza, o un modelo de regresión)
H0: [pic 6][pic 7] [pic 8][pic 9] H1: [pic 10][pic 11] [pic 12][pic 13]
Estadístico T: 0.28
Valor de p: 0.777
[pic 14]
No existe evidencia de que los niveles promedios de creatinina sean diferentes entre los pacientes de 50 años o menos y los pacientes mayores de 50 años, con una confianza del 95%.
- Dado que el objetivo es encontrar un modelo que prediga la variable creatinina, utilice alguno de los siguientes métodos para seleccionar el mejor modelo para este propósito
- Utilice la estrategia forward, backward o todos los posibles modelos. Solo use una estrategia, no las tiene que hacer todas.
Se utiliza la estrategia Backward.
[pic 15]
[pic 16]
- Reporte cuál es el modelo seleccionado (variables seleccionadas y coeficientes estimados del modelo)
Como se observa en la salida de R del punto a, el modelo seleccionado es: Y=[pic 17][pic 18]
Variables independientes seleccionadas: Talla(X1), Glucosa (X2) y PAS (X3)
Coeficientes estimados:
[pic 19][pic 20][pic 21][pic 22][pic 23]
- Explique claramente por qué ese modelo es mejor que los otros.
Se escoge este modelo ya que explica el 19 % de la variabilidad de la variable dependiente y es el más sencillo, con solo 3 variables, mientras que existen modelos que explican hasta un 22 % de la variabilidad de Y, pero contienen 6 variables. Este es el modelo más parsimonioso.
Basado en el mejor modelo seleccionado en el punto anterior:
- Interprete R².
R²=0.19. Este modelo explica el 19 % de la variabilidad de Y.
- Interprete β0.
Si la talla, glucosa y PAS tuvieran un valor de 0, el valor promedio de la creatinina sería -0.54 mg/dl, no obstante, esta interpretación no tiene sentido porque estas variables nunca podrían asumir un valor de 0.
...