Probabilidad y Estadística
Enviado por Agustina Caporizzo • 5 de Noviembre de 2018 • Ensayo • 1.956 Palabras (8 Páginas) • 93 Visitas
[pic 1]
Carrera:
Bioingeniería
Bioinformática
Asignatura:
Probabilidad y Estadística
Integrantes:
- Caporizzo Agustina
- Fabricius Agustín
- Obón Rodrigo
- Uhrig Leonel
INTRODUCCIÓN
Con una base de datos de 480 pacientes, y con consignas de trabajo, ambas proporcionadas por la cátedra, se procederá a trabajar en la parte 1 (Estadística descriptiva) y 2 (Distribuciones probabilísticas) correspondientes al Trabajo Practico Integrador.
Como herramienta se usaran diferentes softwares para manejar la gran cantidad de datos, y realizar graficas que nos permitan analizar con mayor cuidado las magnitudes.
También se harán cálculos manuales, que en comparación con los mismos obtenidos a través de software nos permitirán tener un mejor juicio acerca de cuál método de trabajo es el adecuado.
Parte 1. Estadística descriptiva.
Variable | Clasificación | Rango/Modalidad |
Paciente | Cuantitativa Discreta | [1,480] |
Género | Cualitativa Nominal | M/F |
Edad | Cuantitativa Discreta | [28,59] |
Peso | Cuantitativa Continua | [47.49,153.71] |
Altura | Cuantitativa Continua | [150.9,194.5] |
IMC | Cuantitativa Continua | [21.03,44.88] |
Nivel de glucosa en ayuna | Cuantitativa Continua | [64.20,159.32] |
Creatinina | Cuantitativa Continua | [0.58,3.74] |
Diabetes | Cualitativa Nominal | Si/No |
- La variable cuantitativa con la que trabajaremos será el Peso.
Para calcular las frecuencias usadas en la determinación del valor modal, se aplicó la raíz cuadrada del número de observaciones de la muestra, lo cual dio un valor de 22. Posteriormente se calculó la frecuencia de cada intervalo, y se trabajó para obtener el valor modal con aquel de mayor frecuencia, esto se hizo de la siguiente forma:
[pic 2]
Ahora reemplazamos con los valores:
[pic 3]
[pic 4]
Variable | Media | Mediana | Valor Modal | Desvío Estándar |
Peso | 82.12 | 73.61 | [pic 5] | 23.01 |
Se interpreta: que el peso promedio de los pacientes es de 82.12 kg; que el valor central de la distribución ordenada en forma creciente de los pesos de los pacientes es de 73.61 kg, valor que para ésta población no corresponde a un individuo específico; que el peso con mayor frecuencia es de 65.36 kg
Estos valores sugieren una forma de distribución asimétrica hacia la derecha.
El desvío estándar calculado (23.01kg) nos da una idea de cuán lejos del valor medio están los pesos de cada pacientes, tanto para aquellos que se encuentren por encima, como por debajo de la media.
+3.74-0.58=3.16
3.16/10=0.316
[0.58;0.58+0.316]
Diabetes | Frecuencia |
sí | 192 |
no | 288 |
Género | Frecuencia |
F | 249 |
M | 231 |
3) Para las variables cualitativas Diabetes y Género se han determinado las siguientes frecuencias:
- Para la Diabetes, un diagrama apropiado sería el siguiente
[pic 6]
Mientras que para el género, sería el siguiente
[pic 7]
- A continuación se trabajara sobre la variable altura, para obtener los siguientes resultados
Media | Rango | Varianza | Desvío estándar | Coeficiente de Variación | |
Mujeres | 164,4 | [150,9;181,4] | 25,61016919 | 5,070841745 | 32,4283352 |
Hombres | 177,7 | [156,3;194,5] | 43,63542287 | 6,62005605 | 26,8435231 |
No sería correcto comparar los desvíos en este caso ya que los grupos no poseen la misma cantidad de valores; en su lugar se trabaja con el coeficiente de variación.
Intervalo | Frecuencia |
0,896 | 64 |
1,212 | 207 |
1,528 | 19 |
1,844 | 14 |
2,16 | 26 |
2,476 | 45 |
2,792 | 65 |
3,108 | 31 |
3,424 | 7 |
3,74 | 2 |
- Se trabajará con la variable Creatinina,
L
7) Histograma para la variable Creatinina:
[pic 8]
- El 50% de la población se encuentra por debajo de la mediana de la Variable Creatinina, es decir por debajo del valor 1,12
- El valor modal calculado gráficamente da 1,137[pic 9]
Mientras que el valor calculado con software da 0,97 - Sería razonable pensar que los datos provienen de una única población de pacientes, ya que en los datos anteriores se aprecia una distribución homogénea.
Podemos aún así realizar una división de nuestra actual población de pacientes, según características que compartan, como por ejemplo el sexo, o el padecimiento de diabetes.
Trabajar con una población de diabéticos y no diabéticos, estudiando el nivel de Creatinina no es apropiado ya que se estudiaría una variable que presentará una gran dispersión en su distribución.
- Sí, la afirmación es correcta.
Y en el siguiente diagrama de caja se puede apreciar que los valores de la Creatinina en pacientes con diabetes son mayores en comparación a los de los pacientes no diabéticos, siendo el valor máximo obtenido de estos menores que el valor mínimo obtenido para los primeros mencionados.[pic 10] - La media, la mediana, el desvío estándar y el rango para la Creatinina en los grupos de pacientes con y sin diabetes son los siguientes:
Grupo con diabetes | Grupo sin diabetes | |
Media | 1,00 | 2,47 |
Mediana | 1 | 2,51 |
Desvío estándar | 0,13581302 | 0,40763299 |
Rango | [0.58;1.31] | [1.44;3.74] |
...