ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Predicción de la mortalidad por enfermedades cardiovasculares

Bea GilInforme5 de Septiembre de 2022

2.860 Palabras (12 Páginas)87 Visitas

Página 1 de 12

Predicción de la mortalidad por enfermedades cardiovasculares

Resumen: Vamos a desarrollar un análisis de la mortalidad producida por enfermedades cardiovasculares. Para ello hemos utilizado una base de datos de Kaggle. Dicha base de datos de Kaggle utiliza los datos de Tanvir Ahmad, Assia Munir, Sajjad Haider Bhatti, Muhammad Aftab y Muhammad Ali Raza (Government College University, Faisalabad, Pakistán) y fueron puestos a disposición por ellos en FigShare en julio de 2017. Estos datos han sido actualizados por Davide Chicco (Krembil Research Institute, Toronto, Canadá).

Palabras clave: predicción, edad, anemia, creatinfosfoquinasa, diabetes, eyección, presión sanguínea, plaquetas, creatinina sérica, sodio sérico, sexo, fumador, tiempo, muerte

Abstract: We are going to develop an analysis of mortality due to cardiovascular diseases. For this we have used a Kaggle database. The Kaggle database uses data from Tanvir Ahmad, Assia Munir, Sajjad Haider Bhatti, Muhammad Aftab and Muhammad Ali Raza (Government College University, Faisalabad, Pakistan) and was made available by them on FigShare in July 2017. This data has been updated by Davide Chicco (Krembil Research Institute, Toronto, Canada).

Keywords: prediction, age, anaemia, creatinine phosphokinase, diabetes, ejection fraction, blood pressure, platelets, serum creatinine, serum sodium, sex, smoking, time, death

1 Insuficiencia cardiaca

La insuficiencia cardíaca se trata de una afección por la que el corazón ya no puede bombear sangre con oxígeno al resto del cuerpo de manera eficiente. Suele tratarse de un problema prolongado en el tiempo, pero también es posible que se presente de manera repentina. Puede ser causada por muchos problemas diferentes del corazón.

1.1 Impacto social a nivel mundial

Las enfermedades cardiovasculares son la principal causa de muerte en todo el mundo. Según la OMS, se estima que 17,9 millones de personas murieron por enfermedades cardiovasculares en 2019, lo que representa un 32 % de todas las muertes del planeta.

1.2 Parámetros

Para poder realizar el análisis de la mortalidad tenemos los siguientes factores:

- Edad: representa la edad de la persona

- Anemia: Se trata del síndrome que se caracteriza por la disminución anormal del número o tamaño de los glóbulos rojos que contiene la sangre o de su nivel de hemoglobina. Lo representamos con un valor booleano 0 significa que no tienen anemia y 1 que sí que tienen anemia.

- Creatinfosfoquinasa: Mide el nivel de la enzima CPK en sangre. Los valores normales de la creatinfosfoquinasa (CPK) son entre 32 y 294 U/L para los hombres y 33 a 211 U/L para las mujeres.

- Diabetes: La diabetes es una enfermedad en la que los niveles de glucosa (azúcar) de la sangre están muy altos. Lo representamos con un valor booleano 0 significa que no tienen diabetes y 1 que sí que tienen diabetes.

- Eyección: Porcentaje de sangre que sale del corazón en cada contracción. Habitualmente en cada contracción el corazón saca un poco más de la mitad de la sangre que tiene cuando está lleno al máximo. Por eso lo normal es que la fracción de eyección sea alrededor del 50% o algo más.

- Presión sanguínea: Si el paciente tiene hipertensión, es decir, si tiene la presión arterial alta. Lo representamos con un valor booleano 0 significa que no tienen hipertensión y 1 que sí que tienen hipertensión.

- Plaquetas: Las plaquetas, también conocidas como trombocitos, son células sanguíneas. Se forman en la médula ósea, un tejido similar a una esponja en sus huesos. Las plaquetas juegan un papel importante en la coagulación de la sangre. Normalmente, cuando uno de sus vasos sanguíneos se rompe, comienza a sangrar. Las plaquetas se coagulan para tapar la lesión en el vaso sanguíneo y detener el sangrado.

- Creatinina sérica: Un nivel elevado de creatinina puede ser un signo de función renal deficiente. La creatinina sérica se expresa en miligramos de creatinina por decilitro de sangre

- Sodio sérico: El nivel de sodio en la sangre representa un equilibrio entre el sodio en los alimentos y bebidas que se consumen y la cantidad en la orina.

- Sexo: Valor booleano que representa sexo femenino si es 0 y sexo masculino si es 1.

- Fumador: Valor booleano que representa fumador si es 1 y no fumador si es 0.

2 Análisis de los datos

Vamos a realizar un análisis de los datos con gráficas, cuando sea posible, relacionándolos con el valor de DEATH_EVENT.

● EDAD-DEATH

Figura 1: Comparativa con edad

Observando la gráfica podemos ver que no hay ninguna relación clara entre la edad y la muerte. Lo único que nos indica es que dentro del estudio, ya finalicen con muerte o sin muerte, hay más personas de edades entre los 50-70 ya que sus barras son las más altas. Es decir, es más probable que alguien comprendido entre esas edades padezca enfermedades del corazón.

● DIABETES-DEATH_EVENT

Figura 2: Comparativa con diabetes

Podemos ver un total de 174 personas que no padecen diabetes y 125 que sí que la padecen. Si nos fijamos en porcentajes vemos que en ambos grupos es mayor el porcentaje de personas que no muere ya tenga o no diabetes. Es algo extraño en este estudio ya que habitualmente las personas que padecen diabetes tienen más posibilidades de morir por enfermedades del corazón.

● ANEMIA-DEATH_EVENT

Figura 3: Comparativa con anemia

Nos pasa lo mismo que con el estudio de la diabetes observamos que hay más personas que no tiene anemia pero que no es mayor el porcentaje de muertes en personas con anemia. Igualmente la anemia es un problema que deriva en insuficiencias cardiacas por tener que bombear el corazón con mayor frecuencia para contrarrestar la falta de oxígeno en la sangre. Todo esto nos llevaría a pensar que las personas con anemia tienen mayor probabilidad de morir por insuficiencia cardiaca ya que es más posible que la padezcan, algo que no pasa de manera clara en este estudio.

● EYECCIÓN-DEATH_EVENT

Figura 4: Comparativa con eyección

Podemos ver que en los valores correspondientes a DEATH_EVENT=1 todos son bastante bajos, es algo que tiene sentido ya que lo normal debería estar en torno a valores de 50.

● PRESIÓN_SANGUÍNEA-DEATH_EVENT

Figura 5: Comparativa con presión sanguínea

Podemos ver como en los datos del estudio muchas más personas no tienen hipertensión, pero igual que nos pasaba con la diabetes y la anemia observamos unos valores extraños en los pacientes que mueren ya que esperaríamos que fuesen más personas con hipertensión las que fallecieran.

● CREATININA_SÉRICA-DEATH_EVENT

Figura 6: Comparativa con creatinina sérica

Un valor elevado es un indicador que puede llevar a problemas de corazón y con ellos a la muerte. Observamos que los colores que corresponden a los valores más altos se encuentran en el valor de DEATH_EVENT=1 algo que sería lo que esperamos.

● SODIO_SÉRICO-DEATH_EVENT

Figura 7: Comparativa con sodio sérico

No es un indicador muy importante ya que los valores se encuentran casi todos por encima o cercanos a 135 que sería lo normal. Pero sí que es cierto que los que se encuentran por debajo de ese valor en mayor porcentaje tienen como final DEATH_EVENT=1.

● SEXO-DEATH_EVENT

Figura 8: Comparativa con sexo

Observamos que participa un mayor número de hombres(sexo=1) en el estudio que de mujeres. Sin embargo, calculando el porcentaje de muertes respecto al total para ambos casos vemos que el 39% de las mujeres fallece frente al 31% de los hombres, por lo que las mujeres tienen una mayor probabilidad de morir.

● FUMADORES-DEATH_EVENT

Figura 9: Comparativa con fumadores

Vemos que hay un mayor número de participantes en el estudio no fumadores que fumadores. Y a pesar de que esperaríamos que fuese mayor el porcentaje de fallecidos fumadores que de fallecidos no fumadores podemos ver, que el porcentaje es bastante similar con un 31% de fumadores frente a un 32% de no fumadores.

Los parámetros de creatinfosfoquinasa y de las plaquetas no hemos podido analizarlos con rapidminer ya que tenían más de 50 valores diferentes y no permite pintarlos.

2.1 Matriz de correlación:

Por último, en el análisis exploratorio de los datos, la matriz de correlación nos puede ser muy útil para ver la relación que existe entre los datos de entrada.

Para ello cambiaremos la base de datos poniendo todos los atributos a tipo numérico.

Figura 10: Matriz de correlación

Un 1 indica que los dos atributos son los mismos. La diagonal en color rojo.

Si es un valor entre 0 y 1 nos indica que el grado de relación lineal entre cada par de atributos es positivo, es decir, tienden a aumentar o disminuir al mismo tiempo. Tonos anaranjados.

Si es 0, no guarda relación. Color amarillo.

Y por último, si es un valor entre -1 y 0 indica correlación negativa. Las dos variables están asociadas en sentido inverso. Tonos azulados.

Destacar algunos de estos atributos como, por ejemplo,

...

Descargar como (para miembros actualizados) txt (19 Kb) pdf (66 Kb) docx (19 Kb)
Leer 11 páginas más »
Disponible sólo en Clubensayos.com