Detección temprana de insuficiencia cardiaca mediante sistemas expertos
Enviado por Diego Narrea Mori • 4 de Octubre de 2020 • Apuntes • 2.956 Palabras (12 Páginas) • 102 Visitas
Detección temprana de insuficiencia cardiaca mediante sistemas expertos
Diego Narrea
Ingeniería de Software Universidad Peruana de Ciencias Aplicadas
Lima, Perú u201611404@upc.edu.pe
Luis Mejía
Ingeniería de Software Universidad Peruana de Ciencias Aplicadas
Lima, Perú u201519053@upc.edu.pe
Alvaro Soto
Ingeniería de Software Universidad Peruana de Ciencias Aplicadas
Lima, Perú u201623543@upc.edu.pe
Resumen— La medicina es un campo muy importante para las personas, ya que permite reconocer y curar posibles enfermedades que se puede presentar en diversas ocasiones. Existen una gran cantidad de posibles enfermedades que un paciente puede padecer como relacionadas al corazón, cerebro, arterias, etc. Desde los inicios de la historia, dichas enfermedades han generado una enorme cantidad de muertes, tanto a menor escala como en pandemias o plagas, las cuales son extremadamente difíciles de controlar. Es por ello que se requiere que de una detección temprana de dichas enfermedades mediante un diagnostico oportuno que facilite sobrellevar un posible mal. Lamentablemente, no siempre es posible realizar dicho diagnóstico de forma oportuna, ya que en algunos de los casos se desconoce de los síntomas exactos. Siendo las enfermedades al corazón una de las más recurrentes, será el campo de investigación del presente artículo. En dicha labor, se analizarán algoritmos y se propondrá uno nuevo. Además, se implementará dicho algoritmo y su resultado, lo cual será una nueva posible solución que facilite la detección de este tipo de enfermedad.
Palabras clave—Sistema Experto, Enfermedades, Diagnóstico, Corazón, Diagnóstico de enfermedades del corazón.
- INTRODUCCIÓN
Actualmente, nuevos rubros como la medicina, educación, industria, etc. Están en búsqueda de un algoritmo, el cual, aplicando Inteligencia artificial, pueda generar agentes inteligentes que faciliten las necesidades o requerimientos del ser humano
En el campo de la medicina, la aplicación de dichos algoritmos es amplia, tanto en ámbitos de la investigación como en predecir posibles enfermedades complicadas de diagnosticar que una persona puede padecer. Una de las enfermedades más recurrentes en la población es relacionado al corazón, una de las causantes de la mayor cantidad de muertos en los últimos años. Lamentablemente, la detección de dicha enfermedad es complicada en la mayoría de los casos, ya que se desconoce en algunos casos los reales síntomas de algunos tipos de enfermedades. Si bien se han realizado diversos estudios con relación a este tema, aún no ha obtenido un resultado favorable, puesto que los patrones en los cuales se presentan los síntomas son variados y desfavorece que un pronóstico sea acertado.
Las siguientes secciones del presente documento están estructuradas de la siguiente manera, La Sección II proporciona el estado del arte, en el cual se mencionarán diversos algoritmos anteriormente aplicadas para diagnosticar las enfermedades del corazón. La sección III describe el aporte que se realizara en esta investigación. En la sección IV se detallará el diseño e implementación del sistema de recomendación. En la sección V se validarán los resultados obtenidos y se discuten contrastando con otras propuestas.
- ESTADO DEL ARTE
En [1] los autores proponen un sistema de detección de enfermedades cardiacas en base a una técnica de aprendizaje automático. Estas técnicas son usadas ampliamente para la extracción de información según una base de datos. En el presente caso se utilizó la técnica de bosques aleatorios, los cuales se enfocan en la combinación de árboles de decisiones binarias según varias muestras de arranque. Estas muestras de arranque son obtenidas de muestras de aprendizajes según los datos recopilados, para que posteriormente se elijan un subconjunto de variables de cada nodo aleatorio. Con la finalidad de obtener un mejor resultado se utilizó una validación cruzada, en el que el conjunto de datos se divide en se divide en un número específico de subconjuntos. Una vez se realiza los procesos de validación cruzada y ejecución del bosque aleatorio se obtienen los resultados, los cuales obtuvieron un 84.448% de precisión. Esta precisión se obtuvo con una validación cruzada de 10 veces, mientras que sin validación cruzada se obtuvo un 82.895% de precisión.
A diferencia de [1] en [2] proponen un sistema de predicción de enfermedades cardiacas con Naive Bayes y el algoritmo KNN, así como el desarrollo de un algoritmo basado en redes neuronales convolucionales. En este caso, se utilizó el conjunto de datos del repositorio UCI para la predicción de la enfermedad. En este dataset se realizaron la limpieza e imputación de datos debido a que había datos faltantes y otros no eran deseados, todo con la finalidad de obtener datos mejores estructurados. Para la predicción de la enfermedad aplica Naive Bayes y KNN algoritmo, en el que se concluyó que Naive Bayes obtenía mejores predicciones que KNN. Posteriormente se aplica el algoritmo desarrollado por los autores (CNN-UDRP) el cual convierte los datos en forma vectorial para posteriormente insertar datos restantes a 0 con la finalidad de completar datos. Una vez incrustado los valores se obtiene como salida una capa convolucional, la cual se agrupa de forma máxima en esta capa. Esta capa se conecta al clasificador de aplicación softmax, con la finalidad de realizar el proceso de clasificación. Los resultados obtenidos gracias al algoritmo planteado son de detección si un paciente presenta alto, mediano o bajo riesgo de sufrir enfermedades cardiacas con una predicción del 65%, siendo bastante inferior al sistema planteado en [1].
Al igual que [1] los autores de [3] proponen un sistema de predicción de enfermedades cardiacas mediante aprendizaje automático, pero relacionando técnicas distintas. El sistema presentado se llama bosque híbrido con modelo lineal (HRFLM), el cual usa una combinación de características de Bosques Aleatorios como en [1] pero también con método lineal. Los datos recopilados pasan por un preprocesamiento en el que los registros de pacientes con datos faltantes se eliminaron, quedando con 297 registros para el proceso. Posteriormente se hace una reducción de los atributos con la finalidad de tener un mejor control de los datos para poder pasar al proceso de clasificación. En este proceso se asigna unos clasificadores a cada conjunto de datos con la finalidad de obtener su rendimiento, esto con la finalidad de optimizar y minimizar los errores. Estos conjuntos de datos sirven como entrada para el algoritmo HRFLM en el que se identifica el espacio de características de este conjunto y se divide con el número de hojas del árbol para obtener las particiones de datos. Los conjuntos de datos con partición son tomados para obtener una clasificación global y determinar una predicción exacta con una tasa de error baja.
...