MACHINE LEARNIGN EN BIG ML
Enviado por Eugenia Choque • 17 de Julio de 2021 • Informe • 487 Palabras (2 Páginas) • 81 Visitas
MACHINE LEARNIGN EN BIG ML
Son aquellos problemas de machine Learning en que la maquina puede resolverlos de forma tal que simule al experto humano, basándose en datos y patrones. El objetivo es proporcionar reglas que nos permitirán predecir.
Los problemas de aprendizaje supervisado son básicamente la clasificación y la regresión se diferencia porque en la clasificación el campo objetivo es categórico y la regresión es numérico.
En la clasificación se usara se usara como ejemplo el estudio de pacientes que puedan tener o no diabetes, utilizando análisis, historiales clínico, enfermedades previas para así predecir si tiene o no diabetes. El objetivo es encontrar un algoritmo capaz de predecir nuevos casos.
Básicamente consisten en que, para clasificar automáticamente una nueva muestra, se tiene en cuenta la información que se pueda extraer de un conjunto de objetos disponibles divididos en clases y la decisión de una regla de clasificación o clasificador.
Los algoritmos dedicados al problema de la clasificación supervisada operan usualmente sobre la información disponible en un conjunto de muestras, las cuales poseen, por cada instancia, una etiqueta de clase correcta que fue puesta por un experto en la materia.
CLSIFICACION Y REGRESION
Es un tipo de modelo predictivo donde se utiliza un árbol estructurado para clasificar los datos
Como ejemplo podemos ver el caso de un estudio de pacientes que pueden o no tener diabetes. Usaremos un conjunto de pacientes ya diagnosticados y sus características, como sus analíticas, historia clínica y enfermedades previas, para predecir si un nuevo paciente pertenece a la clase de los que son diabéticos a la de los que no lo son.
Los árboles de decisión son un tipo de modelo predictivo donde se utiliza un grafo con estructura de árbol para la clasificación de los datos.
La mayoría son binarios, es decir, de cada nodo (o pregunta) emergen dos posibles ramas (o predicados) que se identifican con 0/1 o si/no.
Ejemplo:[pic 1]
Para poner en practica lo ques en el ejemplo se procedio a resgistrar bigml y utilizando una base de datos de pacientes con Diabetes se obtiene los siguientes resultados:
[pic 2]
Se contruyo el data set para analizar la distribucion de los resultados
Posteriormente se genero el arbol de decisones
[pic 3]
[pic 4]
La evaluación debe comprobar que los patrones estén adaptados a los datos de aprendizaje, pero también que sean lo bastante generales para predecir correctamente los nuevos casos que aparezcan.
...