MACHINE LEARNIGN EN BIG ML
Eugenia ChoqueInforme17 de Julio de 2021
487 Palabras (2 Páginas)96 Visitas
MACHINE LEARNIGN EN BIG ML
Son aquellos problemas de machine Learning en que la maquina puede resolverlos de forma tal que simule al experto humano, basándose en datos y patrones. El objetivo es proporcionar reglas que nos permitirán predecir.
Los problemas de aprendizaje supervisado son básicamente la clasificación y la regresión se diferencia porque en la clasificación el campo objetivo es categórico y la regresión es numérico.
En la clasificación se usara se usara como ejemplo el estudio de pacientes que puedan tener o no diabetes, utilizando análisis, historiales clínico, enfermedades previas para así predecir si tiene o no diabetes. El objetivo es encontrar un algoritmo capaz de predecir nuevos casos.
Básicamente consisten en que, para clasificar automáticamente una nueva muestra, se tiene en cuenta la información que se pueda extraer de un conjunto de objetos disponibles divididos en clases y la decisión de una regla de clasificación o clasificador.
Los algoritmos dedicados al problema de la clasificación supervisada operan usualmente sobre la información disponible en un conjunto de muestras, las cuales poseen, por cada instancia, una etiqueta de clase correcta que fue puesta por un experto en la materia.
CLSIFICACION Y REGRESION
Es un tipo de modelo predictivo donde se utiliza un árbol estructurado para clasificar los datos
Como ejemplo podemos ver el caso de un estudio de pacientes que pueden o no tener diabetes. Usaremos un conjunto de pacientes ya diagnosticados y sus características, como sus analíticas, historia clínica y enfermedades previas, para predecir si un nuevo paciente pertenece a la clase de los que son diabéticos a la de los que no lo son.
Los árboles de decisión son un tipo de modelo predictivo donde se utiliza un grafo con estructura de árbol para la clasificación de los datos.
La mayoría son binarios, es decir, de cada nodo (o pregunta) emergen dos posibles ramas (o predicados) que se identifican con 0/1 o si/no.
Ejemplo:[pic 1]
Para poner en practica lo ques en el ejemplo se procedio a resgistrar bigml y utilizando una base de datos de pacientes con Diabetes se obtiene los siguientes resultados:
[pic 2]
Se contruyo el data set para analizar la distribucion de los resultados
Posteriormente se genero el arbol de decisones
[pic 3]
[pic 4]
La evaluación debe comprobar que los patrones estén adaptados a los datos de aprendizaje, pero también que sean lo bastante generales para predecir correctamente los nuevos casos que aparezcan.
La idea sobre cómo evaluar un modelo es comparar los valores reales de las instancias en que se conoce el campo objetivo con los valores que predice el modelo para esas mismas instancias. Si ambos coinciden, el modelo estará acertando la predicción y si no habrá cometido un error. Cuantos más aciertos y menos errores, lógicamente, mejor será el modelo.
Si evaluamos un modelo con los mismos datos que usamos en su entrenamiento, lo que obtendremos es un indicador de cómo de bien se han adaptado sus reglas a dichos casos.
...