Modelos minería de datos
Enviado por Anibal Jose Peña Perez • 4 de Enero de 2020 • Apuntes • 467 Palabras (2 Páginas) • 106 Visitas
Análisis comparativo de los resultados de los modelos.
Teníamos 5 modelos principales que eran:
- Support Vector Machine
- Naive Bayes
- Random Forest
- Logistic Regression
- Decision Tree
Aquí tenemos la comparativa de estos 5 modelos en general
[pic 1]
Vamos a ir viendo diferentes ejemplos para cada uno de los modelos recordando que van a variar dependiendo de las propiedades que elijamos y las comparaciones entre las propiedades y atributos
Support Vector Machine
El objetivo del algoritmo de la máquina de vectores de soporte es encontrar un hiperplano en un espacio N-dimensional (N, el número de entidades) que clasifique claramente los puntos de datos.
[pic 2]
[pic 3]
Naive Bayes
Naive Bayes es un clasificador de aprendizaje automático simple, efectivo y de uso común. Es un clasificador probabilístico que realiza clasificaciones utilizando la regla de decisión Máximo A Posteriori en un entorno bayesiano. También se puede representar utilizando una red bayesiana muy simple. Los clasificadores Naive Bayes han sido especialmente populares para la clasificación de texto, y son una solución tradicional para problemas como la detección de spam.
[pic 4]
Random Forest
Esta surge para realizar la combinación de árboles predictores en la que cada árbol depende de los valores de un vector aleatorio probado independientemente y con la misma distribución para cada uno de estos. Bagging también fue propuesto por Breiman (1994), basado en la combinación de clasificadores inestables como redes neuronales o árboles declasificación (donde ligeros cambios en el conjunto de entrenamiento llevan a construir otro clasificador), la idea central de bagging es la de entrenar muchos clasificadores débiles independientes, para luego combinarlos todos en un clasificador fuerte, usando muestreo con reemplazamiento en el conjunto de datos.
[pic 5]
Logistic Regression
La regresión es un método para modelar un valor objetivo basado en predictores independientes. Este método se utiliza principalmente para pronosticar y descubrir la relación de causa y efecto entre las variables. Las técnicas de regresión difieren principalmente en función del número de variables independientes y el tipo de relación entre las variables independientes y dependientes.
[pic 6]
Decision Tree
El clasificador de árboles de decisión, divide repetitivamente el área de trabajo (parcela) en una subparte identificando líneas. (Repetidamente, porque puede haber dos regiones distantes de la misma clase divididas por otras
...