Practica 5, Administración del conocimiento software Weka
Enviado por Javier Moreno • 12 de Febrero de 2021 • Apuntes • 770 Palabras (4 Páginas) • 111 Visitas
Práctica opcional
Extracción de conocimiento mediante minería de datos a través de Weka
Para complementar este tema, puedes realizar la siguiente práctica acerca de minería de datos utilziando el sosftware Weka que es open source.
Weka es un software de código abierto publicado bajo la Licencia Pública General de GNU, el cual puede descargarse desde la página web de weka http://www.cs.waikato.ac.nz/~ml/weka/ La instalación de dicho software incluye diversos archivos de datos, entre ellos weather.arff mismo que sirve de referencia en la siguiente explicación.
Desarrollo de la práctica (opcional)
La base de datos presenta la siguiente estructura:
Figura 1. Estructura de la base de datos weather.arff
La figura anterior, presenta 14 registros con 5 atributos. El atributo outlook Nominal, de tipo carácter, se asocia a la apariencia del cielo, puede adoptar uno de tres valores: sunny, overcast o rainy; el atributo temperature, de tipo numérico, se asocia con la temperatura ambiental y puede
adoptar diversos valores; el atributo humidity, de tipo numérico, se asocia con la humedad atmosférica y puede asumir un valor de una amplia escala; el atributo windy, de tipo carácter, permite identificar la presencia o ausencia de viento, por lo cual, puede asumir uno de dos valores posibles. La siguiente figura muestra la estructura de la base de datos weather.arff. La opción preprocess proporciona información (en la ventana de la parte derecha) sobre el atributo seleccionado. La figura 2 muestra la información disponible para el atributo Play. Es posible observar que este atributo toma dos instancias posibles (yes o no), y el número de instancias para cada uno de ellos (9 para yes, y 5 para no); es decir, bajo las condiciones climáticas registradas, en 9 casos fue posible jugar tenis y en 5 casos no fue posible. Una gráfica, representativa de estas frecuencias, complementa la información que se presenta en esta opción.
Figura 2. Información disponible en la opción preprocess
Al acceder a la opción Classify, es posible configurar el método de clasificación a través del botón Choose. Después de presionar este botón se accede a una estructura de directorios a partir de la cual se selecciona como método de clasificación los árboles de decisión. La figura 3 muestra la trayectoria que conduce a la selección del algoritmo J48, el cual es el algoritmo clásico de aprendizaje con base en árboles de decisión.
Figura 3. Selección del método algoritmo J48 como método de clasificación basado en árboles de decisión
...