Análisis Comparativo
Enviado por kamilon • 8 de Junio de 2013 • 591 Palabras (3 Páginas) • 254 Visitas
Reglas de asociación contra árboles de decisión
Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la minería de datos. Dada una base de datos se elaboran diagramas de construcciones lógicas, similares a los sistemas de predicción basados en reglas, los cuales sirven para representar y categorizar una serie de condiciones que ocurren de forma sucesiva, para la resolución de un problema.
Estos fueron presentados en 1983 por J. R. Quinlan, en la actualidad existen variaciones de estos algoritmos, tales como ID3, ASSISTANT y C4.5. La idea básica, es distinguir características de un conjunto de entrenamiento, siendo en esencia una aplicación del método de divide y vencerás.
Los árboles de decisión son una excelente ayuda para la elección de diferentes cursos de acción, estos proveen una estructura sumamente efectiva dentro de la cual estimar cuales son las opciones e investigar las posibles consecuencias de seleccionar cada una de ellas. También ayudan a construir una imagen balanceada de los riesgos y recompensas asociados con cada posible curso de acción. Los árboles de decisión proveen un método efectivo para la toma de decisiones debido a que:
• Plantean el problema para que todas las opciones sean analizadas.
• Permiten analizar totalmente las posibles consecuencias de tomar una decisión.
• Entregan un esquema para cuantificar el costo de un resultado y la probabilidad de que suceda.
• Ayudan a realizar las mejores decisiones sobre la base de la información existente.
El aprendizaje de árboles de decisión es un método muy simple, que ha sido ampliamente utilizado y con gran éxito en numerosas tareas de aprendizaje inductivo. Es un método de aproximación de funciones robusto a la presencia de datos erróneos y es capaz de aprender expresiones disyuntivas. Existe toda una familia de algoritmos de aprendizaje de árboles de decisión que incluye a algoritmos muy conocidos como ID3, ASSISTANT y C4.5. Esta familia de algoritmos, referenciada a veces como TDIDT (Top-Down Induction of Decision Trees) se caracteriza por buscar en un espacio de hipótesis completamente expresivo que evita las dificultades de los espacios de hipótesis restringidos. Su sesgo inductivo es un sesgo de preferencia por árboles pequeños sobre árboles grandes.
En los algoritmos TDIDT, la función aprendida es representada mediante un árbol de decisión. Estos árboles pueden ser convertidos en conjuntos de reglas if − then si se desea obtener una mejor legibilidad. En la figura 2.1 se muestra un árbol de decisión típico, para el concepto de Jugar Tenis. Este árbol de decisión clasifica días de la semana de acuerdo a si son adecuados para jugar tenis o no.
Cada nodo interno en el árbol corresponde a un test del valor de algún atributo (o propiedad) de la instancia a clasificar, y las ramas que descienden de este nodo
...