AnswerTree es una herramienta de software
Enviado por mabe.salinas • 11 de Agosto de 2014 • 462 Palabras (2 Páginas) • 200 Visitas
1- INTRODUCCIÓN
AnswerTree es una herramienta de software, que reemplaza al antiguo CHAID de
S.P.S.S., para realizar clasificaciones basadas en árboles de decisión.
Los análisis de clasificación basados en árboles de decisión son técnicas de
explotación de datos (data mining) que consisten en estudiar grandes masas de
datos con el fin de descubrir patrones no triviales.
Los patrones no triviales que se estudiarán habitualmente serán los predictivos y los
explicativos.
Un árbol de decisión representa una serie de pautas basadas en ciertas variables
explicativas que se muestran según recorremos el árbol.
Ejemplo
RIESGO
Nodo 0
Categoría % n
Sin riesgo 50 .0021
Con riesgo 50 .0021
Total (100 .00)42
HORAST
Mejora=0.1605
<=11.5 >11.5
Nodo 1 Nodo 2
Categoría % n Categoría % n
Sin riesgo 31 .03 9 Sin riesgo 92 .3112
Con riesgo 68 .9720 Con riesgo 7 .69 1
Total (69 .05)29 Total (30 .95)13
CARRERA SEXO
Mejora=0.0261 Mejora=0.0023
ciencias humanidades mujer varon
Nodo 13 Nodo 14 Nodo 15 Nodo 16
Categoría % n Categoría % n Categoría % n Categoría % n
Sin riesgo 50 .00 5 Sin riesgo 21 .05 4 Sin riesgo 87 .50 7 Sin riesgo 100 .00 5
Con riesgo 50 .00 5 Con riesgo 78 .9515 Con riesgo 12 .50 1 Con riesgo 0 .00 0
Total (23 .81)10 Total (45 .24)19 Total (19 .05) 8 Total (11 .90) 5
Estos árboles se construyen mediante un algoritmo que va dividiendo los registros
de la base de datos (casos u observaciones) en nodos de forma recursiva, de
manera que con cada subdivisión las frecuencias relativas de las categorías de la
variable dependiente vayan tendiendo a 0 o a 1.
AnswerTree dispone de cuatro algoritmos para realizar árboles de clasificación:
CHAID
CHAID Exhaustivo
C&RT o CART
QUEST
Aunque AnswerTree permite la construcción de árboles de forma totalmente
automatizada, los mejores resultados se obtienen con la colaboración del usuario, al
aplicar el conocimiento que tiene de los datos, tomando decisiones racionales al
decidir si se va o no a dividir un nodo determinado.
Laboratorio de Estadística Página nº 4
...