ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

AnswerTree es una herramienta de software


Enviado por   •  11 de Agosto de 2014  •  462 Palabras (2 Páginas)  •  200 Visitas

Página 1 de 2

1- INTRODUCCIÓN

AnswerTree es una herramienta de software, que reemplaza al antiguo CHAID de

S.P.S.S., para realizar clasificaciones basadas en árboles de decisión.

Los análisis de clasificación basados en árboles de decisión son técnicas de

explotación de datos (data mining) que consisten en estudiar grandes masas de

datos con el fin de descubrir patrones no triviales.

Los patrones no triviales que se estudiarán habitualmente serán los predictivos y los

explicativos.

Un árbol de decisión representa una serie de pautas basadas en ciertas variables

explicativas que se muestran según recorremos el árbol.

Ejemplo

RIESGO

Nodo 0

Categoría % n

Sin riesgo 50 .0021

Con riesgo 50 .0021

Total (100 .00)42

HORAST

Mejora=0.1605

<=11.5 >11.5

Nodo 1 Nodo 2

Categoría % n Categoría % n

Sin riesgo 31 .03 9 Sin riesgo 92 .3112

Con riesgo 68 .9720 Con riesgo 7 .69 1

Total (69 .05)29 Total (30 .95)13

CARRERA SEXO

Mejora=0.0261 Mejora=0.0023

ciencias humanidades mujer varon

Nodo 13 Nodo 14 Nodo 15 Nodo 16

Categoría % n Categoría % n Categoría % n Categoría % n

Sin riesgo 50 .00 5 Sin riesgo 21 .05 4 Sin riesgo 87 .50 7 Sin riesgo 100 .00 5

Con riesgo 50 .00 5 Con riesgo 78 .9515 Con riesgo 12 .50 1 Con riesgo 0 .00 0

Total (23 .81)10 Total (45 .24)19 Total (19 .05) 8 Total (11 .90) 5

Estos árboles se construyen mediante un algoritmo que va dividiendo los registros

de la base de datos (casos u observaciones) en nodos de forma recursiva, de

manera que con cada subdivisión las frecuencias relativas de las categorías de la

variable dependiente vayan tendiendo a 0 o a 1.

AnswerTree dispone de cuatro algoritmos para realizar árboles de clasificación:

CHAID

CHAID Exhaustivo

C&RT o CART

QUEST

Aunque AnswerTree permite la construcción de árboles de forma totalmente

automatizada, los mejores resultados se obtienen con la colaboración del usuario, al

aplicar el conocimiento que tiene de los datos, tomando decisiones racionales al

decidir si se va o no a dividir un nodo determinado.

Laboratorio de Estadística Página nº 4

...

Descargar como (para miembros actualizados) txt (2 Kb)
Leer 1 página más »
Disponible sólo en Clubensayos.com