Aprendizaje Inductivo
Enviado por wolverine82000 • 31 de Enero de 2012 • 1.469 Palabras (6 Páginas) • 945 Visitas
Aprendizaje Inductivo
Métodos de Aprendizaje Empírico cuya generalización se fundamenta en Aplicar Conocimiento Independiente del Dominio de Aplicación.
Creación de Sistemas Autónomos con muy poco Conocimiento Inicial que fueran capaces de Aprender sobre una gran Diversidad de Cuestiones.
Objetivo
Establecer los Rasgos Comunes de una Serie de Ejemplos de un Concepto Desconocido, de tal forma que la Descripción obtenida no abarque el resto de los ejemplos que no sean Casos Concretos de dicho Concepto.
La Presencia de un Ejemplo Negativo dentro del Concepto es debida a la Presencia de Ruido en el Conjunto de Datos Observados.
Suposiciones Adicionales
1. Los Ejemplos pueden ser Suministrados por una Fuente Externa (Aprendizaje Supervisado), o proporcionados por el propio Aprendiz de Conceptos (Aprendizajes No Supervisado)
2. Las Instancias pueden ser Consideradas por la Estrategia de una en una (Aprendizaje Incremental), o todas a la vez (Aprendizaje No Incremental)
Tarea
Encontrar una Hipótesis h que:
• Describa los Ejemplos Positivos
• Excluya los Ejemplos Negativos
• Tenga Expectativas de Clasificar correctamente Futuros ejemplos
Descripción
Ejemplos presentados mediante pares (Xi, f(Xi)), siendo f(Xi) el valor de la clase. La Tarea es Encontrar la Deficinición de la Función f que debe reflejar un concepto acorde con dichos ejemplos.
Carácter Incierto
Ejemplos de Entrenamiento: Se Divide el Conjunto de Instancias de dos Subconjuntos. (2/3 -> Aprender el Modelo)
Ejemplos de Prueba: Comprobar el Porcentaje de Aciertos del Modelo de Clasificación Aprendido. (1/3 del resto)
Ruido
Errores en la Determinación de los Valores del Atributo; u Omisión de Atributos.
Procesamiento de Instancias
Simultaneamente: Aplicar Análisis Estadísticos que permiten aislar posibles Errores
Secuencialmente: Las más parecidas del proceso de Aprendizaje Humano
Vías: Criterios de Selección de Hipótesis
Encontrar una Estructura que "Clasifique bien" y que "Realice Predicciones Correctas".
Vías. Conjunto de todos los Factores que permiten Realizar y Seleccionar las Hipótesis más adecuadas.
• Definiendo un Conjunto de Restricciones sobre el Espacio de Hipótesis H
o Demasiado Restringido. Invalida las Hipótesis Disyuntivas
o Ruido. Ejemplos Mal Clasificados
• Definiendo un Criterio de Prefencia entre las distintas Hipótesis h eÎH
o Se define un valor para cada hipótesis
o Ordenamiento en el espacio de hipótesis
o Se prefieren las hipótesis más generales sobre las más concretas
o Tendencia a elegir las hipótesis que mejor se ajustan a la clasificación
o Ruido. Ejemplos mal clasificados. Casos Aislados
Espacio de Versiones
Marco Unificado para el Aprendizaje de Conceptos. El Proceso de Aprendizaje de un Concepto tiene lugar en un Espacio H definido entre los conjuntos de Hipótesis G (elementos más Generales) y S (elementos más Específicos).
El Espacio de Versiones permite mantener toda la información Útil extraída de un Conjunto de Entrenamiento sin tener que guardar ningún ejemplo.
Definición
1. Criterio de Consistencia
2. Criterios para Escoger la Formula más Especifica (INF) y la más General (SUP) entre las Consistentes
3. Definición de Generalización
4. Conjunto de Ejemplos Positivos y Negativos
Dado el Conjunto de Entrenamiento (I) y una Teoría (T), si se emplean diferentes Criterios de Consistencia, se pueden obtener (Aprender) diferentes Versiones del Concepto G.
Árboles de Decisión
El Algoritmo de Aprendizaje es esencialmente un Proceso de Búsqueda de un Modelo de Clasificación lo más Sencillo y Generales posibles.
Árbol de Decisión. Representación posible de los Procesos de Decisión involucradas a Tareas Inductivas de Clasificación.
• Los Atributos son utilizados para Crear Particiones de Conjuntos Ejemplos
• Los Nodos del Árbol corresponden a los Nombres o Identificadores de los Atributos
• Las Ramas de un Nodo representan los posibles valores del Atributo Asociado al Nodo
• Las Hojas son Conjuntos ya clasificados de Ejemplos
La Estrategia consiste en Seleccionar aquel atributo potencialmente más útil para cada clasificación
1. Coste. Longitud del Camino o Coste de cada Consulta
2. Bondad. Porcentaje de Acierto por Clases
Cada Elemento o Instancia toma forma de una lista de Pares (Atributo, Valor), constituyendo una Descripción Conjuntiva. Cada Instancia va acompañada de la clase a la que pertenece.
El Objetivo es construir un Árbol de Decisión que explique todas las Instancias de la manera más compacta.
Camino de Discriminación. Va de la Raíz a dicho Nodo para los Atributos involucrados.
Se propone la Binarización de los Atributos (0, 1) = (No, Si); independizando el Proceso de Número de valores de un Atributo. Normalizar la Ganancia.
ALGORITMO ID3 (lista-ejemplos, lista-atributos)
1. Si lista-ejemplos está vacía entonces "Regresar", sino seguir
2. Si todos los ejemplos en lista-ejemplos son + entonces devolver + sino seguir
3. Si todos los ejemplos en lista-ejemplos son - entonces devolver - sino seguir
4. Si lista-ejemplos está vacía entonces devolver Error sino
i. Llamar mejor al elemento a de lista-atributos que minimice merito (a)
ii. Iniciar un Árbol cuya Raíz sea mejor
...