Anterior		Siguiente

5. Aprendizaje Deductivo (Basado en la Explicación)

Aprender Conceptos Conocidos

5.1. Objetivo

Lograr que una Reducción del tiempo requerido para utilizar el Conocimiento Disponible. El Sistema No Aprende Nuevos Conceptos.

El Conocimiento Aprendido se añade al Conocimiento Inicial en forma Disyuntiva. Para los Casos en que pueda aplicarse el Conocimiento Aprendido, éste será el utilizado, pero el resto de las situaciones se aplicará el Conocimiento de Partida.

Dos Clases de Tareas

Proceso de Búsqueda. En Espacio de Estados
Aprendizaje de Conocimiento de Control. Tres enfoques diferentes

5.2. Tarea

Encontrar una Definición "Operacional" del Concepto Objetivo (C) o Meta

Definición Inicial de C
Ejemplo (E) de C
Conocimiento Base
- Conjunto de Reglas que permiten "probar" que E es un Ejemplo de C - TEORÍA DEL DOMINIO (TD)
- Cualquier otra Fuente de Conocimiento Relevante del Dominio
Especificación de las Condiciones que deben cumplir los Conceptos Aprendidos - CRITERIO DE OPERACIONALIDAD (CO)

5.3. Descripción

Teoría del Dominio (TD): Conjunto de Reglas que permiten probar que E es una Instancia de C

Concepto Objetivo (C): Probar que los Ejemplos presentados son realmente Instancias de dicho Concepto, para ello se utilizan las reglas TD. De las Pruebas se extraen Nuevas Descripciones más Generales que los Ejemplos, más Especificas que C y que cumplan el Criterio de Operacionalidad (TD). Si analizamos el Objetivo C como la definición de un Conjunto, los conceptos aprendidos en este aprendizaje son definiciones "Operacionales".

Ejemplo (E): Instancia Positiva del Concepto Objetivo que permite descubrir que características del problema pueden ser más relevantes en el futuro.

5.4. Estrategia del Método EBL

Construcción de una Explicación que Justifica porque el Ejemplo es una Instancia Positiva
Generalizar la Explicación de manera que en el Futuro pueda ser Aplicada

5.5. Problemas del EBL

Reformulación de la Teoría. Garantizar que la Información Aprendida es realmente más útil.
Incorporar Nuevas Definiciones o Reglas de Control a la Teoría Existente
1. Incorporar a la Teoría algo que quizas nunca más será útil
2. Las Reglas Aprendidas son más Complejas que las Iniciales (Coste)
Degradación de la Teoría
Revisión de la Teoría. Problemas que son consecuencia de la Teoría del Dominio Disponible
Teoría Incompleta: La Teoría No puede Explicar algún Ejemplo por no disponer de Toda la Información Necesaria. La Solución es Intentar Explicar al máximo el ejemplo e Identificar y Conjeturar Nuevas Reglas que complementarían la Explicación
Teoría Incorrecta: El Sistema comete algún Fallo de Predicción. Solución: Identificar la causa del Fallo y Modificar convenientemente la Teoría
Teoría Inconsistente: El Sistema llega a Predicciones Contradictorias. Puede tener su origen en Inconsistencias entre la Teoría y las Observaciones
Teoría Intratable: Para dar una Predicción se necesitan más Recursos (Computacionales) de los que dispone. Solución Usando Heurísticas que permiten Restringir el Espacio de Búsqueda

Problema de Utilidad

El Criterio de Operacionalidad trata de garantizar que los conceptos aprendidos permiten realmente reducir el tiempo de llevar acabo la Tarea encomendada. Supongamos que se aprenden muchas reglas, tantas que la sola gestión de las mismas, en lugar de ayudar, Ralentiza el Comportamiento. El Coste implicado en comprobar si se puede aplicar una regla concreta puede ser muy elevado.

Las Medidas de Utilidad propuestas tienen en cuenta la frecuencia de utilización de la regla aprendida y el Coste Asociado a su uso.

Naturaleza Semántica

La Esencia de la Generalización está en acceder al Conocimiento Relevante del Dominio y No en Establecer Restricciones o Preferencias Sintacticas relacionadas con las Expresiones obtenidas, como ocurría en las Técnicas de Aprendizaje Inductivo Basado en Ejemplos

5.6. Metodos EBL

5.6.1. STRIPS

Planificador que Genera y Recuerda Planes que le permiten conseguir un Determinado Objetivo. Una vez generado el Plan, Intenta Explicar porque cumple el Objetivo.

Entradas. Estado Inicial, Estado Objetivo y Conjunto de Operadores que permiten cambiar de Estado. Se utilizan Formulas del Calculo de Predicados.

Operadores.

Precondición: Describe las Condiciones de Aplicabilidad

Lista Añadir: Contiene los Hechos que se añaden a un Estado como Consecuencia

Lista Borrar: Contiene los Hechos que dejan de ser ciertos

El Plan será convertido en un MacroOperador cuya Precondición describirá las Condiciones suficientes bajo las cuales pueden alcanzarse el Estado Objetivo desde el Estado Inicial.

5.6.2. EBG de Mitchell

Generalización Basada en Explicaciones (EBG). Este Formalismo es un intento de agrupar elementos esenciales de Sistemas ya existentes. Método Independiente del Dominio que usa Conocimiento del Dominio para guiar la Generalización.

Los Mecanismos de Resolución de Problemas y de Generalización son Independientes del Dominio mientras que las Entradas al Sistema forzosamente deben contener Información del Dominio. El Objetivo del EBG es aprender Nuevas Descripciones Operacionales.

Entradas: Concepto Objetivo, Ejemplo, Teoría del Dominio, Criterio de Operacionalidad

El Resultado es una Nueva Teoría del Dominio; es la Generalización del Ejemplo; es una Condición Suficiente para el Objetivo que ademas satisface el Criterio de Operacionalidad.

El EBG debe demostrar primero que el Ejemplo es una Instancia Positiva del Concepto Objetivo. La Traza contiene todos los Caminos intentados, y que han Fracasado; y un solo camino hacia la Solución. Explicación que debe ser Generalizada.

Metodo de Generalización. Modificación del Algoritmo de Regresión de Objetivos consistentes en usar sólo las Reglas que han servido para demostrar el ejemplo de manera que la Generalización es una condición Suficiente bajo la que una Regla R puede ser usada para Inferir la Fórmula F. Al Analizar dicha Traza obtenemos la Explicación.

5.6.3. SOAR

Arquitectura que combina el Aprendizaje y Resolución de Problemas. La Unidad Organizativa Fundamental es el Espacio de Problemas y su Paradigma Central es la Búsqueda.

Componentes Básicos
Memoria Reglas de Producción: Contiene la Experiencia Acumulada por el Sistema en la Resolución de Problemas
Memoria de Trabajo: Contiene la Información Relacionada con el Problema que se está intentado Resolver
Gestor Memoria Trabajo: Permite Borrar Objetos de la Memoria de Trabajo
Procedimiento de Decisión: Permite Resolver Conflictos
Mecanismo de Chum King: Le Permite Aprender

La Memoria de Trabajo se compone de 3 objetos:

Pila de Contextos. Especifican la Jerarquía de Objetos Activos, Espacio de Problemas, Estados y Operadores
Objetos. Objetivos y Estados
Preferencias. Codifican el Conocimiento de Control

Metodo SubObjetivación Universal: Para conseguir un Objetivo (Conjunto de Estados Deseado) se realiza una Búsqueda en un Espacio de Problemas.

Ciclo Resolución Problemas: Busca los Operadores que pueden ser aplicables al Estado en Curso y Escoge entre ellos. Puede Trabajar en varios Espacios de Problemas.

Objetos: Objetivo, Espacio de Problemas, Estado, Operador

Resolución de Conflictos

Fase de Elaboración. Se Activan en Paralelo los Operadores Aplicables
Fase de Decisión. Se Examinan los Resultados de los Operadores aplicados en la Fase de Elaboración y se Escoge la mejor opción

Impasse. El Sistema no tiene suficiente información

De Vínculo. Varios operadores y poco Conocimiento para discriminarlos
Conflicto. Varias opciones que pueden llevar a Estados Contradictorios
Sin Cambios. Se mantiene sin cambio el valor del item
Rechazo. La Opción en curso es rechazada y no hay ninguna opción más

El EBL se realiza al Generalizar las situaciones en los que se puede usar una Preferencia determinada.

5.6.4. PRODIGY

Arquitectura Integrada que intenta unificar Resolución de Problemas, Planificación y Múltiples Métodos de Aprendizaje.

El Nucleo Central es un Resolvedor de Problemas Central cuyo comportamiento está determinado por el Conocimiento del Dominio y por el Conocimiento de Control para dirigir la Búsqueda. Reducción de la Búsqueda con Reglas, Funciones de Evaluación Heurística, Planes Abstractos, Soluciones de Problemas Anáalogos (en una Librería) y MacroOperadores.

El Modulo EBL Analiza la Traza de Resolución del Problema para extraer la Información relevante a partir de la que Construirá una Explicación. A partir de esta explicación se obtendrá una Regla de Control que será simplificada y cuya Utilidad será Evaluada. En Función de la Utilidad estimada será incorporada o No al Conocimiento Existente.

Resolver un Problema en un Dominio Particular necesita la Especificación de este Dominio en forma de un Conjunto de Operadores y de Reglas de Inferencia. Operador se compone de una Precondición que determina las Condiciones bajo las que es aplicable y de una Lista de Efectos que produce su aplicación sobre el Estado en curso. La Diferencia entre los operadores y las Reglas de Inferencia estriba lo que los operadores corresponden a acciones externas que permiten pasar de un Estado a otro, mientras que las Reglas de Inferencia incrementan al Conocimiento Explicito del Estado en Curso.

Evita la Degradación

Cuatro Conceptos Objetivos Exito, Fracaso, Única Alternativa, Interferencia de Objetivos

Tres Tipos Reglas de Control Preferencia, Rechazo, Selección

5.7. Comparación con otros Métodos de Aprendizaje

Métodos Deductivos: Necesitan una Teoría del Dominio Completa y Consistente

Métodos Inductivos: Los Ejemplos de Entrada debe ser Suficientemente Representativos, Caracteristicas Relevantes de los Conceptos; las Generalizaciones No están Justificadas

Métodos EBL: No Aprenden Nuevo Conocimiento sino que Explicitan Conocimiento que ya tenian de forma Implicita.

Una Diferencia es que los Métodos Inductivos se generaliza a partir de los ejemplos usando las caracteristicas contenidas; y en los Métodos Deductivos lo que se generaliza son los caminos deductivos que llevan a la solución del problema.

Anterior	Inicio	Siguiente
Aprendizaje Abductivo (Inducción Basada en el Conocimiento del Dominio)		Aprendizaje por Analogía