Aprender Conceptos Conocidos
Lograr que una Reducción del tiempo requerido para utilizar el Conocimiento Disponible. El Sistema No Aprende Nuevos Conceptos.
El Conocimiento Aprendido se añade al Conocimiento Inicial en forma Disyuntiva. Para los Casos en que pueda aplicarse el Conocimiento Aprendido, éste será el utilizado, pero el resto de las situaciones se aplicará el Conocimiento de Partida.
Dos Clases de Tareas
Proceso de Búsqueda. En Espacio de Estados
Problemas de Planificación
Mejorar la Eficiencia del Sistema
El Aprendizaje tiene lugar una vez obtenido una Solución del Problema (Secuencia de Estados y de Operadores aplicados a éstos de forma que el último sea un Estado Meta)
El Aprendizaje consiste en crear un "MacroOperador": Un Operador que reuna en una sola acción todo el Proceso realizado en una Secuencia
Aprendizaje de Conocimiento de Control. Tres enfoques diferentes
Funciones de Evaluación
Valores Numericos Asociados a cada Operador
Reglas que describen Condiciones de Aplicabilidad disponibles (Creación de "Metareglas")
Encontrar una Definición "Operacional" del Concepto Objetivo (C) o Meta
Definición Inicial de C
Ejemplo (E) de C
Conocimiento Base
Conjunto de Reglas que permiten "probar" que E es un Ejemplo de C - TEORÍA DEL DOMINIO (TD)
Cualquier otra Fuente de Conocimiento Relevante del Dominio
Especificación de las Condiciones que deben cumplir los Conceptos Aprendidos - CRITERIO DE OPERACIONALIDAD (CO)
Teoría del Dominio (TD): Conjunto de Reglas que permiten probar que E es una Instancia de C
Concepto Objetivo (C): Probar que los Ejemplos presentados son realmente Instancias de dicho Concepto, para ello se utilizan las reglas TD. De las Pruebas se extraen Nuevas Descripciones más Generales que los Ejemplos, más Especificas que C y que cumplan el Criterio de Operacionalidad (TD). Si analizamos el Objetivo C como la definición de un Conjunto, los conceptos aprendidos en este aprendizaje son definiciones "Operacionales".
Ejemplo (E): Instancia Positiva del Concepto Objetivo que permite descubrir que características del problema pueden ser más relevantes en el futuro.
Construcción de una Explicación que Justifica porque el Ejemplo es una Instancia Positiva
Resolución del Problema. La Tarea es Encontrar el Concepto Objetivo ayudandose de la Teoría del Dominio y del Ejemplo. El Resultado es una Traza que contiene toda Información que se ha ido acivando en el curso de la Resolución
Anáalisis de la Traza. La Explicación es aquella parte de la Traza que contiene Información que se prevé útil
Criterio de Operacionalidad: Indica las Acciones directamente ejecutables por el Sistema
Criterio de Relevancia: Permite decidir que Información es Útil
La Información Relevante será aquella que no forme parte de un Camino Fracasado. La Información que pertenece al Camino que lleva a la Solución y Contiene sólo Predicados Operacionales.
Filtrado. Construye la Explicación Separando la Información marcada como Relevante de la que no lo es.
Generalizar la Explicación de manera que en el Futuro pueda ser Aplicada
Generalización de la Explicación. Sustituir Constantes por Variables o Estructuras de Variables de manera que la Explicación siga siendo Válida.
Regresionar. Una Fórmula F a través de una Regla R es un Mecanismo para Determinar las Condiciones necesarias y suficientes bajo las cuales puede usarse la Regla R para Inferir F.
Construcción de una Nueva Información. La Explicación se Traduce al Formato adecuado para que pueda ser utilizada.
Incorporación de Nueva Información. Hacer que las Nuevas Reglas Creadas queden disponibles de manera que puedan utilizarse para la Resolución de Nuevos Problemas.
Reformulación de la Teoría. Garantizar que la Información Aprendida es realmente más útil.
Incorporar Nuevas Definiciones o Reglas de Control a la Teoría Existente
Incorporar a la Teoría algo que quizas nunca más será útil
Las Reglas Aprendidas son más Complejas que las Iniciales (Coste)
Degradación de la Teoría
Baja Frecuencia de Aplicación
Alto Coste de Cotejar las Reglas
Bajo Beneficio
Revisión de la Teoría. Problemas que son consecuencia de la Teoría del Dominio Disponible
Teoría Incompleta: La Teoría No puede Explicar algún Ejemplo por no disponer de Toda la Información Necesaria. La Solución es Intentar Explicar al máximo el ejemplo e Identificar y Conjeturar Nuevas Reglas que complementarían la Explicación
Teoría Incorrecta: El Sistema comete algún Fallo de Predicción. Solución: Identificar la causa del Fallo y Modificar convenientemente la Teoría
Teoría Inconsistente: El Sistema llega a Predicciones Contradictorias. Puede tener su origen en Inconsistencias entre la Teoría y las Observaciones
Teoría Intratable: Para dar una Predicción se necesitan más Recursos (Computacionales) de los que dispone. Solución Usando Heurísticas que permiten Restringir el Espacio de Búsqueda
El Criterio de Operacionalidad trata de garantizar que los conceptos aprendidos permiten realmente reducir el tiempo de llevar acabo la Tarea encomendada. Supongamos que se aprenden muchas reglas, tantas que la sola gestión de las mismas, en lugar de ayudar, Ralentiza el Comportamiento. El Coste implicado en comprobar si se puede aplicar una regla concreta puede ser muy elevado.
Las Medidas de Utilidad propuestas tienen en cuenta la frecuencia de utilización de la regla aprendida y el Coste Asociado a su uso.
La Esencia de la Generalización está en acceder al Conocimiento Relevante del Dominio y No en Establecer Restricciones o Preferencias Sintacticas relacionadas con las Expresiones obtenidas, como ocurría en las Técnicas de Aprendizaje Inductivo Basado en Ejemplos
Planificador que Genera y Recuerda Planes que le permiten conseguir un Determinado Objetivo. Una vez generado el Plan, Intenta Explicar porque cumple el Objetivo.
Entradas. Estado Inicial, Estado Objetivo y Conjunto de Operadores que permiten cambiar de Estado. Se utilizan Formulas del Calculo de Predicados.
Operadores.
Precondición: Describe las Condiciones de Aplicabilidad
Lista Añadir: Contiene los Hechos que se añaden a un Estado como Consecuencia
Lista Borrar: Contiene los Hechos que dejan de ser ciertos
El Plan será convertido en un MacroOperador cuya Precondición describirá las Condiciones suficientes bajo las cuales pueden alcanzarse el Estado Objetivo desde el Estado Inicial.
Generalización Basada en Explicaciones (EBG). Este Formalismo es un intento de agrupar elementos esenciales de Sistemas ya existentes. Método Independiente del Dominio que usa Conocimiento del Dominio para guiar la Generalización.
Los Mecanismos de Resolución de Problemas y de Generalización son Independientes del Dominio mientras que las Entradas al Sistema forzosamente deben contener Información del Dominio. El Objetivo del EBG es aprender Nuevas Descripciones Operacionales.
Entradas: Concepto Objetivo, Ejemplo, Teoría del Dominio, Criterio de Operacionalidad
El Resultado es una Nueva Teoría del Dominio; es la Generalización del Ejemplo; es una Condición Suficiente para el Objetivo que ademas satisface el Criterio de Operacionalidad.
El EBG debe demostrar primero que el Ejemplo es una Instancia Positiva del Concepto Objetivo. La Traza contiene todos los Caminos intentados, y que han Fracasado; y un solo camino hacia la Solución. Explicación que debe ser Generalizada.
Metodo de Generalización. Modificación del Algoritmo de Regresión de Objetivos consistentes en usar sólo las Reglas que han servido para demostrar el ejemplo de manera que la Generalización es una condición Suficiente bajo la que una Regla R puede ser usada para Inferir la Fórmula F. Al Analizar dicha Traza obtenemos la Explicación.
Arquitectura que combina el Aprendizaje y Resolución de Problemas. La Unidad Organizativa Fundamental es el Espacio de Problemas y su Paradigma Central es la Búsqueda.
Componentes Básicos
Memoria Reglas de Producción: Contiene la Experiencia Acumulada por el Sistema en la Resolución de Problemas
Memoria de Trabajo: Contiene la Información Relacionada con el Problema que se está intentado Resolver
Gestor Memoria Trabajo: Permite Borrar Objetos de la Memoria de Trabajo
Procedimiento de Decisión: Permite Resolver Conflictos
Mecanismo de Chum King: Le Permite Aprender
La Memoria de Trabajo se compone de 3 objetos:
Pila de Contextos. Especifican la Jerarquía de Objetos Activos, Espacio de Problemas, Estados y Operadores
Objetos. Objetivos y Estados
Preferencias. Codifican el Conocimiento de Control
Metodo SubObjetivación Universal: Para conseguir un Objetivo (Conjunto de Estados Deseado) se realiza una Búsqueda en un Espacio de Problemas.
Ciclo Resolución Problemas: Busca los Operadores que pueden ser aplicables al Estado en Curso y Escoge entre ellos. Puede Trabajar en varios Espacios de Problemas.
Objetos: Objetivo, Espacio de Problemas, Estado, Operador
Resolución de Conflictos
Fase de Elaboración. Se Activan en Paralelo los Operadores Aplicables
Fase de Decisión. Se Examinan los Resultados de los Operadores aplicados en la Fase de Elaboración y se Escoge la mejor opción
Impasse. El Sistema no tiene suficiente información
De Vínculo. Varios operadores y poco Conocimiento para discriminarlos
Conflicto. Varias opciones que pueden llevar a Estados Contradictorios
Sin Cambios. Se mantiene sin cambio el valor del item
Rechazo. La Opción en curso es rechazada y no hay ninguna opción más
El EBL se realiza al Generalizar las situaciones en los que se puede usar una Preferencia determinada.
Arquitectura Integrada que intenta unificar Resolución de Problemas, Planificación y Múltiples Métodos de Aprendizaje.
El Nucleo Central es un Resolvedor de Problemas Central cuyo comportamiento está determinado por el Conocimiento del Dominio y por el Conocimiento de Control para dirigir la Búsqueda. Reducción de la Búsqueda con Reglas, Funciones de Evaluación Heurística, Planes Abstractos, Soluciones de Problemas Anáalogos (en una Librería) y MacroOperadores.
El Modulo EBL Analiza la Traza de Resolución del Problema para extraer la Información relevante a partir de la que Construirá una Explicación. A partir de esta explicación se obtendrá una Regla de Control que será simplificada y cuya Utilidad será Evaluada. En Función de la Utilidad estimada será incorporada o No al Conocimiento Existente.
Resolver un Problema en un Dominio Particular necesita la Especificación de este Dominio en forma de un Conjunto de Operadores y de Reglas de Inferencia. Operador se compone de una Precondición que determina las Condiciones bajo las que es aplicable y de una Lista de Efectos que produce su aplicación sobre el Estado en curso. La Diferencia entre los operadores y las Reglas de Inferencia estriba lo que los operadores corresponden a acciones externas que permiten pasar de un Estado a otro, mientras que las Reglas de Inferencia incrementan al Conocimiento Explicito del Estado en Curso.
Evita la Degradación
Cuatro Conceptos Objetivos Exito, Fracaso, Única Alternativa, Interferencia de Objetivos
Tres Tipos Reglas de Control Preferencia, Rechazo, Selección
Métodos Deductivos: Necesitan una Teoría del Dominio Completa y Consistente
Métodos Inductivos: Los Ejemplos de Entrada debe ser Suficientemente Representativos, Caracteristicas Relevantes de los Conceptos; las Generalizaciones No están Justificadas
Métodos EBL: No Aprenden Nuevo Conocimiento sino que Explicitan Conocimiento que ya tenian de forma Implicita.
Una Diferencia es que los Métodos Inductivos se generaliza a partir de los ejemplos usando las caracteristicas contenidas; y en los Métodos Deductivos lo que se generaliza son los caminos deductivos que llevan a la solución del problema.