Aprendizaje Inductivo


Anterior		Siguiente

3.1. Objetivo

Establecer los Rasgos Comunes de una Serie de Ejemplos de un Concepto Desconocido, de tal forma que la Descripción obtenida no abarque el resto de los ejemplos que no sean Casos Concretos de dicho Concepto.

La Presencia de un Ejemplo Negativo dentro del Concepto es debida a la Presencia de Ruido en el Conjunto de Datos Observados.

Suposiciones Adicionales

Los Ejemplos pueden ser Suministrados por una Fuente Externa (Aprendizaje Supervisado), o proporcionados por el propio Aprendiz de Conceptos (Aprendizajes No Supervisado)
Las Instancias pueden ser Consideradas por la Estrategia de una en una (Aprendizaje Incremental), o todas a la vez (Aprendizaje No Incremental)

3.2. Tarea

Encontrar una Hipótesis h que:

Describa los Ejemplos Positivos
Excluya los Ejemplos Negativos
Tenga Expectativas de Clasificar correctamente Futuros ejemplos

3.3. Descripción

Ejemplos presentados mediante pares (Xi, f(Xi)), siendo f(Xi) el valor de la clase. La Tarea es Encontrar la Deficinición de la Función f que debe reflejar un concepto acorde con dichos ejemplos.

Carácter Incierto
Ejemplos de Entrenamiento: Se Divide el Conjunto de Instancias de dos Subconjuntos. (2/3 -> Aprender el Modelo)
Ejemplos de Prueba: Comprobar el Porcentaje de Aciertos del Modelo de Clasificación Aprendido. (1/3 del resto)

3.4. Ruido

Errores en la Determinación de los Valores del Atributo; u Omisión de Atributos.

3.5. Procesamiento de Instancias

Simultaneamente: Aplicar Análisis Estadísticos que permiten aislar posibles Errores

Secuencialmente: Las más parecidas del proceso de Aprendizaje Humano

3.6. Bias: Criterios de Selección de Hipótesis

Encontrar una Estructura que "Clasifique bien" y que "Realice Predicciones Correctas".

Bias. Conjunto de todos los Factores que permiten Realizar y Seleccionar las Hipósis más adecuadas.

Definiendo un Conjunto de Resticciones sobre el Espacio de Hipótesis H
- Demasiado Restringido. Invalida las Hipótesis Disyuntivas
- Ruido. Ejemplos Mal Clasificados
Definiendo un Criterio de Prefencia entre las distintas Hipótesis h eÎH

3.7. Espacio de Versiones

Marco Unificado para el Aprendizaje de Conceptos. El Proceso de Aprendizaje de un Concepto tiene lugar en un Espacio H definido entre los conjuntos de Hipótesis G (elementos más Generales) y S (elementos más Especificos).

El Espacio de Versiones permite mantener toda la información Útil extraida de un Conjunto de Entrenamiento sin tener que guardar ningún ejemplo.

Definición

Criterio de Consistencia
Criterios para Escoger la Formula más Especifica (INF) y la más General (SUP) entre las Consistentes
Definición de Generalización
Conjunto de Ejemplos Positivos y Negativos

Dado el Conjunto de Entrenamiento (I) y una Teoria (T), si se emplean diferentes Criterios de Consistencia, se pueden obtener (Aprender) diferentes Versiones del Concepto G.

3.8. Árboles de Decisión

El Algoritmo de Aprendizaje es esencialmente un Proceso de Búsqueda de un Modelo de Clasificación lo mas Sencillo y Generales posibles.

Árbol de Decisión. Representación posible de los Procesos de Decisión involucradas a Tareas Inductivas de Clasificación.

Los Atributos son utilizados para Crear Particiones de Conjuntos Ejemplos
Los Nodos del Ábol corresponden a los Nombres o Identificadores de los Atributos
Las Ramas de un Nodo representan los posibles valores del Atributo Asociado al Nodo
Las Hojas son Conjuntos ya clasificados de Ejemplos

La Estrategia consiste en Seleccionar aquel atributo potencialmente más útil para cada clasificación

Coste. Longitud del Camino o Coste de cada Consulta
Bondad. Porcentaje de Acierto por Clases

Cada Elemento o Instancia toma forma de una lista de Pares (Atributo, Valor), constituyendo una Descripción Conjuntiva. Cada Instancia va acompañada de la clase a la que pertenece.

El Objetivo es construir un Ábol de Decisión que explique todas las Instancias de la manera más compacta.

Camino de Discriminación. Va de la Raíz a dicho Nodo para los Atributos involucrados.

Se propone la Binarización de los Atributos (0, 1) = (No, Si); independizando el Proceso de Número de valores de un Atributo. Normalizar la Ganancia.

ALGORITMO ID3 (lista-ejemplos, lista-atributos)

Si lista-ejemplos está vacia entonces "Regresar", sino seguir
Si todos los ejemplos en lista-ejemplos son + entonces devolver + sino seguir
Si todos los ejemplos en lista-ejemplos son - entonces devolver - sino seguir
Si lista-ejemplos está vacia entonces devolver Error sino
1. Llamar mejor al elemento a de lista-atributos que minimice merito (a)
2. Iniciar un Árbol cuya Raíz sea mejor
3. Para cada valor de Vi de mejor
  - Incluir en ejemplos-restantes los elementos de lista-ejemplos que tengan el valor Vi del atributo mejor
  - Dejar en atributos-restantes todos los elementos de lista-atributos excepto mejor
  - Devolver el valor de: ID3 (ejemplos-restantes, atributos-restantes)