Clasificación no supervisada

Clustering y mapas autoorganizativos (Kohonen)


Recuperación y organización de la información

Mapas autoorganizativos (Kohonen)

Clasificación no supervisada

Kohonen - red de neuronas de dos capas

Redes de neuronas de dos capas:

  • Cada neurona de competición es una categoría
  • Cada neurona de entrada está conectada con cada una de las células de la capa de competición (células que se distribuyen inicialmente de forma aleatoria)
  • Para cada ejemplo se calcula la salida de cada célula de competición y nos quedamos con la mejor (ganadora)

Procedimiento

  1. Se recibe el ejemplo de entrada (n-dimensional)
    Los ejemplos son representables como puntos en un espacio n-dimensional
    Kohonen - representacion de ejemplos en el espacio
  2. Se propaga por las conexiones hasta llegar a la capa de competición (competición que se realiza en base a un modelo de interacción lateral)
    Los prototipos también se pueden representar en el espacio y sus coordenadas quedan determinadas por los pesos de las neuronas de la capa de competición
    Kohonen - representacion de prototipos en el espacio
  3. Cada célula de esta capa de competición produce una salida al comparar el ejemplo con sus pesos
  4. Se selecciona el prototipo cuya distancia al ejemplo sea menor (célula ganadora)
    Kohonen - seleccion celula ganadora
  5. Los pesos de la célula ganadora se modifican para acercarse ligeramente al ejemplo modificando así el mapa de prototipos inicial
    Kohonen - distribucion prototipos

Vecindarios

   Cuando se trata de los mapas autoorganizativos de Kohonen no sólo importa la distancia del ejemplo a los distintos prototipos existentes sino también la clase a la que pertenecen los ejemplos cercanos. Por esta razón es útil el concepto de vecindario en esta técnica.
   Los vecindarios más empleados son los rectangulares o los hexagonales.
Kohonen - tipos de vecindarios

Características

  • Los prototipos se desplazan según se van procesando los ejemplos (al contrario que en k-medias)
  • El aprendizaje es más rápido y eficaz
  • No requiere aprendizaje en el procesamiento de datos nuevos

Herramientas

   En la siguiente página (no oficial) se puede descargar un conjunto de programas empleados para el aprendizaje de los mapas de Kohonen. Este conjunto de programas recibe el nombre de SOM_PAK.
Neural Networks Research Centre (Public domain program packages)