Clasificación no supervisada

Clustering y mapas autoorganizativos (Kohonen)


Recuperación y organización de la información

K-medias

Clasificación por vecindad no supervisada

   Parte de patrones (observaciones) sin etiquetar y un número de prototipos definido (por el diseñador del clasificador).

  • El espacio de entrada se divide en k clases y k prototipos
  • Mueve los prototipos una vez ha realizado el aprendizaje con todas las observaciones

Entrenamiento

   El objetivo de este algoritmo es intentar situar los prototipos de forma tal que aquellos patrones cercanos (distancia euclídea) sean similares entre sí.

  • Minimizar distancia entre patrón y prototipo
    Formula distancia euclidea
  • Calcular si el patrón pertenece o no a un prototipo (1 si pertenece y 0 en caso contrario)
    Formula de pertenencia de un patron a un prototipo
  • Desplazamiento de los prototipos al centro formado por los patrones que representan

Validación

   Ante un nuevo dato el sistema simplemente lo comparará con los prototipos y lo clasificará según la clase definida para el más cercano.


Entrenamiento potencialmente lento y clasificación rápida