Clasificación no supervisada
Clustering y mapas autoorganizativos (Kohonen)
Recuperación y organización de la información
Mapas autoorganizativos (Kohonen)
Clasificación no supervisada
Redes de neuronas de dos capas:
- Cada neurona de competición es una categoría
- Cada neurona de entrada está conectada con cada una de las células de la capa de competición (células que se distribuyen inicialmente de forma aleatoria)
- Para cada ejemplo se calcula la salida de cada célula de competición y nos quedamos con la mejor (ganadora)
Procedimiento
- Se recibe el ejemplo de entrada (n-dimensional)
Los ejemplos son representables como puntos en un espacio n-dimensional
- Se propaga por las conexiones hasta llegar a la capa de competición (competición que se realiza en base a un modelo de interacción lateral)
Los prototipos también se pueden representar en el espacio y sus coordenadas quedan determinadas por los pesos de las neuronas de la capa de competición
- Cada célula de esta capa de competición produce una salida al comparar el ejemplo con sus pesos
- Se selecciona el prototipo cuya distancia al ejemplo sea menor (célula ganadora)
- Los pesos de la célula ganadora se modifican para acercarse ligeramente al ejemplo modificando así el mapa de prototipos inicial
Vecindarios
Cuando se trata de los mapas autoorganizativos de Kohonen no sólo importa la distancia del ejemplo a los distintos prototipos existentes sino también la clase a la que pertenecen los ejemplos cercanos. Por esta razón es útil el concepto de vecindario en esta técnica.
Los vecindarios más empleados son los rectangulares o los hexagonales.
Características
- Los prototipos se desplazan según se van procesando los ejemplos (al contrario que en k-medias)
- El aprendizaje es más rápido y eficaz
- No requiere aprendizaje en el procesamiento de datos nuevos
Herramientas
En la siguiente página (no oficial) se puede descargar un conjunto de programas empleados para el aprendizaje de los mapas de Kohonen. Este conjunto de programas recibe el nombre de SOM_PAK.
Neural Networks Research Centre (Public domain program packages)
Más acerca de recuperación y acceso a la información
- Página principal del WIKI
- Evaluación de los principales buscadores web
- Sistemas de Question-Answering
- Metadatos y documentos XML/RDF para recuperación
- Lenguajes de recuperación: XML-Query, XQL y Tolog
- Lenguajes de recuperación: SeRQL y SPARQL
- Almacenamiento, consulta y razonamiento: Sesame y Jena
- Modelos de recuperación
- Motores de recuperación de documentos XML/RDF
- Procesamiento del Lenguaje Natural
- Usabilidad y accesibilidad en el posicionamiento
- Clasificación supervisada
- Clasificación no supervisada: clustering y Kohonen
- Fusión de ontologías de metadatos FCA, Onions y Prompt
- Minería de textos web