Clasificación no supervisada
Clustering y mapas autoorganizativos (Kohonen)
Recuperación y organización de la información
Introducción
Uno de los principales problemas a los que se enfrenta la sociedad de la información, en la actualidad, es la gestión óptima y productiva de la documentación disponible. En otras palabras, diariamente se generan grandes cantidades de datos y es imprescindible establecer técnicas que nos ayuden a localizar, lo antes posible, la información que nos resulta relevante según nuestras necesidades. En resumen, es necesaria una correcta organización de la información para que su recuperación sea lo más completa posible.
Es en este punto donde entran en juego los sistemas de resumen automático de documentos, empleados para optimizar el tratamiento (obtención, filtrado, clasificado y extracción) de la información (en cualquier idioma), a fin de poder proporcionar al usuario, de forma eficaz y eficiente, exclusivamente los datos que precisa.
Éste es un problema tradicional de Inteligencia Artificial en el ámbito del Aprendizaje Automático: la Clasificación automática.
Resumen del contenido
Las técnicas de clasificación automática se pueden agrupar inicialmente como supervisadas o no supervisadas y, aunque en esta página se va a hacer especial hincapié en las segundas, se proporciona una breve descripción de ambas.
Conocida la diferencia entre ambas técnicas es más fácil introducirnos en la descripción de los clasificadores, determinando a qué dominios se aplican en la actualidad, que parámetros lo configuran y que tipo son los más usados.
Además en esta Web se dispone de información sobre dos de los clasificadores no supervisados más conocidos y empleados en la organización (y recuperación) de la información: k-medias y los mapas auto-organizativos de Kohonen.
Por último se establece la relación entre los conocimientos teóricos listados anteriormente y la labor que realizan los buscadores para poder dar los resultados que más se ajusten a nuestras necesidades al realiza una consulta.
Más acerca de recuperación y acceso a la información
- Página principal del WIKI
- Evaluación de los principales buscadores web
- Sistemas de Question-Answering
- Metadatos y documentos XML/RDF para recuperación
- Lenguajes de recuperación: XML-Query, XQL y Tolog
- Lenguajes de recuperación: SeRQL y SPARQL
- Almacenamiento, consulta y razonamiento: Sesame y Jena
- Modelos de recuperación
- Motores de recuperación de documentos XML/RDF
- Procesamiento del Lenguaje Natural
- Usabilidad y accesibilidad en el posicionamiento
- Clasificación supervisada
- Clasificación no supervisada: clustering y Kohonen
- Fusión de ontologías de metadatos FCA, Onions y Prompt
- Minería de textos web