Aprovechando los buscadores para la construcción, tratamiento y comparación de jerarquías de conceptos

Una de las grandes líneas de investigación en la Web Semántica es el tratamiento de la semántica débil, es decir, aquellas jerarquías de conceptos, taxonomías, etiquetas, etc. para poder aplicar tecnologías nuevas. En particular, cómo establecer relaciones entre ese tipo de ontologías débiles. Este problema se ha tratado de manera general (como concept matching, por ejemplo) como problema específicamente en el caso de los sistemas de información geográfica (véase por ejemplo este trabajo de Rodríguez y Egenhofer). Una aproximación interesante al problema de la relación entre jerarquías de conceptos es el tratamiento de la similaridad. Este es un problema muy difícil de resolver, básicamente porque los usuarios tienen una noción vaga de lo que significa esa relación. Sin embargo, la relación “similar” se usa extensiva e intensivamente en proyectos Web 2.0 como por ejemplo, para relacionar artistas o géneros en lastfm. En este sitio, la búsqueda de un tipo de artista o tipo de música siempre es enriquecida con artistas o tags similares.

¿Cuál es el problema, si todo parece que funciona bien? El problema, básicamente, es que la similaridad no subroga propiedades, no es una identidad. Por ejemplo, el grado de transitividad es muy malo (con un poco de navegación -por la relación similar a– por los tags llegas a artistas ni remotamente similares al original que buscabas). Una posible solución es recabar ayuda del todopoderoso Google, para relacionar tipos de música mediante la distancia de similaridad de Google (DSG), con las oportunas modificaciones. Véase este articulo al respecto, que pone como ejemplo precisamente la comparación de conceptos musicales.

Anuncios