El procesamiento del lenguaje natural no es el camino para obtener aplicaciones semánticas, según Peter Norvig

un montoón de letras desordenadas

Peter Norvig rebaja las espectativas sobre la búsqueda en lenguaje natural. De esta forma -no sé cuanto de corporativo hay en su opinión, pues ahora trabaja para Google- desinfla la noticia sobre el buscador Powerset sobre la Wikipedia. En cierto modo, estoy de acuerdo: si este buscador tiene éxito es porque se localiza en un repositorio de conocimiento organizado. La Wikipedia no es internet, y el proyecto DBpedia ya ha mostrado la potencialidad que tiene el tratamiento del conocimiento contenido en la Wikipedia. Sin embargo, fuera de la Wikipedia hay poca organización del conocimiento (salvo en proyectos como Freebase), lo que hace muy difícil que cualquier aproximación que use el lenguaje natural sea superior a la búsqueda actual con Google. Aunque, por otro lado, sí existen otras opciones, como el tratamiento de la búsqueda mediante el aprovechamiento de la anotación social por etiquetas o la navegación lingüística. La primera se enfrenta con la absoluta libertad de los usuarios en la etiquetación, lo que hace hace el problema muy difícil de resolver. La segunda consistiría en la navegación visual sobre la información con enlaces etiquetados mediante relaciones lingüísticas (como “sirve para”, “creado por”). Es decir, aprovechar (visualmente) RDF pero a alto nivel, donde los roles correspondieran a conexiones lingüísticas.

Anuncios