Compartir
Título
Tesauros de asociación y similitud para la expansión automática de consultas. Algunos resultados experimentales
Autor(es)
Materia
Expansión automática de consultas
Tesauros de asociación
Tesauros de similitud
Normalización de la consulta
Information retrieval
Automatic query expansion
Association thesaurus
Similarity Thesaurus
Normalization of the query
Materia USAL
Recuperación de la información
Fecha de publicación
2002-12
Editor
Universidad de Salamanca (España). Departamento de Informática y Automática
Citación
Zazo Rodríguez, A. F., García Figuerola, L. C., Alonso Berrocal, J. L., y Rodríguez Vázquez de Aldana, E. (2002). "Tesaurus de asociación y similitud para la expansión automática de consultas. Algunos resultados experimentales. Informe técnico DPTOIA-IT-2002-007". Salamanca : Universidad de Salamanca.
Resumen
En los sistemas de recuperación de información uno de los aspectos que más condiciona los resultados es la formulación de la consulta. Ello supone seleccionar los términos que semánticamente se ajusten más a la necesidad informativa del usuario. Lamentablemente, figuras lingüísticas como la polisemia y la sinonimia hacen que esta tarea no se nada fácil. Las técnicas que intentan reducir en lo posible el problema parten generalmente de una primera consulta, y estudian cómo puede modificarse para obtener mejores resultados. Uno de los mecanismos utilizados se conoce como expansión automática de consultas. Esta expansión consiste, primero, en añadir nuevos términos a la consulta original, y segundo, calcular el peso de dichos términos en la nueva consulta. Para llevar a cabo la expansión de consultas se han planteado varios mecanismos, uno de ellos es la utilización de un tesauro construido automáticamente a partir de la colección de documentos. En este trabajo hemos experimentado con dos tipos de tesauros: de asociación y de similitud. Estos stesauros recogen las relaciones entre los términos de la colección documental, y sirven para expandir los términos originales de la consulta con aquellos más relacionados. Uno de los aspectos más importantes de tal expansión consiste en determinar el peso de los términos expandidos. En este sentido, también hemos realizado varios experimentos que muestran la dependencia entre la elección del mecanismo de pesado y los resultados, así como la influencia de la normalización de la consulta original en los mismos. One important aspect in Information Retrieval is the formulation of the query. Lexical figures as the synonymy and polysemy cause that the same concept can be expressed with different words and the same word can appear in documents that deal with different topics. Many techniques have been used to try to reduce this problem, inter alia automatic query expansion. This technique involves two basic steps: expanding the original query with new terms, and reweighting the terms in the expanded query. Several approaches exist to carry out this task, one of the most important is the use of a thesaurus. This technical report shows the work carried out by ourresearch group about query expansion using association and similarity thesaurus, specially in aspects related to the weight of the terms added to the query.
URI
Colecciones