Repositorio Documental de la Universidad de Salamanca >
Repositorio Científico >
Departamentos >
Enseñanzas Técnicas >
Departamento Informática y Automática >
DIA. Informes del Departamento de Informática y Automática >



Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10366/21725

Vea las estadísticas del item

Título : Tesauros de asociación y similitud para la expansión automática de consultas. Algunos resultados experimentales
Autor(es) : Zazo Rodríguez, Ángel Francisco
García Figuerola, Luis Carlos
Alonso Berrocal, José Luis
Rodríguez Vázquez de Aldana, Emilio
Palabras clave : Expansión automática de consultas
Tesauros de asociación
Tesauros de similitud
Normalización de la consulta
Information retrieval
Automatic query expansion
Association thesaurus
Similarity Thesaurus
Normalization of the query
Materia USAL: Recuperación de la información
Fecha de publicación : dic-2002
Editor : Universidad de Salamanca (España). Departamento de Informática y Automática
Citación : Zazo Rodríguez, A. F., García Figuerola, L. C., Alonso Berrocal, J. L., y Rodríguez Vázquez de Aldana, E. (2002). "Tesaurus de asociación y similitud para la expansión automática de consultas. Algunos resultados experimentales. Informe técnico DPTOIA-IT-2002-007". Salamanca : Universidad de Salamanca.
Resumen : En los sistemas de recuperación de información uno de los aspectos que más condiciona los resultados es la formulación de la consulta. Ello supone seleccionar los términos que semánticamente se ajusten más a la necesidad informativa del usuario. Lamentablemente, figuras lingüísticas como la polisemia y la sinonimia hacen que esta tarea no se nada fácil. Las técnicas que intentan reducir en lo posible el problema parten generalmente de una primera consulta, y estudian cómo puede modificarse para obtener mejores resultados. Uno de los mecanismos utilizados se conoce como expansión automática de consultas. Esta expansión consiste, primero, en añadir nuevos términos a la consulta original, y segundo, calcular el peso de dichos términos en la nueva consulta. Para llevar a cabo la expansión de consultas se han planteado varios mecanismos, uno de ellos es la utilización de un tesauro construido automáticamente a partir de la colección de documentos. En este trabajo hemos experimentado con dos tipos de tesauros: de asociación y de similitud. Estos stesauros recogen las relaciones entre los términos de la colección documental, y sirven para expandir los términos originales de la consulta con aquellos más relacionados. Uno de los aspectos más importantes de tal expansión consiste en determinar el peso de los términos expandidos. En este sentido, también hemos realizado varios experimentos que muestran la dependencia entre la elección del mecanismo de pesado y los resultados, así como la influencia de la normalización de la consulta original en los mismos.
One important aspect in Information Retrieval is the formulation of the query. Lexical figures as the synonymy and polysemy cause that the same concept can be expressed with different words and the same word can appear in documents that deal with different topics. Many techniques have been used to try to reduce this problem, inter alia automatic query expansion. This technique involves two basic steps: expanding the original query with new terms, and reweighting the terms in the expanded query. Several approaches exist to carry out this task, one of the most important is the use of a thesaurus. This technical report shows the work carried out by ourresearch group about query expansion using association and similarity thesaurus, specially in aspects related to the weight of the terms added to the query.
URI : http://hdl.handle.net/10366/21725
http://hdl.handle.net/10366/21725
Aparece en las colecciones: DIA. Informes del Departamento de Informática y Automática

Ficheros en este ítem:

Fichero Descripción Tamaño Formato
DPTOIA-IT-2002-007.pdf245,21 kBAdobe PDFVisualizar/Abrir
Favoritos y Compartir

Refworks Export

Los ítems de Gredos están protegidos por una Licencia Creative Commons, con derechos reservados.