Compartir
Título
Web page retrieval by combining evidence
Autor(es)
Palabras clave
Information retrieval
Web pages retrieval
Recuperación de la información
Recuperación de páginas web
Fecha de publicación
2006
Editor
Springer Verlag (Berlin, Alemania)
Citación
García Figuerola, C. L., Alonso Berrocal, J. L., Zazo Rodríguez, A. F. y Rodríguez Vázquez de Aldana, E.(2006). Web page retrieval by combining evidence. En Peters, C., Gey, F., Gonzalo, J., Mueller, H., Jones, G., Kluck, M., Magnini, B. y de Rijke, M. (Eds.) "Accessing multilingual information repositories. 6th workshop of the Cross-Language Evaluation Forum, CLEF 2005, Vienna, Austria, 21-23 September, 2005, Revised selected papers. V. 4022 de Lecture notes in computer science" (pp. 880-887). Berlin : Springer
Resumen
The participation of the REINA Research Group in WebCLEF 2005 focused in the monolingual mixed task. Queries or topicsare of two types: named and home pages. For both, we first perform a search by thematic contents; for the same query, we do a search in several elements of information from every page (title, some meta tags, anchor text) and then we combine the results. For queries about home pages, we try to detect using a method based in some keywords and their patterns of use. After, a re-rank of the results of the thematic contents retrieval is performed, based on Page-Rank and Centrality coeficients.
Descripción
La participación del Grupo de Investigación REINA en WebCLEF 2005 se centra en la tarea monolingüe mixta. Las consultas temáticas son de dos tipos : por nombre y por páginas web de inicio. Para ambas primero se realiza una busqueda por contenidos temáticos : para la misma consulta se hace una búsqueda en varios elementos de informacion por cada página (titulo, algunas meta etiquetas, hypertexto) y despúes se combinan los resultados. Para consultas sobre páginas principales se intenta detectar usando un método basado en algunas palabras clave y sus patrones de uso. Despúes se realiza un reordenamiento (por rango) de los resultados de la recuperación de contenidos temáticos, basado en página-rango y coeficientes de centralidad
URI
Collections