REINA. Ponencias / Actas

REINA. Ponencias / Actas http://hdl.handle.net/10366/4564 2026-06-14T18:43:59Z 2026-06-14T18:43:59Z Análisis y evaluación de la visibilidad de la investigación de las universidades españolas a través del estudio de sus páginas web Pinto Molina, María Alonso Berrocal, José Luis Cordón García, José Antonio García de Figuerola Paniagua, Luis Carlos García Marco, Javier Fernández Marcial, Viviana Gómez Camarero, Carmen Zazo Rodríguez, Ángel Francisco http://hdl.handle.net/10366/56151 2025-06-05T12:40:28Z 2004-01-01T00:00:00Z

El presente trabajo recoge los resultados de un proyecto de investigación desarrollado en el último año. El mismo se enmarca en el contexto social einstitucional del Espacio Europeo de Educación Superior que apuesta por unasociedad del conocimiento, marcada por el aprendizaje continuo, la transferencia de conocimientos y experiencias, y el uso intensivo de las tecnologías de la información y la comunicación, donde la transferencia de los resultados de la investigación adquiere un protagonismo fundamental. De ahí que el presente trabajo tenga como objetivos el análisis y evaluación de la difusión de la investigación de las universidades españolas a través de la WorldWide Web, con la finalidad de obtener un mapa de la visibilidad de la información sobre investigación de las mismas.La metodología aplicada en el estudio ha integrado métodos de investigacióncualitativa y cuantitativa para obtener unos indicadores de calidad sobre ladifusión de la investigación. El objeto de estudio está conformado por unamuestra seleccionada de 19 universidades españolas, elegidas en función de larepresentatividad por Comunidad Autónoma y el peso administrativo y científico de las mismas. Tras la definición de indicadores, tanto cualitativos como cuantitativos, la recogida de datos y el análisis de los mismos, el estudio ha dado como resultado un panorama del estado de la cuestión de la visibilidad de la información sobre investigación en las páginas web de las universidadesseleccionadas, y ha permitido definir unas propuestas de mejora que puedencontribuir a la excelencia de su difusión.

2004-01-01T00:00:00Z A simple approach to the Spanish-English bilingual retrieval task García de Figuerola Paniagua, Luis Carlos Alonso Berrocal, José Luis Zazo Rodríguez, Ángel Francisco Gómez Díaz, Raquel http://hdl.handle.net/10366/56171 2025-06-05T12:40:28Z 2001-01-01T00:00:00Z

This paper describes our participation in the CLEF bilingual retrieval task (formulating queries in Spanish to retrieve documents in English), using an information retrieval (IR) system based on the vector model. Our aim was to use a simple approach to solve the problem, without expecting to obtain great results, especially owing to the short time available. The queries formulated in Spanish were translated to English by a commercial machine translation system. The translations were filtered to eliminate stop words, and then the remaining terms were stemmed using a standard stemmer. Results were poorer than those obtained through monolingual retrieval with original English queries, the difference being slightly over 15%.

2001-01-01T00:00:00Z Term expansion using stemming and thesauri in Spanish Zazo Rodríguez, Ángel Francisco García de Figuerola Paniagua, Luis Carlos Alonso Berrocal, José Luis Rodríguez Vázquez de Aldana, Emilio http://hdl.handle.net/10366/56154 2025-06-05T12:40:28Z 2002-01-01T00:00:00Z

The objective of our participation this year in the Spanish monolingual task at CLEF2002 is to continue the study in term expansion. Last year we showed results in stemming. Now, our effort is centered in term expansion using thesauri. Many words that derive from the same stem have a close semantic content. However other words with very different stem origin have near semantic sense. In this case, the analysis of the word relationships in document collection can be used to construct a thesaurus of related terms. After, the thesaurus is used to expand a term with the best related terms.

2002-01-01T00:00:00Z Retrieval of bilingual Spanish-English information by means of a standard automatic translation system García de Figuerola Paniagua, Luis Carlos Alonso Berrocal, José Luis Zazo Rodríguez, Ángel Francisco Gómez Díaz, Raquel http://hdl.handle.net/10366/56165 2025-06-05T12:40:28Z 2000-01-01T00:00:00Z

This paper describes our participation in bilingual retrieval (queries in Spanish on documents in English), by means of an information retrieval system based on the vector model. The queries, formulated in Spanish, were translated into English by means of a commercial automatic translation system; the terms extracted from the resulting translations were filtered in order to get rid of empty words and then they were normalised by stemming. Results are poorer than those obtained through monolingual retrieval with the original queries in English slightly above 15%.

2000-01-01T00:00:00Z Spanish monolingual track: the impact of stemming on retrieval García de Figuerola Paniagua, Luis Carlos Gómez Díaz, Raquel Zazo Rodríguez, Ángel Francisco Alonso Berrocal, José Luis http://hdl.handle.net/10366/56149 2025-06-05T12:40:28Z 2002-01-01T00:00:00Z

Most of the thechniques used in Information Retrieval rely on the identification of terms from queries and documents, as much to carry out calculations based on the frequencies of these terms as to carry out comparisons between documents and queries. Terms coming from the same stem, either by morphological inflection or through derivation, can be presumed to have semantic proximity. The conflaction of these words to a common form can produce improvements in retrieval. The stemming mechanisms used depend directly on each language. In this paper a stemmer for Spanish and the tests conducted by applying it to the CLEF Spanish document collection are described, and the results are discussed.

2002-01-01T00:00:00Z Experiments in term expansion using thesauri in Spanish Zazo Rodríguez, Ángel Francisco García de Figuerola Paniagua, Luis Carlos Alonso Berrocal, José Luis Rodríguez Vázquez de Aldana, Emilio Gómez Díaz, Raquel http://hdl.handle.net/10366/56153 2025-06-05T12:40:28Z 2003-01-01T00:00:00Z

This paper presents some experiments carried out this year in the Spanish monolingual task at CLEF2002. The objective is to continue our research on term expansion. Last year we presented results regarding stemming. Now, our effort is centred on term expansion using thesauri. Many words that derive from the same stem have a close semantic content. However other words with very different stems also have semantically close senses. In this case, the analysis of the relationships between words in a document collection can be used to construct a thesaurus of related terms. The thesaurus can then be used to expand a term with the best related terms. This paper describes some experiments carried out to study term expansion using association and similarity thesauri.

2003-01-01T00:00:00Z REINA at the iCLEF 2004 García de Figuerola Paniagua, Luis Carlos Zazo Rodríguez, Ángel Francisco Alonso Berrocal, José Luis Rodríguez Vázquez de Aldana, Emilio http://hdl.handle.net/10366/56167 2025-06-10T08:03:14Z 2004-01-01T00:00:00Z

The Question Answering Task requires interaction with the user. Users can provide aid to the system reformulating questions, adding information to these or selecting the documents with which it must operate. This year our group has explored the effects of the interaction with the user in suggesting terms to add to the question; also, operating only with passages of documents or with complete documents. The experiments carried out are described and the results are discussed.

2004-01-01T00:00:00Z Stemming in Spanish: a first approach to its impact on information retrieval García de Figuerola Paniagua, Luis Carlos Gómez Díaz, Raquel Zazo Rodríguez, Ángel Francisco Alonso Berrocal, José Luis http://hdl.handle.net/10366/56159 2025-06-05T12:40:28Z 2001-01-01T00:00:00Z

Most models and techniques employed in Information Retireval at some time or other use frecuency countsof the terms appearing in both documents and queries. Many words that derive from the same stem have a closesemantic content. Locating stems common to several words and grouping them by replacing them with the correspondingstem can improve the working of these systems. Stemming procedures differ, however, depending onthe different languages. We describe a stemmer for Spanish and the tests carried out by applying it to Information Retrieval.

2001-01-01T00:00:00Z La cibermetría en la recuperación de información en el Web Alonso Berrocal, José Luis García de Figuerola Paniagua, Luis Carlos Zazo Rodríguez, Ángel Francisco Rodríguez Vázquez de Aldana, Emilio http://hdl.handle.net/10366/56172 2025-06-05T12:40:28Z 2002-01-01T00:00:00Z

El crecimiento exponencial del web, así como sus características dedatos distribuidos, alta volatilidad, datossin estructurar, redundantes y muy heterogéneos, han introducido nuevos problemas en los procesos de recuperación de información. Por ello es necesario abrir nuevas vías de investigación que nos permitan obtener unos buenos niveles de precisión. Los trabajos que se basan en la explotación de las características hipertextodel web están alcanzando gran notoriedad.La cibermetría está aportandomuchas opciones de trabajo con los enlaces y está ofreciendo en este momento interesantes opciones, y buena parte de las técnicas empleadas en la misma pueden ser útiles en los procesos de recuperación de información en el web.

2002-01-01T00:00:00Z REINA at the WebCLEF task: combining evidences and link analysis García de Figuerola Paniagua, Luis Carlos Alonso Berrocal, José Luis Zazo Rodríguez, Ángel Francisco Rodríguez Vázquez de Aldana, Emilio http://hdl.handle.net/10366/56150 2025-06-05T12:40:28Z 2005-01-01T00:00:00Z

The participation of the REINA Research Group in WebCLEF 2005 is focused in the monolingual mixed task. Queries or topics are of two types: named and home pages. For both, we first perform a search by thematic contents; for the same query, we do a search in several elements of information from every page (title, some meta tags, text of backlinks) and then we combine the results. For queries about home pages, we try to detect them with a method based in some keywords and their patterns of use. After, a re-rank of the results of the thematic contents retrieval is performed, based on Page-Rank and Centrality coeficients.

2005-01-01T00:00:00Z Categorización automática de documentos en español: algunos resultados experimentales García de Figuerola Paniagua, Luis Carlos Zazo Rodríguez, Ángel Francisco Alonso Berrocal, José Luis http://hdl.handle.net/10366/56147 2025-06-05T12:40:28Z 2000-01-01T00:00:00Z

La categorización automática puede contemplarse como un proceso de aprendizaje, durante el cual un programa capta las características que distinguen cada categoría o clase de las demás, es decir, aquéllas que deben poseer los documentos para pertenecer a esa categoría. De otro lado, pocos experimentos se han efectuado todavía con documentos en español. Semuestran las posibilidades de elaborar vectores patrón que recojan lascaracterísticas de distintas clases o categorías de documentos, utilizandotécnicas basadas en aquéllas aplicadas en la expansión de consultas porrelevancia. Al mismo tiempo, se describe un experimento consistente en laaplicación de esas técnicas a una colección de noticias de prensa en español, para su categorización. Los resultados obtenidos son, en conjunto,homologables o incluso mejores que los obtenidos en experimentos similares; para algunas de las categorías, estos resultados han sido muy favorables.

2000-01-01T00:00:00Z Navegación autónoma y recuperación de la información en el Web García de Figuerola Paniagua, Luis Carlos Alonso Berrocal, José Luis Zazo Rodríguez, Ángel Francisco Rodríguez Vázquez de Aldana, Emilio http://hdl.handle.net/10366/56158 2025-06-05T12:40:28Z 2002-01-01T00:00:00Z

El problema de la recuperación de información en el Web se puede plantear desde diferentes puntos de vista, con mecanismos como la realimentación por relevancia, la utilización de tesauros, el estudio de los hiperenlaces, o la aplicación de redes neuronales, entre otros. Todos estos mecanismos se aplican sobre grandes bases de datos construidas a partir de la exploración previs de sectores más o menos amplios del Web.La experiencia ha demostrado que la precisión de estos sistemas es baja y la exhaustividad está relativizada al sector explorado. Existe sin embargo otra aproximación al problema que pretende obtener resultados mucho más precisos, aunque sin perseguir altas tasas de exhaustividad, basándose en el uso de agentes inteligentes que rastreen la red según las necesidades informativas del usuario. Se indican las características de los agentes y se analizan algunas de las propiedades y habilidades deseables para aquellos agentes dedicados a la recuperación de información en el Web.

2002-01-01T00:00:00Z La recuperación de información en el Web: Retos y ¿soluciones? Alonso Berrocal, José Luis Zazo Rodríguez, Ángel Francisco García de Figuerola Paniagua, Luis Carlos Rodríguez Vázquez de Aldana, Emilio http://hdl.handle.net/10366/56157 2025-06-05T12:40:28Z 2004-01-01T00:00:00Z

Los sistemas de recuperación de información clásicos se han encontrado con problemas a la hora de ser implementados en la información del web. Las particularidades de esta información están obligando a diseñar nuevos mecanismos que permitan unos niveles de precisión mucho más elevados y que posibiliten que el usuario obtenga lo que realmente necesita. Ante losnuevos retos aparecidos, nuestro grupo de investigación REINA estátrabajando en las posibles soluciones. Se analizarán algunas de las teorías demejora de la recuperación de información y se presentará la herramientaSacarino bot como posible software que facilite esta tarea.

2004-01-01T00:00:00Z Estudio de usuarios de Datathèke. Propuestas de mejora utilizando expansión de consultas Zazo Rodríguez, Ángel Francisco Alonso Berrocal, José Luis García de Figuerola Paniagua, Luis Carlos Rodríguez Vázquez de Aldana, Emilio http://hdl.handle.net/10366/56148 2025-06-05T12:40:28Z 2004-01-01T00:00:00Z

Uno de los aspectos más importantes a la hora de evaluar un servicio deinformación real es determinar la forma en que los usuarios interactúan con elsistema. El usuario plasma su necesidad informativa en un consulta yfrecuentemente necesita modificarla hasta encontrar la información queconsidera pertinente. Uno de los mecanismos que permiten analizar elcomportamiento de los usuarios es el estudio de los archivos de registro, querecogen toda su actuación. En este trabajo se presentan los resultados delanálisis del archivo de registro de DATATHÉKE, uno de los servicios másconocidos del grupo de investigación REINA de la Universidad de Salamanca.A partir de dicho análisis se proponen técnicas de expansión de consultas,tanto manuales como automáticas, para mejorar la recuperación.

2004-01-01T00:00:00Z Web page retrieval by combining evidence García de Figuerola Paniagua, Luis Carlos Alonso Berrocal, José Luis Zazo Rodríguez, Ángel Francisco Rodríguez Vázquez de Aldana, Emilio http://hdl.handle.net/10366/56146 2025-06-05T12:40:28Z 2006-01-01T00:00:00Z

The participation of the REINA Research Group in WebCLEF 2005 focused in the monolingual mixed task. Queries or topicsare of two types: named and home pages. For both, we first perform a search by thematic contents; for the same query, we do a search in several elements of information from every page (title, some meta tags, anchor text) and then we combine the results. For queries about home pages, we try to detect using a method based in some keywords and their patterns of use. After, a re-rank of the results of the thematic contents retrieval is performed, based on Page-Rank and Centrality coeficients.

2006-01-01T00:00:00Z REINA at WebCLEF 2006 : Mixing fields to improve retrieval García de Figuerola Paniagua, Luis Carlos Alonso Berrocal, José Luis Zazo Rodríguez, Ángel Francisco Rodríguez Vázquez de Aldana, Emilio http://hdl.handle.net/10366/56155 2025-06-05T12:40:28Z 2006-01-01T00:00:00Z

This paper describes the participation of the REINA Research Group of the University of Salamanca at WebCLEF 2006. The task in that we have participated this year is the Monolingual Mixed Task in Spanish. To select web pages of the EuroGov collectionin Spanish, the wide collection was processed with a language guesser, searching for pages in Spanish. All pages in the .es domain were also pre-selected. Our focus, this year, is to test pre-retrieval ways of mixing fields or elements of information in web pages, as well as to test the retrieval capacity of these fields. Mixing terms from several sources in a only index can be achieved, in retrieval systems based on the vector spacemodel, operating on the term frequency in the document, if we use a tf x idf schemaof weigthing. BODY field is, by the way, the most powerfull from the point of viewof retrieval, but ANCHORS of backlinks add a considerable improvement. META fields, nevertheless, contribute little to the improvement in retrieval.

2006-01-01T00:00:00Z