Compartir
Título
Librerías Lucene y dotLucene para recuperación de información. Estudio y desarrollo de casos prácticos
Autor(es)
Materia
Lucene
dotLucene
Information retrieval
Indexation
Digital library
Open source software
JAVA (Computer program language)
XML (Document markup language)
Materia USAL
Búsqueda documental automatizada
Software libre
Bibliotecas digitales
Recuperación de la información
Indización
JAVA (Lenguaje de programación)
XML (Lenguaje de marcas)
Fecha de publicación
2007-07-25
Editor
Universidad de Salamanca (España). Departamento de Informática y Automática
Citación
Paz Madrid Gorelov, V., Zazo Rodríguez, A.F., García Figuerola, L.C., Alonso Berrocal, J.L. (2007). Librerías Lucene y dotLucene para Recuperación de Información, estudio y desarrollo de casos prácticos (Informe Técnico DPTOIA-IT-2007-003). Salamanca: Universidad de Salamanca, Departamento de Informática y Automática
Resumen
This technical report describes two libraries for Information Retrieval: Lucene and dotLucene. Lucene is a library developed for the Java program language. DotLucene is a port for Lucene in .Net. Our purpose is to make a basic tutorial to use both libraries. So, first we describe Lucene, its class model and the most important objects for the process of information indexing and searching. Next, we study dotLucene, in this case, using two examples for the description of this library. The former finds files in a folder containing the text of the search. The later can to index fields of XML files using different criteria. In this example, some searches can be done using one or more fields of the XML files.
Descripción
En este informe técnico se describe la utilización de dos librerías para recuperación de Información. Después de una introducción a esta disciplina, se realiza un tutorial básico de utilización de la librería Lucene, bajo el lenguaje de programación Java, explicando en qué consiste, qué se puede hacer con ella, y poniendo ejemplo prácticos de su utilización. Se estudia el modelo de clases de Lucene, y se exploran los principales objetos para la indexación y búsqueda de información. Además del estudio e implementación de la librería Lucene, se describe la utilización de dotLucene, un puerto adicional de Lucene en .Net, con el que probar la versatilidad de Lucene en otras plataformas. Para ello se han elaborado y documentado dos ejemplos de búsqueda de información. En el primero se lleva a cabo una búsqueda de información en documentos almacenados en un árbol de directorios. Se pueden realizar búsquedas de información sobre cualquier fichero convertible a texto plano. El segundo va más allá y realiza la indexación, delimitación y búsqueda de información en documentos XML, permitiendo la búsqueda por campos concretos en este tipo de documentos.
URI
Colecciones
- REINA. Informes [6]