Compartir
Título
Estudio de la incidencia del conocimiento lingüístico en los sistemas de recuperación de la información para el español
Autor(es)
Director(es)
Materia
Tesis y disertaciones académicas
Universidad de Salamanca (España)
Academic Dissertations
Lingüística
Lingüística aplicada
Documentación
Lingüística computacional
Documentación automatizada
Clasificación UNESCO
5701.02 Documentación Automatizada
Fecha de publicación
2001-10-25
Editor
Universidad de Salamanca
Resumen
[ES]Hoy en día es necesario estar bien informado, por las características de la información necesitamos sistemas que trabajen con el lenguaje natural o donde el central de los términos sea mínimo.
Para este trabajo hemos creado un lenatizador mediante una máquina de estados finitos no determinista con el fin de aplicando a la recuperación de información en español. La función del lematizador es eliminar los sufijos
de manera automática y establecer su lema. A partir de los lemas se hace la indización y posterior recuperación. Para probar la eficacia del lematiador se realizan experimentos de lematización flexiva y derivativa, combinando
esto con la supresión de palabras vacías. [EN]Nowaday it is very important to be web informed, and because of the characteristic of the information we a need a system to work with natural languaje or with minimum ter control.
A stemmer was created by means of non-determnistic finite state machine to be applied to information retrievan in Spanish. The fucttions of the stemmer is to remove the suffixes and to establish the stem of the words. This is done for the indexing and subsequient retrieval of the documents. The efficiency of the stemmer has been proved by test of flexinal and derivative stemming, together with the removal of stop words.
URI
ISBN
84-7800-831-4
DOI
10.14201/gredos.83141
Colecciones