Compartir
Título
Categorización automática de documentos en español: algunos resultados experimentales
Autor(es)
Materia
Clasificación documental
Recuperacion de la información
Documentary classification
Information retrieval
Fecha de publicación
2000
Editor
Universidad de Valladolid (España)
Citación
García Figuerola, L. C., Zazo Rodríguez, A. F. y Alonso Berrocal, J. l. (2000).En N. Brisaboa et al. (Eds.), "Primeras Jornadas de Bibliotecas Digitales. JBIDI'2000. 6 y 7 de Noviembre. Valladolid (España)", (pp. 149-159). Valladolid: Universidad de Valladolid.
Resumen
La categorización automática puede contemplarse como un proceso de aprendizaje, durante el cual un programa capta las características que distinguen cada categoría o clase de las demás, es decir, aquéllas que deben poseer los documentos para pertenecer a esa categoría. De otro lado, pocos experimentos se han efectuado todavía con documentos en español. Semuestran las posibilidades de elaborar vectores patrón que recojan lascaracterísticas de distintas clases o categorías de documentos, utilizandotécnicas basadas en aquéllas aplicadas en la expansión de consultas porrelevancia. Al mismo tiempo, se describe un experimento consistente en laaplicación de esas técnicas a una colección de noticias de prensa en español, para su categorización. Los resultados obtenidos son, en conjunto,homologables o incluso mejores que los obtenidos en experimentos similares; para algunas de las categorías, estos resultados han sido muy favorables.
URI
Colecciones