Compartir
Título
Resumen de tesis. Improving collaborative filtering music recommender systems: A focus on user characterization from behavioral and contextual factors
Otros títulos
Improving collaborative filtering music recommender systems: A focus on user characterization from behavioral and contextual factors
Mejora de los sistemas de recomendación de música de filtrado colaborativo: Un enfoque en la caracterización del usuario a partir de factores de comportamiento y contextuales
Autor(es)
Director(es)
Materia
Tesis y disertaciones académicas
Universidad de Salamanca (España)
Resumen de tesis
Thesis Abstracts
Algoritmos
Streaming
Clasificación UNESCO
1203 Ciencia de Los Ordenadores
1203.17 Informática
Fecha de publicación
2020
Resumen
[ES] La popularización de la distribución digital de contenido multimedia, conocido como streaming,
permite a cada vez más usuarios el acceso a prácticamente toda la música existente desde
cualquier lugar sin la limitación de la capacidad de almacenamiento de los dispositivos. Esa
enorme disponibilidad, así como la gran variedad de proveedores de estos servicios hace muy
difícil al usuario encontrar música que pueda encajar en sus gustos. De ahí deriva el gran interés
actual por el desarrollo de algoritmos de recomendación que ayuden al usuario a filtrar y
descubrir la música que se ajusta a sus preferencias a partir de la enorme cantidad de contenido
musical disponible en el espacio digital. La mayoría de las plataformas disponen de servicios de
búsqueda y algunas de ellas disponen de mecanismos de recomendación y ofrecen listas
personalizadas de reproducción (playlists), aunque todavía se requieren muchas mejoras.
Los métodos utilizados en los sistemas de recomendación son muy variados, aunque los basados
en filtrado colaborativo (FC) se encuentran entre los más extendidos. Las recomendaciones que
proporcionan se basan en las valoraciones (ratings) que los usuarios hacen de los ítems a
recomendar, que en el caso de los sistemas de recomendación de música son canciones o
artistas. Las recomendaciones para un usuario dado se basan en las valoraciones realizadas por
otros usuarios con gustos similares a él. Los resultados de este tipo de técnicas son bastante
buenos, sin embargo, la dificultad de obtener la evaluación explicita de los ítems por parte de
los usuarios hace que el número de valoraciones sea insuficiente, causando problemas de
dispersión (sparsity), que impiden o dificultan la aplicación de tales métodos. Por este motivo,
en algunas ocasiones se recurre a formas implícitas de obtener dicha información, las cuales son
usualmente complejas y no siempre son efectivas. Otros problemas causados por la
incorporación de nuevos usuarios o nuevos productos en el sistema son los de arranque en frío
(cold start) y primera valoración (first rater) respectivamente. A esto hay que sumar la dificultad
para ofrecer recomendaciones fiables a usuarios con gustos inusuales (gray sheep users).
Para hacer frente a los problemas anteriores se han propuesto algoritmos basados en el
contenido como alternativa a los métodos de CF. Estos métodos pueden utilizarse para
recomendar cualquier ítem haciendo uso de sus características, de manera que el usuario recibe
recomendaciones de ítems similares a otros por los que ha mostrado interés en el pasado. La
mayoría de los sistemas de recomendación actuales utilizan técnicas híbridas destinadas a
aprovechar las ventajas de ambos enfoques y evitar sus inconvenientes. Estos métodos hacen
uso de atributos de ítems y usuarios, además de información de valoraciones.
Este trabajo se centra en la caracterización del usuario con el fin de aumentar el grado de
personalización y así mejorar las recomendaciones proporcionadas por los métodos de filtrado
colaborativo. Las propuestas que se presentan, aunque pudieran hacerse extensivas a otros
dominios de aplicación, se centran en el ámbito de la música debido a que la forma de consumo
de la música difiere significativamente de la forma de consumir otros productos y, en
consecuencia, algunos aspectos relativos a las recomendaciones también son diferentes.
Los diferentes enfoques propuestos para caracterizar al usuario tienen en común el hecho de
requerir únicamente la información disponible en las plataformas de música en streaming, sin
necesidad de ningún dato adicional como puede ser información demográfica de los usuarios o
atributos de los ítems. Además del hecho de no disponer de valoraciones explícitas de los ítems
de música y tener que obtenerlos implícitamente a partir de las reproducciones de artistas o
canciones por parte de cada usuario.
La primera propuesta aborda el problema de la oveja negra mediante la caracterización del
usuario en función de la popularidad de la música que escucha, lo que está estrechamente
relacionado con la distribución de ley de potencia de la frecuencia de reproducción de los ítems.
Este enfoque es aplicable tanto para la recomendación de artistas como de canciones, y en este
último caso, las recomendaciones se pueden mejorar teniendo en cuenta la posición de las
canciones en las sesiones del usuario.
El tiempo es otro factor importante relacionado con el comportamiento y los hábitos del
usuario. La propuesta de mejora de los métodos de recomendación en relación con este factor
se aborda desde tres perspectivas centradas en el usuario: modelado tanto de la evolución de
sus preferencias, como de sus hábitos de escucha en función del tiempo, y uso del tiempo como
variable contextual para generar recomendaciones sensibles al contexto. El modelo de
evolución de preferencias está incluido en el proceso de obtención de calificaciones implícitas.
Otra forma de caracterizar al usuario es a través de su contexto social. Las plataformas de música
en streaming no disponen de mucha información de este tipo. Sin embargo, los datos
disponibles sobre relaciones de amistad y etiquetado social se pueden utilizar para este
propósito. En concreto, esta información se ha utilizado en este trabajo para modelar su grado
de influencia, a partir de las propiedades de confianza y homofilia, y su nivel de conocimiento
(expertise) respectivamente.
Aunque los métodos presentados no están diseñados específicamente para abordar el
inconveniente del arranque en frío, algunos de ellos se han probado en este escenario,
mostrando que también contribuyen a minimizar ese problema.
URI
DOI
10.14201/gredos.145311
Colecciones