DeBaTeR: un nuevo método de inteligencia artificial que aprovecha la información temporal en el filtrado colaborativo de gráficos neuronales para mejorar el rendimiento tanto de eliminación de ruido como de predicción

Los sistemas de recomendación se han aplicado ampliamente para estudiar las preferencias de los usuarios; sin embargo, enfrentan desafíos importantes para capturar con precisión las preferencias del usuario, particularmente en el contexto del filtrado colaborativo de gráficos neuronales. Si bien estos sistemas utilizan historiales de interacción entre usuarios y elementos a través de Graph Neural Networks (GNN) para extraer información latente y capturar interacciones de alto orden, la calidad de los datos recopilados plantea un obstáculo importante. Además, los ataques maliciosos que introducen interacciones falsas deterioran aún más la calidad de las recomendaciones. Este desafío se vuelve agudo en el filtrado colaborativo neuronal de gráficos, donde el mecanismo de paso de mensajes de los GNN amplifica el impacto de estas interacciones ruidosas, lo que lleva a recomendaciones desalineadas que no reflejan los intereses de los usuarios.

Los intentos existentes de abordar estos desafíos se centran principalmente en dos enfoques: sistemas de recomendación con eliminación de ruido y sistemas de recomendación con reconocimiento del tiempo. Los métodos de eliminación de ruido utilizan varias estrategias, como identificar y reducir las interacciones entre usuarios y elementos diferentes, podar muestras con pérdidas mayores durante el entrenamiento y utilizar técnicas basadas en la memoria para identificar muestras limpias. Los sistemas que tienen en cuenta el tiempo se utilizan ampliamente en recomendaciones secuenciales, pero tienen una aplicación limitada en contextos de filtrado colaborativo. La mayoría de los enfoques temporales se concentran en incorporar marcas de tiempo en modelos secuenciales o en construir gráficos elemento-elemento basados ​​en el orden temporal, pero no abordan la compleja interacción entre los patrones temporales y el ruido en las interacciones del usuario.

Investigadores de la Universidad de Illinois en Urbana-Champaign USA y Amazon USA han propuesto DeBaTeR, un enfoque novedoso para eliminar el ruido de gráficos temporales bipartitos en sistemas de recomendación. El método introduce dos estrategias distintas: DeBaTeR-A y DeBaTeR-L. La primera estrategia, DeBaTeR-A, se centra en reponderar la matriz de adyacencia utilizando una puntuación de confiabilidad derivada de incrustaciones de elementos y usuarios conscientes del tiempo, implementando mecanismos de asignación tanto suaves como duros para manejar interacciones ruidosas. La segunda estrategia, DeBaTeR-L, emplea un generador de peso que utiliza incorporaciones conscientes del tiempo para identificar y reducir el peso de interacciones potencialmente ruidosas en la función de pérdida.

Se utiliza un marco de evaluación integral para evaluar el rendimiento predictivo y las capacidades de eliminación de ruido de DeBaTeR con conjuntos de datos básicos y artificialmente ruidosos para garantizar pruebas sólidas. Para los conjuntos de datos básicos, se aplican criterios de filtrado específicos para retener solo interacciones de alta calidad (calificaciones ≥ 4 para Yelp y ≥ 4,5 para Amazon Movies and TV) de usuarios y elementos con una participación sustancial (>50 reseñas). Los conjuntos de datos se dividen utilizando una proporción de 7:3 para el entrenamiento y las pruebas, con variaciones ruidosas creadas al introducir un 20% de interacciones aleatorias en los conjuntos de entrenamiento. El marco de evaluación utiliza aspectos temporales al utilizar la marca de tiempo del conjunto de pruebas más antiguo como el tiempo de consulta para cada usuario, con resultados promediados en cuatro rondas experimentales.

Los resultados experimentales para la pregunta “¿Cómo funciona el enfoque propuesto en comparación con los métodos de filtrado colaborativo de gráficos neuronales generales y de eliminación de ruido de última generación?” demuestre el rendimiento superior de ambas variantes de DeBaTeR en múltiples conjuntos de datos y métricas. DeBaTeR-L logra puntuaciones NDCG más altas, lo que lo hace más adecuado para tareas de clasificación, mientras que DeBaTeR-A muestra mejores métricas de precisión y recuperación, lo que indica su eficacia para tareas de recuperación. Además, DeBaTeR-L demuestra una mayor solidez cuando se trata de conjuntos de datos ruidosos, superando a DeBaTeR-A en más métricas en comparación con su desempeño en conjuntos de datos básicos. Las mejoras relativas con respecto a siete métodos de referencia son significativas y confirman la eficacia de ambos enfoques propuestos.

En este artículo, los investigadores presentaron DeBaTeR, un enfoque innovador para abordar el ruido en los sistemas de recomendación mediante la generación de incrustaciones con reconocimiento del tiempo. Las estrategias duales del método: DeBaTeR-A para la reponderación de la matriz de adyacencia y DeBaTeR-L para la reponderación de la función de pérdida proporcionan soluciones flexibles para diferentes escenarios de recomendación. El éxito del marco radica en su integración de información temporal con incrustaciones de usuarios/elementos, como se muestra a través de una extensa experimentación en conjuntos de datos del mundo real. Las direcciones de investigación futuras apuntan hacia la exploración de algoritmos adicionales de filtrado colaborativo de gráficos neuronales conscientes del tiempo y la expansión de las capacidades de eliminación de ruido para incluir perfiles de usuario y atributos de elementos.


Mira el Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa.. No olvides unirte a nuestro SubReddit de más de 55.000 ml.

(SEMINARIO WEB GRATUITO sobre IA) Implementación del procesamiento inteligente de documentos con GenAI en servicios financieros y transacciones inmobiliariasDel marco a la producción


Sajjad Ansari es un estudiante de último año de IIT Kharagpur. Como entusiasta de la tecnología, profundiza en las aplicaciones prácticas de la IA centrándose en comprender el impacto de las tecnologías de IA y sus implicaciones en el mundo real. Su objetivo es articular conceptos complejos de IA de una manera clara y accesible.

🐝🐝 Evento de LinkedIn, ‘Una plataforma, posibilidades multimodales’, donde el director ejecutivo de Encord, Eric Landau, y el director de ingeniería de productos, Justin Sharps, hablarán sobre cómo están reinventando el proceso de desarrollo de datos para ayudar a los equipos a construir rápidamente modelos de IA multimodales innovadores.

Leer más
Back to top button