dedecms 股票网站模板,装修网名,wordpress 数据库 导入,做网站编辑好还是美工好【电商搜索】CRM: 具有可控条件的检索模型 目录 文章目录 【电商搜索】CRM: 具有可控条件的检索模型目录文章信息摘要研究背景问题与挑战如何解决核心创新点算法模型实验效果#xff08;包含重要数据与结论#xff09;相关工作后续优化方向 后记 https://arxiv.org/pdf/2412.…【电商搜索】CRM: 具有可控条件的检索模型 目录 文章目录 【电商搜索】CRM: 具有可控条件的检索模型目录文章信息摘要研究背景问题与挑战如何解决核心创新点算法模型实验效果包含重要数据与结论相关工作后续优化方向 后记 https://arxiv.org/pdf/2412.13844
文章信息 CRM: 具有可控条件的检索模型 https://arxiv.org/pdf/2412.13844
摘要
本文提出了一种新型的检索模型——可控检索模型CRM旨在通过将回归信息作为条件特征整合到双塔检索范式中增强检索阶段与排名阶段之间的一致性并提升检索模型的能力。通过实际的A/B测试验证了CRM的有效性并展示了其在快手短视频推荐系统中的成功部署该系统服务于超过4亿用户。
研究背景
推荐系统RecSys旨在连接用户与相关项目同时满足平台的业务目标。典型的工业推荐系统分为两个主要阶段检索和排名。检索阶段的目标是在数百万项目中搜索出符合用户兴趣的数百个候选项排名阶段的目标是基于每个候选项的多个目标估计来选择最佳的十几个项目。与排名模型相比检索模型在推理过程中缺乏候选项信息因此通常只通过分类目标例如点击率进行训练未能整合回归目标例如预期观看时间这限制了检索的有效性。
问题与挑战
如何在检索模型中引入回归目标是一个挑战因为回归目标例如预期观看时间需要知道相应的项目才能确定。这种现象导致了检索和排名阶段之间的一致性问题并限制了推荐系统链的性能。
如何解决
本文提出的CRM模型通过将回归信息作为额外的条件来指导模型使得同时利用分类和回归信号成为可能。具体来说在训练期间将回归条件作为特征纳入用户塔中以生成定向的用户表示。在在线推理期间策略性地设置条件以指导检索过程以符合我们的平台目标。
核心创新点
提出了一种新的设计检索模型的范式通过将回归信息作为条件增强了检索和排名阶段之间的一致性为推荐系统的进步提供了启示。引入了两种简单但有效的方法来实现CRM一种涉及改进双塔架构另一种涉及序列建模为其他采用CRM的人提供了参考。在快手最大的短视频推荐场景中验证了选择条件的新而有效的策略。
算法模型
CRM模型有两种实现方式基于DNN的双塔范式和基于Transformer的范式。基于DNN的模型通过直接输入观察到的下一个视频的观看时间作为条件到用户塔中允许模型学习观看时间和目标视频的联合分布。基于Transformer的模型则利用序列建模的优势将用户的交互序列形成RL强化学习序列风格以优化CRM模型。
实验效果包含重要数据与结论
在线实验在快手的短视频推荐场景中进行该场景包括超过4亿用户和每天500亿日志。实验结果表明CRM模型在多个关键指标上取得了改进例如视频观看时间、总应用使用时间和用户互动等。此外CRM在平均每次视频观看时间的关键指标上表现最佳显著优于所有其他检索模型。
相关工作
本文回顾了双塔检索工作流程和基于RL的决策变换器序列建模。双塔检索工作流程旨在利用用户/项目特征来模拟用户偏好和项目属性以预测用户可能与之交互的下一个视频。决策变换器DT是序列建模的先驱工作旨在根据过去的奖励和状态序列直接进行动作决策。
后续优化方向
未来的工作将探索更多可以作为条件的目标更有效的条件指定策略并将这种方法扩展到推荐系统以外的领域。 后记
如果您对我的博客内容感兴趣欢迎三连击 ( 点赞、收藏和关注 和留下您的评论我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型深度学习和计算机视觉相关方向)最新学术论文及工程实践方面的内容分享助力您更快更准更系统地了解 AI前沿技术。