OneRec – 快手推出的端到端生成式推荐系统
OneRec 是快手推出的一款革新性的端到端生成式推荐系统,它采用编码器-解码器架构和稀疏混合专家(MoE)技术,实现高效的计算性能,并能生成上下文连贯的推荐结果。通过会话式生成方法和迭代偏好对齐,OneRec 致力于提升推荐质量,并在快手平台上取得了显著的实际效果。
### 什么是 OneRec?
OneRec 是快手公司研发的下一代端到端生成式推荐系统。 摒弃了传统的级联推荐模式,OneRec 采用先进的编码器-解码器架构, 结合稀疏 Mixture-of-Experts (MoE) 技术,在保证高效计算的同时,能够生成更具连贯性的推荐结果。它通过会话式生成方法,并结合迭代偏好对齐模块与直接偏好优化(DPO),旨在全面提升推荐的质量。
### OneRec 的核心功能是什么?
* **端到端生成式架构:** OneRec 采用编码器-解码器架构, 将推荐问题转化为序列生成任务。 编码器负责整合用户的历史行为序列, 解码器则通过稀疏混合专家(MoE)架构逐步生成用户可能感兴趣的视频,实现对用户兴趣的深度理解。
* **会话式生成方法:** 区别于逐点预测的传统方式,OneRec 采用会话式生成方法,一次性生成整个推荐列表,从而更好地捕捉用户当前的上下文信息。
* **显著的实验效果:** 在快手平台的 A/B 测试中,OneRec 实现了1.6% 的观看时长提升,显著优于传统推荐方法。
### OneRec 的技术亮点有哪些?
* **编码器-解码器架构:** OneRec 基于 Encoder-Decoder 架构,将推荐问题转化为一个序列生成任务。编码器将用户的历史行为序列压缩成兴趣向量,解码器则利用稀疏混合专家(MoE)架构生成用户可能感兴趣的视频,实现对用户兴趣的精准捕捉和连贯推荐。
* **多模态分词方案:** OneRec 创新性地采用了协同感知的多模态分词方案,融合了视频的标题、标签、语音转文字、图像识别等多维信息,转化为分层的语义 ID,从而更精确地建模用户兴趣。
* **强化学习偏好对齐:** OneRec 引入了基于奖励机制的偏好对齐方法,通过强化学习来增强模型的效果。模型利用偏好奖励、格式奖励和业务奖励构建综合奖励系统,优化生成结果,从而更好地捕捉用户的细粒度偏好,提升推荐的精准度。
* **卓越的性能优化:** OneRec 通过架构重构,显著压缩了关键算子的数量,并利用稀疏 MoE 架构扩展了模型容量,大大提高了计算效率。 此外,通过训练和推理优化,实现了更高的模型浮点运算利用率(MFU),从而大幅提升了算力效率。
### OneRec 的应用场景有哪些?
* **短视频推荐:** OneRec 在快手的短视频推荐主场景中表现出色,承担了约 25% 的请求(QPS)。 凭借其生成式架构和强化学习偏好对齐技术,OneRec 在用户停留时长、点赞、关注、评论等交互指标上均取得了显著提升。
* **本地生活服务:** OneRec 在快手的本地生活服务场景中也取得了显著成效。 AB 测试结果显示,其推动了交易总额(GMV)增长 21.01%,订单量提升 17.89%,购买用户数增长 18.58%,新客获取效率提升了 23.02%。
* **直播内容匹配:** OneRec 被应用于直播内容匹配,通过动态生成推荐序列,能更好地匹配用户的实时兴趣,提升用户在直播场景中的参与度和互动率。
* **广告投放:** 在广告投放领域,OneRec 的生成式架构能根据用户的兴趣和行为动态生成广告推荐,提高广告的精准度和转化率。
### 常见问题解答
* **OneRec 与传统推荐系统的区别是什么?** OneRec 采用端到端生成式架构,而传统推荐系统通常是级联架构。 OneRec 通过会话式生成方法,生成上下文连贯的推荐列表,更注重用户当前的兴趣。
* **OneRec 如何提升推荐质量?** OneRec 通过编码器-解码器架构、会话式生成方法、多模态分词、强化学习偏好对齐等技术,全面提升推荐的准确性、相关性和用户体验。
* **OneRec 的未来发展方向是什么?** OneRec 将持续优化模型架构和算法,探索更高效的推荐策略,并拓展在更多应用场景中的应用,为用户带来更好的体验。