NoteLLM

AI工具11小时前更新 AI工具集
0 0 0

NoteLLM – 小红书推出的笔记推荐多模态大模型框架

NoteLLM

NoteLLM是什么

NoteLLM 是小红书推出的一个多模态大型语言模型框架,专注于笔记推荐。该框架利用生成笔记的压缩嵌入和自动生成标签类别的能力,结合大型语言模型(LLM)的深厚语义理解,运用对比学习和指令微调技术,从而显著提高笔记推荐的准确性和相关性。升级版的 NoteLLM-2 在原有基础上引入了多模态输入,通过端到端微调策略,结合视觉编码器与 LLM,成功解决了视觉信息被忽视的问题。NoteLLM-2 通过引入多模态上下文学习(mICL)和晚期融合(late fusion)机制,进一步增强了多模态表示能力,极大地提升了多模态推荐任务的性能,其框架在小红书平台上展现出强大的推荐能力,并已在实际推荐系统中得到了应用。

NoteLLM的主要功能

  • 自动生成标签和类别:为每条笔记生成相关标签和类别,提升笔记嵌入的质量。
  • 优化用户体验:通过更精准的推荐,增强用户在平台上的参与度与满意度。
  • 多模态笔记推荐:综合文本与图像信息,生成更为全面的笔记表示,提升多模态推荐的准确性与相关性。
  • 克服视觉信息忽视问题:通过多模态上下文学习(mICL)和晚期融合(late fusion)机制,增强视觉信息的表达能力。

NoteLLM的技术原理

  • 笔记压缩提示:设计特定的提示模板,将笔记内容压缩为特殊标记,同时生成相应的标签和类别。
  • 对比学习:基于用户行为数据中的共现关系,构建相关笔记对,通过对比学习来训练模型,增强笔记嵌入的语义表示。
  • 指令微调:利用指令微调技术,使 LLM 更加准确地理解任务需求,从而生成高质量的标签和类别。
  • 多模态上下文学习:将多模态内容拆分为视觉和文本两个部分,分别压缩为两个模态的压缩词,并通过对比学习平衡模态之间的注意力。
  • 晚期融合:在 LLM 输出阶段直接融合视觉信息,保留更多原始视觉数据,避免因早期融合而导致的视觉信息损失。
  • 端到端微调:结合现有的 LLM 和视觉编码器,通过端到端微调,定制高效的多模态表示模型,无需预先对齐。

NoteLLM的项目地址

NoteLLM的应用场景

  • 个性化笔记推荐:依据用户的兴趣与行为,从海量笔记中精准推荐相关内容,提升用户发现新内容的体验。
  • 冷启动笔记推荐:帮助新发布的笔记迅速获得曝光,基于内容的相似性进行推荐。
  • 标签和类别生成:自动生成与笔记内容相关的标签和类别,提高内容的可检索性,帮助用户快速找到感兴趣的内容。
  • 多模态内容推荐:处理文本与图像信息,生成更全面的笔记表示,提升多模态推荐的准确性与相关性。
  • 内容创作辅助:为创作者提供创作灵感与建议,例如关键词、标签及相关笔记推荐,助力内容创作。

常见问题

如对 NoteLLM 有任何疑问,欢迎访问我们的 GitHub 仓库或查阅相关的 arXiv 论文获取更多信息。

阅读原文
© 版权声明
Trae官网

相关文章

Trae官网

暂无评论

暂无评论...