NoteLLM

AI工具3个月前更新 AI工具集

NoteLLM – 小红书推出的笔记推荐多模态大模型框架

NoteLLM

NoteLLM是什么

NoteLLM 是小红书推出的一个多模态大型语言模型框架，专注于笔记推荐。该框架利用生成笔记的压缩嵌入和自动生成标签类别的能力，结合大型语言模型（LLM）的深厚语义理解，运用对比学习和指令微调技术，从而显著提高笔记推荐的准确性和相关性。升级版的 NoteLLM-2 在原有基础上引入了多模态输入，通过端到端微调策略，结合视觉编码器与 LLM，成功解决了视觉信息被忽视的问题。NoteLLM-2 通过引入多模态上下文学习（mICL）和晚期融合（late fusion）机制，进一步增强了多模态表示能力，极大地提升了多模态推荐任务的性能，其框架在小红书平台上展现出强大的推荐能力，并已在实际推荐系统中得到了应用。

NoteLLM的主要功能

自动生成标签和类别：为每条笔记生成相关标签和类别，提升笔记嵌入的质量。
优化用户体验：通过更精准的推荐，增强用户在平台上的参与度与满意度。
多模态笔记推荐：综合文本与图像信息，生成更为全面的笔记表示，提升多模态推荐的准确性与相关性。
克服视觉信息忽视问题：通过多模态上下文学习（mICL）和晚期融合（late fusion）机制，增强视觉信息的表达能力。

NoteLLM的技术原理

笔记压缩提示：设计特定的提示模板，将笔记内容压缩为特殊标记，同时生成相应的标签和类别。
对比学习：基于用户行为数据中的共现关系，构建相关笔记对，通过对比学习来训练模型，增强笔记嵌入的语义表示。
指令微调：利用指令微调技术，使 LLM 更加准确地理解任务需求，从而生成高质量的标签和类别。
多模态上下文学习：将多模态内容拆分为视觉和文本两个部分，分别压缩为两个模态的压缩词，并通过对比学习平衡模态之间的注意力。
晚期融合：在 LLM 输出阶段直接融合视觉信息，保留更多原始视觉数据，避免因早期融合而导致的视觉信息损失。
端到端微调：结合现有的 LLM 和视觉编码器，通过端到端微调，定制高效的多模态表示模型，无需预先对齐。

NoteLLM的项目地址

GitHub仓库：https://github.com/Applied-Machine-Learning-Lab/NoteLLM
arXiv技术论文：
- NoteLLM：https://arxiv.org/pdf/2403.01744
- NoteLLM2：https://arxiv.org/pdf/2405.16789

NoteLLM的应用场景

个性化笔记推荐：依据用户的兴趣与行为，从海量笔记中精准推荐相关内容，提升用户发现新内容的体验。
冷启动笔记推荐：帮助新发布的笔记迅速获得曝光，基于内容的相似性进行推荐。
标签和类别生成：自动生成与笔记内容相关的标签和类别，提高内容的可检索性，帮助用户快速找到感兴趣的内容。
多模态内容推荐：处理文本与图像信息，生成更全面的笔记表示，提升多模态推荐的准确性与相关性。
内容创作辅助：为创作者提供创作灵感与建议，例如关键词、标签及相关笔记推荐，助力内容创作。

常见问题

如对 NoteLLM 有任何疑问，欢迎访问我们的 GitHub 仓库或查阅相关的 arXiv 论文获取更多信息。

# AI工具 # AI项目和框架 # 多语言支持 # 实时协作 # 智能笔记 # 自动摘要 # 语义搜索

© 版权声明

文章版权归作者所有，未经允许请勿转载。

蝉镜AI数字人

相关文章

969

点点：AI搜索助手让生活场景变得更简单聪明

1,008

Qwen2.5-Omni-3B

6

1,009

1,145

845

蝉镜AI数字人

暂无评论

暂无评论...