百万token上下文窗口也杀不死向量数据库?CPU笑了

AIGC动态6个月前发布 量子位
16 0 0

百万token上下文窗口也杀不死向量数据库?CPU笑了

AIGC动态欢迎阅读

原标题:百万token上下文窗口也杀不死向量数据库?CPU笑了
关键字:腾讯,向量,英特尔,数据库,模型
文章来源:量子位
内容字数:8969字

内容摘要:


金磊 梦晨 发自 凹非寺量子位 | 公众号 QbitAI“Claude 3、Gemini 1.5,是要把RAG(检索增强生成)给搞死了吗?”
随着新晋大语言模型们的上下文窗口(Context Window)变得越发得长,业界人士针对“RAG终将消亡”观点的讨论也是愈演愈烈。
之所以如此,是因为它们二者都是为了解决大模型的幻觉问题(即那种一本正经地胡说八道),可以说是属于两种不同顶尖技术流派之间的对峙。
一方面,以Claude 3、Gemini 1.5为代表的流派,陆续支持200K和100万token的上下文窗口,用大力出奇迹的方式让大模型能够精准检索到关键信息来提供准确答案。
另一方面,RAG则是一种外挂知识库,无缝集成外部资源,为大语言模型提供了准确和最新的知识,以此来提高生成内容的质量。
诚然有很多人在体验过超长上下文窗口大模型后,觉得这种方式已经让AI在回答的准确性上做到了突破,无需再用RAG:
而且从Claude、Gemini等玩家在测评榜单的数据来看,在回答准确性上的成绩也是屡创新高。
但事实真是如此吗?不见得。
因为在此期间,与“RAG要消亡了”背道而驰的声音也是越发坚定:


原文链接:百万token上下文窗口也杀不死向量数据库?CPU笑了

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...