“大学生GPT、老登Claude、黄毛Gemini”
原标题:RAG 的未来,走向繁荣、重塑还是消亡?
文章来源:AI前线
内容字数:12450字
RAG技术在企业落地的挑战与创新
本文总结了AICon全球人工智能开发与应用大会2024北京站“RAG在企业落地的难点与创新”专题圆桌交流的精彩观点,探讨了检索增强生成(RAG)技术在企业应用中的局限性、技术挑战以及未来发展趋势。
1. RAG与O1模型的结合
百度研究院商业智能实验室负责人周景博博士提出,RAG技术对于O1类推理模型的意义何在。百度灵医大模型底座技术负责人夏源博士认为,O1模型擅长推理,但缺乏真实世界知识,将RAG引入O1模型,能够补充领域知识,提升其在真实场景中的推理效果,尤其是在医疗、金融等领域。然而,如何有效标注数据,降低人工成本,是目前面临的主要挑战。
2. 数据引擎检索能力的改进
火山引擎技术专家田昕晖指出,当前数据引擎与大模型结合的潜力尚未充分挖掘。他建议进一步探索如何利用“Text to SQL”等技术,更好地利用结构化数据,提升复杂查询的处理能力。阿里云高级技术专家费跃则从数据引擎用户的角度,指出当前向量数据库在索引技术、查询链路优化等方面仍有改进空间,需要更统一的索引协议和更透明的查询链路。
3. 降低大模型幻觉的策略
Hugging Face Machine Learning Engineer尹一峰建议,可以通过多模型比对、优化模型本身、处理输入输出等方式来降低大模型幻觉。他将不同的大模型比作不同个性的人,强调根据问题的特点选择合适的模型。此外,通过机器学习技巧和数据引擎算子,可以提升模型准确度。
4. RAG开源产品的竞争力与商业模式
与会专家对RAG开源产品的竞争力及商业模式进行了探讨。阿里云高级技术专家费跃认为,开源产品适合初创公司或快速验证想法,其商业模式可能包括SaaS服务和与云厂商合作。火山引擎技术专家田昕晖强调,产品的成功取决于其壁垒和生态系统,开源框架在推动和创新方面具有重要作用。Hugging Face Machine Learning Engineer尹一峰则认为,目前RAG开源框架的应用场景较窄,可能难以像Docker那样广泛普及。
5. RAG的未来发展趋势
与会专家普遍认为,RAG技术将与Agent技术结合,形成更综合的系统。未来,RAG有可能发展成类似数据库一样的基础设施,成为大模型系统中的一个重要模块。同时,RAG也需要发展出自己的通用范式,形成类似于“Schema”和“Data Model”的概念。
总而言之,RAG技术在提升大语言模型输出质量方面具有显著作用,但其在企业落地中仍面临诸多挑战。未来,RAG技术的发展方向将是与其他技术融合,形成更强大的AI系统,并最终发展成为的基础设施。
联系作者
文章来源:AI前线
作者微信:
作者简介:面向AI爱好者、开发者和科学家,提供大模型最新资讯、AI技术分享干货、一线业界实践案例,助你全面拥抱AIGC。