今日arXiv最热NLP大模型论文：浙江大学：蒸一蒸，多Agent变成单一模型，效果更好

AIGC动态1年前 (2024)发布夕小瑶科技说

AIGC动态欢迎阅读

原标题：今日arXiv最热NLP大模型论文：浙江大学：蒸一蒸，多Agent变成单一模型，效果更好
关键字：模型,任务,语言,教师,文本
文章来源：夕小瑶科技说
内容字数：8924字

内容摘要：

夕小瑶科技说原创作者 | 谢年年“团结就是力量”，面对复杂多变的现实环境，multi-agent应运而生。相较于单打独斗的single-agent，multi-agent集结了多个功能各异的LLM，共同攻克难关。然而，这种协同作战的方式也带来了沉重的推理负担，限制了multi-agent在开放世界中的发展潜力。
特别是在多模态环境下，视觉、音频、文本交织在一起，如何动态调整多模态语言模型（MLMs），以适应视觉世界的纷繁复杂，成为摆在我们面前的一大挑战。
浙大团队结合额外专家模块，提出了一种多模态multi-agent训练的层次知识蒸馏方法。multi-agent在一个自组织的层次系统中协作，实现精细的思维链和高效的部署。这里的agent通过教师模型进行分层次训练，模拟动态并调整任务，也就是说仅使用一个多模态语言模型（MLM）就能实现有效合作。经过蒸馏后，STEVE-2可以在无需专家指导的情况下，通过单一模型发展出高效的体感Agent，完成精细的开放任务。
论文标题:Do We Really Need a Complex Agent System? Distill Embodied

原文链接：今日arXiv最热NLP大模型论文：浙江大学：蒸一蒸，多Agent变成单一模型，效果更好

联系作者

文章来源：夕小瑶科技说
作者微信：xixiaoyaoQAQ
作者简介：专业、有趣、深度价值导向的科技媒体。聚集30万AI工程师、研究员，覆盖500多家海内外机构投资人，互联网大厂中高管和AI公司创始人。一线作者来自清北、国内外顶级AI实验室和大厂，兼备敏锐的行业嗅觉和洞察深度。商务合作：zym5189

阅读原文