三「模」联盟，谷歌DeepMind缔造终身学习智能体！

AIGC动态2年前 (2024)发布新智元

AIGC动态欢迎阅读

原标题：三「模」联盟，谷歌DeepMind缔造终身学习智能体！
关键字：智能,任务,模型,经验,高效
文章来源：新智元
内容字数：0字

内容摘要：

新智元报道编辑：桃子
【新智元导读】打造终身学习智能体，是研究界以来一直追求的目标。最近，帝国理工联手谷歌DeepMind打造了创新联合框架扩散增强智能体（DAAG），利用LLM+VLM+DM三大模型，让AI完成迁移学习、高效探索。为了让AI实现终身学习，帝国理工、谷歌DeepMind竟动用了三大基础模型！
「大模型+视觉语言模型+扩散模型」三模并用，构建了全新框架——扩散增强智能体（DAAG）。
DAAG的诞生，就是让具身智能体进行迁移学习、高效探索。
最新框架利用了「后见之明经验增强」（Hindsight Experience Augmentation）技术，让扩散模型以时间和几何一致的方式转换视频。
让其与目标指令对齐，从而对智能体过去经验进行重新标记。
论文地址：https://arxiv.org/pdf/2407.20798
大模型在无需人类监督情况下，自主协调这一过程，使其非常适合终身学习场景。
经过一系列实验，结果表明，DAAG改进了奖励检测器的学习、过去经验的迁移以及新任务的获取。
这些都是开发高效终身学习智能体的关键能力。
‍无需人类监督，AI终身强化学习一直以来，

原文链接：三「模」联盟，谷歌DeepMind缔造终身学习智能体！