三「模」联盟,谷歌DeepMind缔造终身学习智能体!

AIGC动态3个月前发布 新智元
8 0 0

三「模」联盟,谷歌DeepMind缔造终身学习智能体!

AIGC动态欢迎阅读

原标题:三「模」联盟,谷歌DeepMind缔造终身学习智能体!
关键字:智能,任务,模型,经验,高效
文章来源:新智元
内容字数:0字

内容摘要:


新智元报道编辑:桃子
【新智元导读】打造终身学习智能体,是研究界以来一直追求的目标。最近,帝国理工联手谷歌DeepMind打造了创新联合框架扩散增强智能体(DAAG),利用LLM+VLM+DM三大模型,让AI完成迁移学习、高效探索。为了让AI实现终身学习,帝国理工、谷歌DeepMind竟动用了三大基础模型!
「大模型+视觉语言模型+扩散模型」三模并用,构建了全新框架——扩散增强智能体(DAAG)。
DAAG的诞生,就是让具身智能体进行迁移学习、高效探索。
最新框架利用了「后见之明经验增强」(Hindsight Experience Augmentation)技术,让扩散模型以时间和几何一致的方式转换视频。
让其与目标指令对齐,从而对智能体过去经验进行重新标记。
论文地址:https://arxiv.org/pdf/2407.20798
大模型在无需人类监督情况下,自主协调这一过程,使其非常适合终身学习场景。
经过一系列实验,结果表明,DAAG改进了奖励检测器的学习、过去经验的迁移以及新任务的获取。
这些都是开发高效终身学习智能体的关键能力。
‍无需人类监督,AI终身强化学习一直以来,


原文链接:三「模」联盟,谷歌DeepMind缔造终身学习智能体!

联系作者

文章来源:新智元
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...