世界模型也扩散!训练出的智能体竟然不错

AIGC动态7个月前发布 机器之心
11 0 0

世界模型也扩散!训练出的智能体竟然不错

AIGC动态欢迎阅读

原标题:世界模型也扩散!训练出的智能体竟然不错
关键字:模型,人工智能,智能,世界,标杆
文章来源:机器之心
内容字数:4291字

内容摘要:


机器之心报道
编辑:小舟、陈萍在图像生成领域占据主导地位的扩散模型,开始挑战强化学习智能体。世界模型提供了一种以安全且样本高效的方式训练强化学习智能体的方法。近期,世界模型主要对离散潜在变量序列进行操作来模拟环境动态。
然而,这种压缩为紧凑离散表征的方式可能会忽略对强化学习很重要的视觉细节。另一方面,扩散模型已成为图像生成的主要方法,对离散潜在模型提出了挑战。
受这种范式转变的推动,来自日内瓦大学、爱丁堡大学、微软研究院的研究者联合提出一种在扩散世界模型中训练的强化学习智能体 —— DIAMOND(DIffusion As a Model Of eNvironment Dreams)。论文地址:https://arxiv.org/abs/2405.12399
项目地址:https://github.com/eloialonso/diamond
论文标题:Diffusion for World Modeling: Visual Details Matter in Atari
DIAMOND 在 Atari 100k 基准测试中获得了 1.46 的平均人类归一化得分 (HNS),可以媲美完


原文链接:世界模型也扩散!训练出的智能体竟然不错

联系作者

文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...