通用世界模型问世：不学习就能生成新领域视频，可实时控制

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：通用世界模型问世：不学习就能生成新领域视频，可实时控制
关键字：模型,视频,世界,动作,领域
文章来源：机器之心
内容字数：5894字

内容摘要：

机器之心报道
编辑：小舟、泽南这才是 AI 视频生成的未来？
随着 OpenAI 今年 2 月发布 Sora，世界模型（World Model）再次成为了 AI 领域的热门。
世界模型，即通过预测未来的范式对数字世界和物理世界进行理解，一直以来被认为是通往通用人工智能（AGI）的关键路径之一，与当前大模型推崇的智能体（Agent）方向互相区分。
世界模型的研究促进了交互式内容的创建，并为有根据的、长期的推理提供了基础。当前的基础模型并不能完全满足通用世界模型的功能——大型语言模型（LLM）受到对语言模态的依赖以及对物理世界有限理解的限制，而视频模型（如 Sora）则缺乏对世界模拟的交互式动作控制。
在 UC San Diego、穆罕默德・本・扎耶德人工智能大学（MBZUAI）等机构的最新研究中，人们通过引入 Pandora 向构建通用世界模型迈出了一步。
MBZUAI 校长邢波（Eric Xing）表示，Pandora 是一个可通过语言命令实时操控的世界模型，能够在视觉空间中实时推理概念层面。是时候超越语言世界中的 LLM，进入物理和感官世界了！
Pandora 是一种混合自回归扩散模

原文链接：通用世界模型问世：不学习就能生成新领域视频，可实时控制