通用世界模型问世:不学习就能生成新领域视频,可实时控制

通用世界模型问世:不学习就能生成新领域视频,可实时控制

AIGC动态欢迎阅读

原标题:通用世界模型问世:不学习就能生成新领域视频,可实时控制
关键字:模型,视频,世界,动作,领域
文章来源:机器之心
内容字数:5894字

内容摘要:


机器之心报道
编辑:小舟、泽南这才是 AI 视频生成的未来?
随着 OpenAI 今年 2 月发布 Sora,世界模型(World Model)再次成为了 AI 领域的热门。
世界模型,即通过预测未来的范式对数字世界和物理世界进行理解,一直以来被认为是通往通用人工智能(AGI)的关键路径之一,与当前大模型推崇的智能体(Agent)方向互相区分。
世界模型的研究促进了交互式内容的创建,并为有根据的、长期的推理提供了基础。当前的基础模型并不能完全满足通用世界模型的功能——大型语言模型(LLM)受到对语言模态的依赖以及对物理世界有限理解的限制,而视频模型(如 Sora)则缺乏对世界模拟的交互式动作控制。
在 UC San Diego、穆罕默德・本・扎耶德人工智能大学(MBZUAI)等机构的最新研究中,人们通过引入 Pandora 向构建通用世界模型迈出了一步。
MBZUAI 校长邢波(Eric Xing)表示,Pandora 是一个可通过语言命令实时操控的世界模型,能够在视觉空间中实时推理概念层面。是时候超越语言世界中的 LLM,进入物理和感官世界了!
Pandora 是一种混合自回归扩散模


原文链接:通用世界模型问世:不学习就能生成新领域视频,可实时控制

联系作者

文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...