谷歌Genie爆打Sora,基础世界模型AGI来了?一张草图即生一个世界,通才智能体迎来新革命

AIGC动态8个月前发布 新智元
39 0 0

谷歌Genie爆打Sora,基础世界模型AGI来了?一张草图即生一个世界,通才智能体迎来新革命

AIGC动态欢迎阅读

原标题:谷歌Genie爆打Sora,基础世界模型AGI来了?一张草图即生一个世界,通才智能体迎来新革命
关键字:模型,动作,视频,世界,研究人员
文章来源:新智元
内容字数:9400字

内容摘要:


新智元报道编辑:编辑部
【新智元导读】真正的「基础世界模型」诞生了!谷歌团队发布110亿参数Genie「精灵」,从一张图片就能创造出可玩的虚拟世界,动作可控碾压Sora。网友惊叹,AI已经杀到视频游戏领域了。就在昨天,谷歌DeepMind重磅发布了一个基础世界模型——Genie「精灵」。
从一个图像,一张照片,一个草图中,它就能生成一个无穷无尽的世界。
当红炸子鸡Sora虽然创造了令人惊叹的场景,但它们的动作并非可控。
而Genie将成为游戏规则的改变者,创造的虚拟场景可以像电子游戏一样进行互动。
论文地址:https://arxiv.org/abs/2301.07608
Genie的疯狂之处在于,学习了20万小时的未标注互联网视频,无需监督即可训练。
无需任何动作标注,便可以确定谁是主角,并让用户能够在生成的世界中对其控制。
凭借110亿参数,Genie确立了自己作为基础世界模型的地位
具体来说,它是通过潜动作(latent action)模型、视频分词器,以及自回归动态模型三大核心组件来实现的。
由此产生的学习潜动作空间,不仅使用户交互成为可能,而且还有助于训练智能体模仿看不见的


原文链接:谷歌Genie爆打Sora,基础世界模型AGI来了?一张草图即生一个世界,通才智能体迎来新革命

联系作者

文章来源:新智元
作者微信:AI_era
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...