一个比Sora更懂物理世界的世界模型。
原标题:昆仑万维发布中国首款“空间智能大模型”,融合3D世界和可交互视频生成|甲子光年
文章来源:甲子光年
内容字数:6893字
昆仑万维发布空间智能大模型Matrix-Zero:开启3D AIGC新纪元
本文总结了昆仑万维近期发布的空间智能大模型Matrix-Zero的相关信息,并探讨了空间智能领域的意义和发展前景。
1. 空间智能:下一代AI浪潮
当前,AI生成内容主要集中在2D领域,例如图像和视频。然而,空间智能,即AI生成可交互3D场景,正成为一个新的突破口。它能够生成更真实、更可控的3D内容,改变电影、游戏、模拟器等行业的制作方式。李飞飞教授将空间智能总结为“我看、我动、我思,故我在”,强调了视觉、和认知的融合。空间智能的发展曾面临挑战,但近年来生成式AI的爆发使其技术日趋成熟。
2. Matrix-Zero:3D场景生成与可交互视频的融合
昆仑万维发布的Matrix-Zero是一个具有两大特色的空间智能大模型:一是3D场景生成大模型,支持将图片转化为可探索的3D场景,并具备“全局一致性”;二是可交互视频生成大模型,允许用户通过交互操作控制视频内容。与其他3D AIGC工具相比,Matrix-Zero在探索范围和交互性方面具有显著优势。World Labs的模型仅支持小范围移动,而Matrix-Zero支持任意方向的长距离、大范围探索,包括环视、360度俯视等。此外,Matrix-Zero生成的3D场景还包含符合物理规律的动态物体,例如光照效果、水花动态等。
3. Matrix-Zero的技术优势与创新
Matrix-Zero的3D场景生成大模型包含场景布局生成模块和纹理生成模块,通过可微渲染和扩散模型生成一致的3D布局和纹理。其可交互视频生成模型则包含基础视频生成模型和用户输入交互系统,能够精确控制视频中的视角移动,并响应用户的实时交互操作。这与基于提示词的图像生成视频以及单纯的3D场景生成路线有所不同,实现了更精准的控制和更丰富的交互体验。
4. 昆仑万维的空间智能战略布局
昆仑万维在AI领域进行了全产业链布局,涵盖算力基础设施、大模型算法和AI应用。该公司已发布多个AI模型,包括文本大模型、音乐大模型和推理大模型等。Matrix-Zero的发布是其在空间智能领域的重要一步,也为其AI矩阵业务带来了新的助力。昆仑万维成为国内首家发布3D场景生成和可交互视频生成模型的企业,展现了其在技术创新和前瞻布局方面的实力。
5. 未来展望
Matrix-Zero的发布标志着空间智能时代的到来。这项技术将对游戏开发、具身智能等行业产生深远的影响。昆仑万维在空间智能领域的探索,为未来AI发展提供了新的方向,也预示着更逼真、更沉浸式的数字世界即将到来。
联系作者
文章来源:甲子光年
作者微信:
作者简介:甲子光年是一家科技智库,包含智库、社群、企业服务版块,立足中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,推动人工智能、大数据、物联网、云计算、新能源、新材料、信息安全、大健康等科技创新在产业中的应用与落地。