一图一3D世界，视频还可交互，昆仑万维「空间智能」开年首秀来了

昆仑万维再次丰富了自己的「AI武器库」。

原标题：一图一3D世界，视频还可交互，昆仑万维「空间智能」开年首秀来了
文章来源：机器之心
内容字数：9821字

2025年被认为是智能体爆发元年，AI应用将迎来井喷式增长。然而，除了智能体，另一个AI领域——空间智能，也可能迎来其“ChatGPT时刻”。本文将重点介绍昆仑万维发布的Matrix-Zero世界模型，以及空间智能技术在3D动画领域的应用前景。

“AI教母”李飞飞看好并押注的空间智能，被认为是AI理解和操控3D空间的关键技术。它能够将AI的视觉理解从二维提升到三维，实现更真实的立体感和空间深度。目前，空间智能领域面临着大规模高质量3D数据匮乏、生成场景细节不够精细、多视角一致性难以保证以及效率问题等挑战。

昆仑万维发布的Matrix-Zero世界模型，是国内首个同时推出3D场景生成和可交互视频生成的模型。它能够将单张图片转化为可探索的3D场景，并生成可交互视频，实现了功能上的“加强版”3D物理世界和视频生成器。Matrix-Zero预计将于4月份正式上线。

Matrix-Zero采用与李飞飞团队不同的技术路线，具有以下优势：

Matrix-Zero的可交互视频生成模型，关注实时交互和大范围场景。它具有很强的泛化能力，能够生成流畅、一致、高质量的视频，并允许用户调整视角、操控场景元素，极大地提升了用户参与度。

Matrix-Zero的3D场景生成由场景布局生成模块和纹理生成模块构成，融合了可微渲染和扩散模型技术。可交互视频生成则基于自研的生成式视频模型、大规模预训练模型和用户输入交互模型，实现了高质量、稳定的视频输出。

昆仑万维在AI领域持续布局，从大模型到空间智能，构建了全产业链布局。Matrix-Zero是其在空间智能领域的又一标志性成果，将进一步强化其多元AI业务矩阵，并为多模态大模型的应用落地开辟新赛道。

未来空间智能技术有望结合更多感官信息，通过强化学习实现更精确的感知和推理，并在更多行业得到应用。对于致力于AGI的企业来说，强大的空间智能将成为AGI发展的重要支柱。

文章来源：机器之心
作者微信：
作者简介：专业的人工智能媒体和产业服务平台

文章版权归作者所有，未经允许请勿转载。

暂无评论...