Avat3r

AI工具1年前 (2025)发布 AI工具集

Avat3r – 慕尼黑大合 Meta 推出的 3D 高斯头像生成模型

Avat3r是什么

Avat3r 是由慕尼黑工业大学与 Meta Reality Labs 联合开发的一款高保真三维头像重建模型，能够在仅需几张输入图像的情况下，生成高质量且具备动画效果的 3D 头部头像，显著降低了计算资源的需求。该模型通过大规模多角度视频数据集的学习，掌握了强大的三维人头先验知识，并结合 DUSt3R 提供的位置图与 Sapiens 的特征图，从而优化了重建效果。Avat3r 的一大创新在于利用简单的交叉注意力机制实现表情动画，能够从不一致的输入（如手机拍摄或单目视频帧）中重建三维头部头像。

Avat3r

Avat3r的主要功能

高效生成：Avat3r 仅需少量输入图像，便能快速生成高质量的3D头部头像，极大地减少了传统方法所需的计算资源。
动画化能力：通过独特的交叉注意力机制，Avat3r 可以为生成的3D头像添加动画效果，支持实时表情控制。
鲁棒性：模型在训练过程中使用了多种表情的图像，能够处理不一致的输入，例如模糊的手机照片或单目视频帧。
多源输入支持：Avat3r 能够从多种来源生成3D头像，包括智能手机拍摄的照片、单张图像以及古董半身像。

Avat3r的技术原理

高斯重建技术：Avat3r 采用3D高斯喷洒技术作为基本表示方法。通过将3D空间中的点用高斯分布表示，不仅能够描述点的位置，还能编码颜色、法线等属性，从而高效重建和渲染复杂的3D头部模型。
多视图数据学习：Avat3r 从多角度视频数据集中学习到强大的三维人头先验，使其在仅有少量图像的情况下，能够生成高质量的3D头像，且能更好地处理不一致的输入。
动画化技术：Avat3r 的一大创新在于通过简单的交叉注意力机制实现表情动画。训练过程中输入了不同表情的图像，提高了对表情变化的适应性。生成的3D头像能够实时响应表情变化，展现自然的动画效果。
结合先验模型：Avat3r 结合DUSt3R的位置图与Sapiens的特征图，进一步优化了重建效果。这些先验模型为3D头部的几何结构和纹理提供了额外的约束，提升了生成头像的真实感与细节表现。
高效性与泛化能力：Avat3r 在少输入和单输入场景中表现卓越，能够在几分钟内从几张输入图像生成高质量的3D头像。该模型具备良好的泛化能力，能够处理来自不同来源的输入，如智能手机照片或单张图片。