Aholo Viewer

AI工具5分钟前更新 AI工具集
0 0 0

Aholo Viewer – 群核科技开源的 3D 高斯浏览器

Aholo Viewer,由群核科技倾力打造,是一款基于前沿 3D 高斯溅射(3DGS)技术的革新性 Web 端渲染引擎。它运用精妙的 chunk-level LOD 流式加载策略,使得庞大的三维内容能够如同视频般在各类设备上丝滑传输。即便是性能有限的手机,也能游刃有余地承载亿万级高斯点的宏伟城市级场景,彻底打破了三维可视化在移动端的界限。

Aholo Viewer:重新定义三维的边界

Aholo Viewer 不仅仅是一个渲染器,它更是群核科技开源社区的一份子,致力于将 3DGS 的强大能力带到 Web 端。其核心亮点在于采用 chunk-level LOD(细节层次)流式加载技术,让三维场景的呈现如同观看高分辨率视频般流畅,无论终端性能如何,都能获得极佳的视觉体验。特别值得一提的是,在手机端,Aholo Viewer 能够轻松驾驭数量高达十亿级别的高斯点,构建出令人惊叹的城市级超大场景,这在以往是难以想象的。

为了最大程度地方便开发者,Aholo Viewer 提供了卓越的格式兼容性,能够无缝支持 ply、spz、sog、splat、lcc、ksplat 等市面上主流的 3DGS 数据格式。更令人欣喜的是,它集成了 LOD 生成、格式转换以及体素碰撞体生成等一系列实用工具,真正实现了“开箱即用”的开发体验。除此之外,Aholo Viewer 还与 Aholo 空间智能平台 API 深度融合,为用户提供空间重建、云端渲染、3D AI 模型生成等多元化能力,从而推动三维互联网从“看得见”迈向“用得上”的全新阶段。

Aholo Viewer的卓越性能与丰富功能

  • 亿万级场景的流畅驾驭:凭借创新的 chunk-level LOD 与流式调度机制,Aholo Viewer 能够实现十亿级高斯点场景在浏览器中的秒级加载和流畅漫游,首屏加载在 10 秒以内,极大地提升了用户体验。
  • 跨平台无缝访问:全面适配手机、电脑及 VR 设备,用户无需下载任何客户端,只需打开浏览器,即可沉浸于宏大的三维世界,访问门槛被降至最低。
  • 广泛的格式支持:对 ply、spz、sog、splat、lcc、ksplat 等主流 3D 高斯格式提供原生支持,确保了数据的灵活性和易用性。
  • 一体化的开发工具链:内置高质量的 LOD 生成、数据格式转换、3D 高斯碰撞体生成以及编辑与拾取等全套工具,为开发者提供了一站式的解决方案。
  • 强大的物理碰撞系统:通过从 3DGS 重建资产生成体素碰撞体,Aholo Viewer 支持射线、胶囊体、地面检测和墙体阻挡等实时碰撞查询,为实现逼真的行走模式和相机避障提供了坚实基础。
  • 云端混合渲染的革新:基于 OpenUSD 标准,Aholo Viewer 能够将 3DGS 与高保真 Mesh 在同一场景下进行共存和同帧混合渲染。通过云端实时串流技术,即使是低配置终端也能享受到流畅的预览效果。
  • 多档位的渲染配置:提供效果优先、性能优先和极限性能三种渲染路径,允许开发者根据具体需求灵活平衡画面质量与运行性能。

Aholo Viewer背后的技术精髓

  • Chunk-based LOD Tree(基于块的细节层次树):该技术将庞大的 3DGS 数据分割成的 chunk(数据块),并为每个 chunk 生成不同精度的 LOD。在运行时,系统以 chunk 为单位进行细节层次的动态切换。与 Spark 2.0 的 splat-based LOD(基于斑点的细节层次)相比,chunk 粒度更大,缓存命中率更高,扩展性更强,尤其适合城市级超大场景的区块拼接与更新。
  • 流式分批拉取(Streaming Batch Fetching):通过根据视锥优先级动态加载数据,有效控制内存和显存的占用,从而在大场景下实现高效的数据调度。
  • 渲染管线的精细优化:采用多精度数据结构以降低显存消耗,通过缓存预计算和按需 pass 压缩来减少每帧 GPU 的开销。结合 Morton Sort 和 detail culling 等技术,显著提升了数据访问的效率。
  • 3D 高斯溅射(3D Gaussian Splatting):该核心技术将场景抽象为数以亿计的高斯椭球,每个椭球都携带着精确的位置、形状、颜色和透明度信息。通过可微分光栅化技术,实现了场景的实时渲染。

Aholo Viewer的上手指南

  • 探索项目主页:访问 GitHub 仓库 https://github.com/manycoretech/aholo-viewer,深入了解项目的详细信息。
  • 安装项目依赖:克隆代码库后,在项目根目录下执行 pnpm install 命令以安装所有必要的依赖项。
  • 本地运行与构建:在开发环境中,执行 pnpm dev 启动开发服务器;若需构建生产版本,则执行 pnpm build
  • 集成渲染引擎:在你的项目中,引入 @manycore/aholo-viewer 库,调用 createViewer 函数创建三维视图实例,并使用 SplatLoader 加载 3DGS 数据文件,即可轻松渲染场景。
  • 灵活配置渲染参数:通过 setViewerConfig 方法,你可以根据需求调整渲染管线的参数,选择效果优先、性能优先或极限性能模式。

Aholo Viewer的突出优势

  • 性能标杆:相较于李飞飞团队开源的 Spark 2.0(上限 1 亿高斯点),Aholo Viewer 的容量上限提升了 10 倍,可达 10 亿高斯点。在实际测试中,处理 3 亿高斯点场景时,Aholo Viewer 的内存占用仅为 Spark 的一半,加载速度提升 1 倍,渲染速度更是快了 3 倍,性能表现遥遥领先。
  • 即插即用:广泛的格式兼容性以及内置的完整工具链,使得开发者无需繁琐的额外配置,即可快速接入和使用,极大地缩短了开发周期。
  • 原生 Web 体验:作为一款纯粹的浏览器端解决方案,Aholo Viewer 极大地降低了用户访问三维内容的门槛,让分享和传播三维内容如同分享一个链接般便捷。
  • 构建完整生态:Aholo Viewer 不仅提供了强大的浏览器渲染能力,还向上延伸至空间重建、云端渲染、AI 生成以及数据集开放等领域,致力于构建一个完整的三维互联网基础设施。

Aholo Viewer的项目地址

  • GitHub仓库:https://github.com/manycoretech/aholo-viewer

Aholo Viewer与同类竞品的深度剖析

对比维度Aholo ViewerSpark 2.0(李飞飞/World Labs)
开发者群核科技(Manycore Tech)World Labs(李飞飞团队)
开源许可MIT开源
高斯点容量上限十亿级一亿级
LOD 策略Chunk-based LOD TreeSplat-based LOD Tree
加载速度显著更快(3 亿场景加载速度提升 1 倍)基准参考
内存占用约为 Spark 的一半基准参考
渲染速度极为高效(3 亿场景渲染速度提升 3 倍)基准参考
终端适配手机、电脑、VR 浏览器全面支持普通设备浏览器
工具链集成完备(LOD、碰撞体、格式转换、编辑等)基础渲染引擎
配套 API 服务空间重建、云端渲染、3D AI 生成、数据集支持侧重于渲染引擎本身
定位重点现实世界复现与三维互联网基础设施建设侧重于 AI 生成的虚拟环境

Aholo Viewer的广泛应用领域

  • 数字文旅的沉浸式体验:能够快速构建整个景区的数字化模型,让游客无需亲临现场,即可在浏览器中深度体验真实或虚拟的三维空间。
  • 影视创作的虚拟片场:为影视创作者提供逼真的虚拟片场环境,使他们在真实重建的空间中进行镜头设计和交互编排,极大地提升了创作效率和灵活性。
  • 游戏开发的创新土壤:允许开发者直接在真实重建的三维空间中设计游戏互动,借助碰撞体系统实现角色的流畅移动和逼真的物理反馈,为游戏体验注入新的活力。
  • 具身智能与机器人训练的仿真平台:通过开放 InteriorGS 等包含丰富语义信息的 3D 高斯数据集,为机器人和智能体提供高质量的仿真训练数据,加速具身智能技术的发展。
阅读原文
© 版权声明

相关文章

AI聚合视觉工厂

暂无评论

暂无评论...