标签：视图

2张图2秒钟3D重建！这款AI工具火爆GitHub，网友：忘掉Sora

丰色发自凹非寺量子位 | 公众号 QbitAI只需2张图片，无需测量任何额外数据—— 当当，一个完整的3D小熊就有了：这个名为DUSt3R的新工具，火得一塌糊涂，才上...

阅读原文

AIGC动态

2年前 (2024)

少样本轻量化：多个小模型互学习会比大模型好么？

来源 | ACTBIGDATA 作者 |毛乾任、蒋为峰等背景大型预训练语言模型（PLM），如 BERT、GPT-3，在自然语言处理应用的发展中扮演着至关重要的角色。为了将这些 ...

阅读原文

AIGC动态

2年前 (2024)

画个框、输入文字，面包即刻出现：AI开始在3D场景「无中生有」了

机器之心报道编辑：陈萍现在，通过文本提示和一个 2D 边界框，我们就能在 3D 场景中生成对象。看到下面这张图了没？一开始，盘子里是没有东西的，但当你在托...

阅读原文

AIGC动态

2年前 (2024)

只需2分钟，单视图3D生成又快又好！北大等提出全新Repaint123方法

新智元报道编辑：LRS 好困【新智元导读】将2D扩散模型的强大图像生成能力与再绘策略的纹理对齐能力结合起来，Repaint123能够在2分钟内从零开始生成具有多视...

阅读原文

AIGC动态

2年前 (2024)

你就是超级超级GPU，请看你的高清GPU大脑图

来源：CreateAMind 国外一位航天飞机工程师个人花了六年多时间从几百篇论文中梳理绘制而成的大脑功能视图。原网站介绍：人脑是一个高度复杂的电子系统，由...

阅读原文

AIGC动态

2年前 (2023)

用扩散模型监督NeRF，清华文生3D新方法成新SOTA

清华王霞投稿量子位 | 公众号 QbitAI用文字合成3D图形的AI模型，又有了新的SOTA！近日，清华大学刘永进教授课题组提出了一种基于扩散模型的文生3D新方式。 ...

阅读原文

AIGC动态

2年前 (2023)

五官乱飞，张嘴、瞪眼、挑眉，AI都能模仿到位，视频诈骗要防不住了

机器之心报道编辑：陈萍、小舟不能说完全相同，只能说表情一模一样。防不住，根本防不住，现在 AI 模仿能力已经发展到这种程度了？你前脚让自己的五官乱飞，...

阅读原文

AIGC动态

3年前 (2023)

驶向未来，首个多视图预测+规划自动驾驶世界模型来了

机器之心专栏机器之心编辑部Drive-WM 模型通过多视图世界模型，能够想象不同规划路线的未来情景，并根据视觉预测获取相应的奖惩反馈，从而优化当前的路线选择...

阅读原文

AIGC动态

3年前 (2023)

单个A100生成3D图像只需30秒，这是Adobe让文本、图像都动起来的新方法

机器之心报道编辑：杜伟、佳琪3D 生成是 AI 视觉领域的研究热点之一。本文中，来自 Adobe 研究院和斯坦福大学等机构的研究者利用基于 transformer 的 3D 大型...

阅读原文

AIGC动态

3年前 (2023)

AI「脑补」画面太强了！李飞飞团队新作ZeroNVS，单个视图360度全场景生成

来源：机器学习研究组订阅近来，利用3D感知扩散模型训练模型，然后对单个物体进行SDS蒸馏的研究数不胜数。但是，能够真正做到「场景级」的画面生成，从未实现...

阅读原文

AIGC动态

3年前 (2023)

每日 24 亿处理：Airbnb 的 Riverbed 技术解析

作者 | Rafal Gancarz 译者 | 明知山策划 | 丁晓昀 Airbnb 开发的 Riverbed 是一个 Lambda 风格的数据框架，用于生成和管理分布式物化视图。该框架支持 50 ...

阅读原文

AIGC动态

3年前 (2023)

4K画质3D合成视频不再卡成幻灯片，新方法将渲染速度提高了30多倍

机器之心报道编辑：张倩、陈萍本文提出了一种突破性的点云表示 4K4D，能够以 4K 分辨率对动态 3D 场景进行高保真实时渲染，达到了前所未有的渲染速度和令人印...

阅读原文

AIGC动态

3年前 (2023)

文生3D模型大突破！MVDream重磅来袭，一句话生成超逼真三维模型

新智元报道编辑：拉燕【新智元导读】文生3D模型进步！分数蒸馏采样下的MVDream，真的有这么神奇吗？真的有。不得了了！现在只用打几个字就能创造精美、高质量...

阅读原文

AIGC动态

3年前 (2023)

MVDream：轻松实现从文本到3D渲染图像

近日，字节跳动研究人员推出了名为MVDream的新技术，它可以仅通过文本描述生成高质量的3D图像。这种从文本到图像的生成技术，被称为“文本到3D”技术，是当前计...

阅读原文

AIGC动态

3年前 (2023)