标签:视角
从第一人称视角理解世界,多模态模型离我们还有多远?| CVPR 2024
大数据文摘受权转载自将门创投 目前很多评测工作探究视觉语言大模型在不同维度上的能力,但都忽视了真实世界中非常重要的一点:未来作为智能体或机器人的大脑...
大型多视角高斯模型LGM:5秒产出高质量3D物体,可试玩
机器之心专栏 机器之心编辑部为满足元宇宙中对 3D 创意工具不断增长的需求,三维内容生成(3D AIGC)最近受到相当多的关注。并且,3D 内容创作在质量和速度方...
只需2分钟,单视图3D生成又快又好!北大等提出全新Repaint123方法
新智元报道编辑:LRS 好困 【新智元导读】将2D扩散模型的强大图像生成能力与再绘策略的纹理对齐能力结合起来,Repaint123能够在2分钟内从零开始生成具有多视...
1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品
张俊武 唐振宇 投稿量子位 | 公众号 QbitAI只需两分钟,玩转图片转3D! 还是高纹理质量、多视角高一致性的那种。 不管是什么物种,输入时的单视图图像还是这...
用扩散模型监督NeRF,清华文生3D新方法成新SOTA
清华王霞投稿量子位 | 公众号 QbitAI用文字合成3D图形的AI模型,又有了新的SOTA! 近日,清华大学刘永进教授课题组提出了一种基于扩散模型的文生3D新方式。 ...
材质界的ImageNet,大规模6维材质实拍数据库OpenSVBRDF发布|SIGGRAPH Asia
机器之心专栏机器之心编辑部在计算图形学领域,材质外观刻画了真实物体与光线之间的复杂物理交互,通常可表达为随空间位置变化的双向反射分布函数(Spatially...
Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快
西风 发自 凹非寺量子位 | 公众号 QbitAIStable Diffusion官方终于对视频下手了——发布生成式视频模型Stable Video Diffusion(SVD)。Stability AI官方博客显...
AI玩推理桌游一眼识破骗局!清华通院联合推出心智理论新框架,6个指标评估表现均明显优于思维链
阿瓦隆 发自 凹非寺量子位 | 公众号 QbitAI清华自动化系团队联合北京通用人工智能研究院,让几个AI智能体玩起了桌游!游戏名叫阿瓦隆,是一个策略性的社交推...
清华&通院让AI智能体成功识破谎言!ReCon框架玩转「阿瓦隆」,三思后行+换位思考
新智元报道编辑:LRS【新智元导读】让AI智能体学会「三思而后行」和「换位思考」,实现对虚假欺骗信息的甄别与应对,为通用人工智能增加安全屏障。大语言模型...
自动驾驶数据不用愁!港中文等发布MagicDrive:日夜、雨晴、多视角全覆盖,人、物位置随意变更
新智元报道编辑:LRS【新智元导读】MagicDrive可以细粒度生成高保真、多相机街景,可以随意变换天气、光照条件以及人物位置,海量自动驾驶数据触手可及!在深...
ReCon框架帮助AI大模型识破谎言,来看智能体如何在阿瓦隆游戏中应对欺骗
机器之心专栏机器之心编辑部让 AI 智能体学会「三思而后行」和「换位思考」,实现对虚假欺骗信息的甄别与应对,为通用人工智能增加安全屏障。大语言模型(Lar...
港科大谭平团队突破3D生成领域关键性问题,让多头怪不再出现
机器之心专栏机器之心编辑部生成模型在图像生成领域取得了巨大的成功,但将这一技术扩展到 3D 领域一直面临着重重挑战。典型的多头怪问题,即文本生成3D中多...
文生3D模型大突破!MVDream重磅来袭,一句话生成超逼真三维模型
新智元报道编辑:拉燕【新智元导读】文生3D模型进步!分数蒸馏采样下的MVDream,真的有这么神奇吗?真的有。不得了了!现在只用打几个字就能创造精美、高质量...
NeurIPS 2023 Spotlight|高质量多视角图像生成,完美复刻场景材质!SFU等提出MVDiffusion
新智元报道编辑:LRS 好困【新智元导读】不怕多视角图像变化大,MVDiffusion整合图片全局意识,内容一致性更高!逼真的图像生成在虚拟现实、增强现实、视频游...
12