AIGC动态欢迎阅读
原标题:用扩散模型监督NeRF,清华文生3D新方法成新SOTA
关键字:视角,模型,文本,方法,视图
文章来源:量子位
内容字数:2587字
内容摘要:
清华王霞投稿量子位 | 公众号 QbitAI用文字合成3D图形的AI模型,又有了新的SOTA!
近日,清华大学刘永进教授课题组提出了一种基于扩散模型的文生3D新方式。
无论是不同视角间的一致性,还是与提示词的匹配度,都比此前大幅提升。
文生3D是3D AIGC的热点研究内容,得到了学术界和工业界的广泛关注。
刘永进教授课题组此次提出的新模型叫做TICD(Text-Image Conditioned Diffusion),在T3Bench数据集上达到了SOTA水平。
目前相关论文已经发布,代码也即将开源。
测评成绩已达SOTA为了评估TICD方法的效果,研究团队首先进行了定性实验,并对比了此前一些较好的方法。
结果显示,用TICD方法生成的3D图形质量更好、图形更清晰,与提示词的匹配程度也更高。
为了进一步评估这些模型的表现,团队在T3Bench数据集上将TICD与这些方法进行了定量测试。
结果显示,TICD在单对象、单对象带背景、多对象这三个提示集上都取得了最好的成绩,证明了它在生成质量和文本对齐性上都具有整体优势。
此外,为了进一步评估这些模型的文本对齐性,研究团队还对3D物体渲染得
原文链接:用扩散模型监督NeRF,清华文生3D新方法成新SOTA
联系作者
文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...