AIGC动态欢迎阅读
原标题:GPT超越扩散、视觉生成Scaling Law时刻!北大&字节提出VAR范式
关键字:模型,字节跳动,图像,顺序,能力
文章来源:机器之心
内容字数:7588字
内容摘要:
机器之心发布
机器之心编辑部新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了!使 GPT 风格的自回归模型在图像生成首次超越扩散模型,并观察到与大语言模型相似的 Scaling Laws 缩放定律、Zero-shot Task Generalization 泛化能力:论文标题: “Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction”
这项名为 VAR 的新工作由北京大学和字节跳动的研究者提出,登上了 GitHub 和 Paperwithcode 热度榜单,并得到大量同行关注:目前体验网站、论文、代码、模型已放出:
体验网站:https://var.vision/
论文链接:https://arxiv.org/abs/2404.02905
开源代码:https://github.com/FoundationVision/VAR
开源模型:https://huggingface.co/FoundationVision/var
背景介绍
原文链接:GPT超越扩散、视觉生成Scaling Law时刻!北大&字节提出VAR范式
联系作者
文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...