GPT超越扩散、视觉生成Scaling Law时刻！北大&字节提出VAR范式

AIGC动态1年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：GPT超越扩散、视觉生成Scaling Law时刻！北大&字节提出VAR范式
关键字：模型,字节跳动,图像,顺序,能力
文章来源：机器之心
内容字数：7588字

内容摘要：

机器之心发布
机器之心编辑部新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了！使 GPT 风格的自回归模型在图像生成首次超越扩散模型，并观察到与大语言模型相似的 Scaling Laws 缩放定律、Zero-shot Task Generalization 泛化能力：论文标题: “Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction”
这项名为 VAR 的新工作由北京大学和字节跳动的研究者提出，登上了 GitHub 和 Paperwithcode 热度榜单，并得到大量同行关注：目前体验网站、论文、代码、模型已放出：
体验网站：https://var.vision/
论文链接：https://arxiv.org/abs/2404.02905
开源代码：https://github.com/FoundationVision/VAR
开源模型：https://huggingface.co/FoundationVision/var
背景介绍

原文链接：GPT超越扩散、视觉生成Scaling Law时刻！北大&字节提出VAR范式