标签:作者

Stable Diffusion 3技术报告流出,Sora构架再立大功!生图圈开源暴打Midjourney和DALL·E 3?

新智元报道编辑:润 【新智元导读】Stability AI放出了号称能暴打闭源模型的Stable Diffusion 3的技术报告,采用DiT构架的新模型在灵活性和性能上都达到了新...
阅读原文

Stable Diffusion 3论文终于发布,架构细节大揭秘,对复现Sora有帮助?

机器之心报道 编辑:张倩在众多前沿成果都不再透露技术细节之际,Stable Diffusion 3 论文的发布显得相当珍贵。Stable Diffusion 3 的论文终于来了! 这个模...
阅读原文

清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!

机器之心专栏 机器之心编辑部近期,清华大学和哈尔滨工业大学联合发布了一篇论文:把大模型压缩到 1.0073 个比特时,仍然能使其保持约 83% 的性能!自从大模...
阅读原文

Mamba正式被ICLR拒收!“年度最佳技术原理解读”却火了

丰色 发自 凹非寺量子位 | 公众号 QbitAI悬着的心终于死了: 被尊为Transformer挑战者的Mamba,已正式被ICLR拒绝。 (之前被“初拒”后在学术圈引起轩然大波,...
阅读原文

8/8/6/3的Mamba论文,最终还是被ICLR 2024拒了,网友:悬着的心终于死了

机器之心报道 编辑:蛋酱几天前,ICLR 2024 的最终接收结果出来了。 大家应该还记得,Mamba 被 ICLR 2024 大会 Decision Pending(待定)的消息在 1 月份引发...
阅读原文

AAAI 2024杰出论文奖出炉:西安电子科技大学获奖

机器之心报道 机器之心编辑部让我们恭喜获奖者!本周,全球 AI 顶会 AAAI 2024 正式开幕,目前已公布了最佳论文(Outstanding Paper Award)等多个重要奖项。...
阅读原文

清华叉院、理想提出DriveVLM,视觉大语言模型提升自动驾驶能力

机器之心报道 编辑:泽南在自动驾驶领域,研究人员也在朝着 GPT/Sora 等大模型方向进行探索。 与生成式 AI 相比,自动驾驶也是近期 AI 最活跃的研究和开发领...
阅读原文

天才科学家谢赛宁紧急辟谣!和OpenAI的Sora模型无关

‍夕小瑶科技说 原创作者 | 王二狗大家好我是二狗。 这几天OpenAI的视频生成模型Sora实在是太火爆了。 然而就在昨天有一篇自媒体文章在网上疯传,有接近10w+的...
阅读原文

Sora背后团队:应届博士带队,00后入列,还专门招了艺术生

克雷西 鱼羊 发自 凹非寺量子位 | 公众号 QbitAI现在世界上最受关注的技术团队是哪一支? Sora团队,已经来到聚光灯中心。 不仅项目负责人评论区被挤爆,成了...
阅读原文

亚马逊工程师严选,超 40 篇 LLM 论文汇总

作者:Eugene Yan 编辑:李宝珠,三羊 亚马逊工程师 Eugene Yan 等人建立了一个语言模型论文阅读清单,持续分享前沿论文,目前已经汇总了 40 余篇高质量论文...
阅读原文

人类偏好优化算法哪家强?跟着高手一文学懂DPO、IPO和KTO

选自 huggingface.co/blog 作者:Kashif Rasul 等 机器之心编译 编辑:赵阳‍尽管收集人类对模型生成内容的相对质量的标签,并通过强化学习从人类反馈(RLHF)...
阅读原文

机器有意识吗?答案可能和你想的不一样

来源:混沌巡洋舰 几年前, AlphaGo 引发的人工智能浪潮扑面而来。面对“人工智能是否会取代人类”这样的常见问题时,一个最为掷地有声的回答是:不会的,因为...
阅读原文

性能提升、成本降低,这是分布式强化学习算法最新研究进展

机器之心原创 作者:Jiying 编辑:H4O深度强化学习(Deep Reinforcement Learning,DRL)是一种公认的解决连续决策问题的有效技术。为了应对 DRL 的数据低效...
阅读原文

研究表明:论文被大V宣传后,引用次数暴涨2~3倍!

夕小瑶科技说 原创作者 | 谢年年、Python随着AI领域的迅猛发展,学术成果的传播方式发生了显著转变。 期刊审稿周期长,当你还在和审稿人battle时,方法先过时...
阅读原文

匿名论文提出奇招!增强大模型长文本能力居然还能这么做

丰色 发自 凹非寺量子位 | 公众号 QbitAI一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展? 不行,这些都太费硬件资源了。 来看一个奇妙新解...
阅读原文
15678912