标签:作者

Pika联创参与新研究:Diffusion能抢GPT的活了!成功挑战自回归文本范式

丰色 发自 凹非寺量子位 | 公众号 QbitAI纵观生成式AI领域中的两个主导者:自回归和扩散模型。 一个专攻文本等离散数据,一个长于图像等连续数据。 如果,我...
阅读原文

斯坦福发文:AI写论文比例激增,CS专业是重灾区,现状堪忧!

夕小瑶科技说 原创作者 | 谢年年自从2022年底ChatGPT发布以来,用大模型辅助写学术论文已经不是什么稀罕事,各种“超详细ChatGPT论文写作、润色指南”一搜一大把...
阅读原文

曾爆火的 InstantID又有了新玩法:风格化图像生成,已开源

机器之心专栏 机器之心编辑部InstantID 原班团队推出了风格迁移的新方法InstantStyle。风格化图像生成,也常称为风格迁移,其目标是生成与参考图像风格一致的...
阅读原文

NeurIPS开辟高中赛道引爆争议!网友:代理人战争要开始了

梦晨 发自 凹非寺量子位 | 公众号 QbitAI从今年起,高中生也要卷AI顶会了,真是计算机从娃娃抓起? NeurIPS正式面向高中生征集论文,消息一出,网友们立刻炸...
阅读原文

Google 发布 CodeGemma:7B 力压 CodeLLaMa-13B

夕小瑶科技说 原创作者 | 任同学刚刚发布!Google 带来了新的 Gemma 家族成员,CodeGemma,这是基于预训练的 Gemma-2B 和 Gemma-7B 的代码生成模型。 其上下...
阅读原文

Llama架构比不上GPT2?神奇token提升10倍记忆?

机器之心专栏 机器之心编辑部一个 7B 规模的语言模型 LLM 能存储多少人类知识?如何量化这一数值?训练时间、模型架构的不同将如何影响这一数值?浮点数压缩 ...
阅读原文

大模型对齐阶段的Scaling Laws

大数据文摘受权转载自李rumor 随着过去一年大模型技术的发展,数据、模型尺寸scale up后的能力已经不容置疑,scaling law也被越来越多研究者重视起来。在预训...
阅读原文

扩散模型进军专业图层,斯坦福提出LayerDiffuse实现分层扩散,效果直逼商业网站

大数据文摘受权转载自将门创投 目前,视觉扩散生成模型(如Stable Diffusion等)在常规图像生成任务上获得了非常好的效果,但是在内容制作的专业领域,例如对...
阅读原文

讨论下一个token预测时,我们可能正在走进陷阱

机器之心报道 编辑:赵阳自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后,这一概念逐渐成为现代语言模型的核心部分。最近,围绕下一个 ...
阅读原文

Transformer七子重聚GTC,老黄亲自赠送签名版DGX-1!7年奠基之作背后佚事揭秘

新智元报道编辑:编辑部 【新智元导读】Transformer奠基之作拯救了现在的AI。就在GTC大会上,老黄聚齐了其中的七位作者,开启了一场深度访谈。GTC大会上,老...
阅读原文

全球学术圈险被ChatGPT论文攻陷!知名出版商紧急撤稿,AI插图笑翻网友

新智元报道编辑:编辑部 【新智元导读】近日,爱思唯尔上的几篇论文被发现开篇就暴露了「ChatGPT风格」,插图也是用Midjourney画的。学术圈被AI渗透已经不是...
阅读原文

UC伯克利:用大模型预测未来,准确率超越人类!

夕小瑶科技说 原创编辑 | 谢年年近年来,语言模型在文本生成、翻译、情感分析等领域大放异彩,但利用语言模型做预测的任务还比较少。这里的预测任务指的是根...
阅读原文

《龙珠》作者鸟山明逝世,享年 68 岁

《龙珠》作者鸟山明逝世,享年 68 岁 , 2024-03-0811:55 , ,…
阅读原文

Stable Diffusion 3技术报告流出,Sora构架再立大功!生图圈开源暴打Midjourney和DALL·E 3?

新智元报道编辑:润 【新智元导读】Stability AI放出了号称能暴打闭源模型的Stable Diffusion 3的技术报告,采用DiT构架的新模型在灵活性和性能上都达到了新...
阅读原文

Stable Diffusion 3论文终于发布,架构细节大揭秘,对复现Sora有帮助?

机器之心报道 编辑:张倩在众多前沿成果都不再透露技术细节之际,Stable Diffusion 3 论文的发布显得相当珍贵。Stable Diffusion 3 的论文终于来了! 这个模...
阅读原文
15678912