标签:损失
何恺明谢赛宁解剖扩散模型,新作刚刚出炉
编辑部 发自 凹非寺量子位 | 公众号 QbitAICV大神何恺明,也来搞扩散模型(Diffusion Model)了! 大神最新论文刚刚挂上arXiv,还是热乎的:解构扩散模型,提...
三行代码无损加速40%,尤洋团队AI训练加速器入选ICLR Oral论文
克雷西 发自 凹非寺量子位 | 公众号 QbitAI用剪枝的方式加速AI训练,也能实现无损操作了,只要三行代码就能完成! 今年的深度学习顶会ICLR上,新加坡国立大学...
弥合2D和3D生成领域之间的次元壁,X-Dreamer实现高质量的文本到3D生成
机器之心专栏机器之心编辑部本文介绍了一个名为 X-Dreamer 的框架,它主要由CG-LoRA和AMA损失两种关键创新组成,实现了弥合 text-to-2D 和 text-to-3D 间的领...
更通用、有效,蚂蚁自研优化器WSAM入选KDD Oral
机器之心专栏机器之心编辑部蚂蚁 AI Infra 团队在深度学习最核心之一的优化器方向持续投入与创新,实现了 AI 训练节约资源、加速收敛、提升泛化等目标。我们...
Chinchilla之死:只要训练足够长时间,小模型也能超过大模型
选自espadrine机器之心编译2022 年 3 月,DeepMind 一篇论文《Training Compute-Optimal Large Language Models》通过构建的 Chinchilla 模型得出了一个结论...
12