标签：损失

何恺明谢赛宁解剖扩散模型，新作刚刚出炉

编辑部发自凹非寺量子位 | 公众号 QbitAICV大神何恺明，也来搞扩散模型（Diffusion Model）了！大神最新论文刚刚挂上arXiv，还是热乎的：解构扩散模型，提...

2年前 (2024)

克雷西发自凹非寺量子位 | 公众号 QbitAI用剪枝的方式加速AI训练，也能实现无损操作了，只要三行代码就能完成！今年的深度学习顶会ICLR上，新加坡国立大学...

2年前 (2024)

机器之心专栏机器之心编辑部本文介绍了一个名为 X-Dreamer 的框架，它主要由CG-LoRA和AMA损失两种关键创新组成，实现了弥合 text-to-2D 和 text-to-3D 间的领...

3年前 (2023)

机器之心专栏机器之心编辑部蚂蚁 AI Infra 团队在深度学习最核心之一的优化器方向持续投入与创新，实现了 AI 训练节约资源、加速收敛、提升泛化等目标。我们...

3年前 (2023)

选自espadrine机器之心编译2022 年 3 月，DeepMind 一篇论文《Training Compute-Optimal Large Language Models》通过构建的 Chinchilla 模型得出了一个结论...

3年前 (2023)