AIGC动态

千万不要尝试 Qwen2.5-Max,你会因此忘掉 DeepSeek V3

原标题:千万不要尝试 Qwen2.5-Max,你会因此忘掉 DeepSeek V3 文章来源:夕小瑶科技说 内容字数:5912字阿里云通义千问Qwen2.5-Max强势崛起,挑战DeepSeek V...
阅读原文

“李飞飞团队 50 美元炼出 DeepSeek R1”被质疑,上海交大本科生新“低成本推理”或成新宠!

近日,“李飞飞等斯坦福大学和华盛顿大学的研究人员以不到 50 美元的云计算费用,成功训练出了一个名为 s1 的人工智能推理模型”的消息引起了很多人关注。
阅读原文

日本 AI 公司发布自适应大模型,可动态调整其权重以完成各种任务

在人工智能领域,适应性的概念具有类似的吸引力。
阅读原文

微软官宣All in智能体,SWE Agent首曝光!奥特曼预警2025编程巨变

原标题:微软官宣All in智能体,SWE Agent首曝光!奥特曼预警2025编程巨变 文章来源:新智元 内容字数:7441字AI智能体引领软件工程变革:2025年,代码将由AI...
阅读原文

架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练

原标题:架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练 文章来源:新智元 内容字数:1652字国产AI芯片新突破:清微智能RPU助力大模型高效运行 ...
阅读原文

英伟达联手MIT清北发布SANA 1.5!线性扩散Transformer再刷文生图新SOTA

原标题:英伟达联手MIT清北发布SANA 1.5!线性扩散Transformer再刷文生图新SOTA 文章来源:新智元 内容字数:7982字SANA 1.5:高效可扩展的文本生成图像模型 ...
阅读原文

华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

自我反思(尤其是肤浅的)有时对模型性能的助益不大。
阅读原文

将集体学习引入树搜索,新方法CoMCTS实现o1-like的推理与反思

新学习推理方法:集体蒙特卡罗树搜索(Collective Monte Carlo Tree Search, CoMCTS)
阅读原文

我不幸得了一个“四川病”

原标题:我不幸得了一个“四川病” 文章来源:JioNLP 内容字数:12298字独家揭秘:你怎么知道AI模型训练完了? 本文将对“你怎么知道AI模型训练完了?”这一问题...
阅读原文