AIGC动态
千万不要尝试 Qwen2.5-Max,你会因此忘掉 DeepSeek V3
原标题:千万不要尝试 Qwen2.5-Max,你会因此忘掉 DeepSeek V3 文章来源:夕小瑶科技说 内容字数:5912字阿里云通义千问Qwen2.5-Max强势崛起,挑战DeepSeek V...
“李飞飞团队 50 美元炼出 DeepSeek R1”被质疑,上海交大本科生新“低成本推理”或成新宠!
近日,“李飞飞等斯坦福大学和华盛顿大学的研究人员以不到 50 美元的云计算费用,成功训练出了一个名为 s1 的人工智能推理模型”的消息引起了很多人关注。
微软官宣All in智能体,SWE Agent首曝光!奥特曼预警2025编程巨变
原标题:微软官宣All in智能体,SWE Agent首曝光!奥特曼预警2025编程巨变 文章来源:新智元 内容字数:7441字AI智能体引领软件工程变革:2025年,代码将由AI...
架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练
原标题:架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练 文章来源:新智元 内容字数:1652字国产AI芯片新突破:清微智能RPU助力大模型高效运行 ...
英伟达联手MIT清北发布SANA 1.5!线性扩散Transformer再刷文生图新SOTA
原标题:英伟达联手MIT清北发布SANA 1.5!线性扩散Transformer再刷文生图新SOTA 文章来源:新智元 内容字数:7982字SANA 1.5:高效可扩展的文本生成图像模型 ...
将集体学习引入树搜索,新方法CoMCTS实现o1-like的推理与反思
新学习推理方法:集体蒙特卡罗树搜索(Collective Monte Carlo Tree Search, CoMCTS)
我不幸得了一个“四川病”
原标题:我不幸得了一个“四川病” 文章来源:JioNLP 内容字数:12298字独家揭秘:你怎么知道AI模型训练完了? 本文将对“你怎么知道AI模型训练完了?”这一问题...