AIGC动态

DeepSeek 等浙大系创业者的组织文化密码是什么?

创新和商业化注定“水火不容”吗?
阅读原文

仅靠逻辑题,AI数学竞赛能力飙升!微软、九坤投资:7B小模型也能逼近o3-mini

在完全未见过的美国数学奥林匹克(AIME)测试中,该模型的推理性能提升了125%!
阅读原文

刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!

模型层优化MoE之外,算力基础设施也一起升级
阅读原文

2025 WAIC 云帆奖开启全球报名:集青年之智共铸 AGI 未来

期待你的加入,以青年之智,丈量 AGI 的无限可能。
阅读原文

苹果新系统「HomeOS」曝光/小米「双 Ultra」发布会定档/余承东:华为新形态手机 3 月见

· 英伟达承认部分 RTX50 显卡性能缺陷\x0d\x0a· 京东:承担外卖骑手五险一金的所有成本\x0d\x0a· 哪吒汽车:从未向《哪吒 2》索赔或起诉
阅读原文

刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1

原标题:刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1 文章来源:新智元 内容字数:9092字Anthropic发布Claude 3.7 Sonnet:混合...
阅读原文

官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug

原标题:官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug 文章来源:新智元 内容字数:4357字Sakana AI的“AI CUDA工程师”:100倍...
阅读原文

LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60%

原标题:LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60% 文章来源:新智元 内容字数:4289字Meta新方法RIP:进化算法赋能,提升大模型训练数...
阅读原文

LLM自学成才变身「预言家」!预测未来能力大幅提升

原标题:LLM自学成才变身「预言家」!预测未来能力大幅提升 文章来源:新智元 内容字数:6008字LLM预测未来:无需人工数据,也能精准预测 近来,大型语言模...
阅读原文

Anthropic 首个“混合推理”模型详细拆解

原标题:Anthropic 首个“混合推理”模型详细拆解 文章来源:AI范儿 内容字数:1925字Claude 3.7 Sonnet:一次重大的AI升级 本文总结了Anthropic公司最新发布...
阅读原文

Deepseek引发的RAG热潮:一周出demo,半年用不好

原标题:Deepseek引发的RAG热潮:一周出demo,半年用不好 文章来源:JioNLP 内容字数:4575字Deepseek 热潮与 RAG 的七宗罪:中小团队的 AI 部署困境 近年来...
阅读原文

稀疏注意力再添一员,华为诺亚推出高效选择注意力架构ESA

为大模型在长序列任务中的应用带来了新的可能性。
阅读原文