来了!DeepSeek 开源 Day 2,DeepEP 再掀 AI 通信,实在是太 Open了!

来了!DeepSeek 开源 Day 2,DeepEP 再掀 AI 通信革命!\x0a\x0a昨天 DeepSeek AI 刚刚用 FlashMLA 炸了第一波,今天的 DeepEP 更是直接冲着大规模 AI 训练和...
阅读原文

没想到!Claude 3.7 Sonnet 深夜上线,可以免费使用!

这波操作简直是“人在家中坐,喜从天上来”——不少小伙伴估计直接当场“实名羡慕”了。
阅读原文

刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!

模型层优化MoE之外,算力基础设施也一起升级
阅读原文

2025 WAIC 云帆奖开启全球报名:集青年之智共铸 AGI 未来

期待你的加入,以青年之智,丈量 AGI 的无限可能。
阅读原文

仅靠逻辑题,AI数学竞赛能力飙升!微软、九坤投资:7B小模型也能逼近o3-mini

在完全未见过的美国数学奥林匹克(AIME)测试中,该模型的推理性能提升了125%!
阅读原文

突发!Anthropic发布Claude 3.7 Sonnet:首个混合推理模型,编程能力全面领先

原标题:突发!Anthropic发布Claude 3.7 Sonnet:首个混合推理模型,编程能力全面领先 文章来源:科技未来派 内容字数:2590字Anthropic发布Claude 3.7 Sonne...
阅读原文

苹果新系统「HomeOS」曝光/小米「双 Ultra」发布会定档/余承东:华为新形态手机 3 月见

· 英伟达承认部分 RTX50 显卡性能缺陷\x0d\x0a· 京东:承担外卖骑手五险一金的所有成本\x0d\x0a· 哪吒汽车:从未向《哪吒 2》索赔或起诉
阅读原文

官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug

原标题:官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug 文章来源:新智元 内容字数:4357字Sakana AI的“AI CUDA工程师”:100倍...
阅读原文

刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1

原标题:刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1 文章来源:新智元 内容字数:9092字Anthropic发布Claude 3.7 Sonnet:混合...
阅读原文

LLM自学成才变身「预言家」!预测未来能力大幅提升

原标题:LLM自学成才变身「预言家」!预测未来能力大幅提升 文章来源:新智元 内容字数:6008字LLM预测未来:无需人工数据,也能精准预测 近来,大型语言模...
阅读原文

LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60%

原标题:LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60% 文章来源:新智元 内容字数:4289字Meta新方法RIP:进化算法赋能,提升大模型训练数...
阅读原文

Anthropic 首个“混合推理”模型详细拆解

原标题:Anthropic 首个“混合推理”模型详细拆解 文章来源:AI范儿 内容字数:1925字Claude 3.7 Sonnet:一次重大的AI升级 本文总结了Anthropic公司最新发布...
阅读原文

佬教你让 deepseek 支持文生图

原标题:佬教你让 deepseek 支持文生图 文章来源:AI使用技巧 内容字数:1242字利用现有AI工具实现文生图:DeepSeek的巧妙变通 最近,一个名为“DeepSeek”的A...
阅读原文