AIGC动态

日本 AI 公司发布自适应大模型,可动态调整其权重以完成各种任务

在人工智能领域,适应性的概念具有类似的吸引力。
阅读原文

微软官宣All in智能体,SWE Agent首曝光!奥特曼预警2025编程巨变

原标题:微软官宣All in智能体,SWE Agent首曝光!奥特曼预警2025编程巨变 文章来源:新智元 内容字数:7441字AI智能体引领软件工程变革:2025年,代码将由AI...
阅读原文

架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练

原标题:架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练 文章来源:新智元 内容字数:1652字国产AI芯片新突破:清微智能RPU助力大模型高效运行 ...
阅读原文

英伟达联手MIT清北发布SANA 1.5!线性扩散Transformer再刷文生图新SOTA

原标题:英伟达联手MIT清北发布SANA 1.5!线性扩散Transformer再刷文生图新SOTA 文章来源:新智元 内容字数:7982字SANA 1.5:高效可扩展的文本生成图像模型 ...
阅读原文

华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

自我反思(尤其是肤浅的)有时对模型性能的助益不大。
阅读原文

将集体学习引入树搜索,新方法CoMCTS实现o1-like的推理与反思

新学习推理方法:集体蒙特卡罗树搜索(Collective Monte Carlo Tree Search, CoMCTS)
阅读原文

我不幸得了一个“四川病”

原标题:我不幸得了一个“四川病” 文章来源:JioNLP 内容字数:12298字独家揭秘:你怎么知道AI模型训练完了? 本文将对“你怎么知道AI模型训练完了?”这一问题...
阅读原文

《哪吒2》登顶中国影史票房冠军/iPhone SE 4 有望于下周发布/DeepSeek 首次公开辟谣

· 雷军回应小米 SU7 Ultra「金车标」\x0a· 华为 ModelEngine 宣布支持 DeepSeek 全系列本地部署\x0a· 李飞飞团队新推理模型云计算费用不到 50 美元
阅读原文

OpenAI 开放“版”推理过程,效果被 DeepSeek 碾压成渣

原标题:OpenAI 开放“阉割版”推理过程,效果被 DeepSeek 碾压成渣 文章来源:AI范儿 内容字数:2992字OpenAI 与 DeepSeek 的 AI 模型之争:思维链可视化的博...
阅读原文

DeepSeek无问西东!先行者早已趟平全国产之路

“通用人工智能是一场需要聚精会神的长跑”
阅读原文