DeepEP

DeepEP 是 DeepSeek 开源的首个专为混合专家模型(MoE)训练和推理设计的开源 EP(专家并行)通信库。提供了高吞吐量和低延迟的全对全 GPU 内核,支持节点内...
阅读原文

QwQ-Max

QwQ-Max是阿里巴巴基于Qwen2.5-Max推出的深度推理模型,是 Qwen 系列的一部分。QwQ-Max-Preview作为预览版本推出,QwQ-Max即将正式发布并全面开源。QwQ-Max专...
阅读原文

FantasyID

FantasyID 是阿里巴巴集团和北京邮电大学推出新型的身份保持视频生成(IPT2V)框架,基于增强人脸知识生成高质量的身份一致视频。FantasyID基于扩散变换器(D...
阅读原文

SigStyle

SigStyle 是吉林大学、南京大学智能科学与技术学院及Adobe推出的新型签名风格迁移框架,支持将单张风格图像中独特的视觉特征(如几何结构、色彩搭配、笔触等...
阅读原文

DeepSeek 等浙大系创业者的组织文化密码是什么?

创新和商业化注定“水火不容”吗?
阅读原文

没想到!Claude 3.7 Sonnet 深夜上线,可以免费使用!

这波操作简直是“人在家中坐,喜从天上来”——不少小伙伴估计直接当场“实名羡慕”了。
阅读原文

来了!DeepSeek 开源 Day 2,DeepEP 再掀 AI 通信,实在是太 Open了!

来了!DeepSeek 开源 Day 2,DeepEP 再掀 AI 通信革命!\x0a\x0a昨天 DeepSeek AI 刚刚用 FlashMLA 炸了第一波,今天的 DeepEP 更是直接冲着大规模 AI 训练和...
阅读原文

2025 WAIC 云帆奖开启全球报名:集青年之智共铸 AGI 未来

期待你的加入,以青年之智,丈量 AGI 的无限可能。
阅读原文

刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!

模型层优化MoE之外,算力基础设施也一起升级
阅读原文

仅靠逻辑题,AI数学竞赛能力飙升!微软、九坤投资:7B小模型也能逼近o3-mini

在完全未见过的美国数学奥林匹克(AIME)测试中,该模型的推理性能提升了125%!
阅读原文