标签:DeepSeek

DeepSeek 开源第二天:DeepEP,AI 训练和推理的超级 “加速器”

原标题:DeepSeek 开源第二天:DeepEP,AI 训练和推理的超级 “加速器” 文章来源:小夏聊AIGC 内容字数:1469字DeepSeek开源再放大招:DeepEP赋能MoE模型,加...
阅读原文

为什么是梁文锋做出了DeepSeek?

一个更清晰的梁文锋,一个更明白的关于DeepSeek的故事。
阅读原文

来了!DeepSeek 开源 Day 2,DeepEP 再掀 AI 通信,实在是太 Open了!

来了!DeepSeek 开源 Day 2,DeepEP 再掀 AI 通信革命!\x0a\x0a昨天 DeepSeek AI 刚刚用 FlashMLA 炸了第一波,今天的 DeepEP 更是直接冲着大规模 AI 训练和...
阅读原文

刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!

模型层优化MoE之外,算力基础设施也一起升级
阅读原文

文末赠书 | 微信、百度都接入的 DeepSeek,企业靠啥玩转其私有化与垂直训练?

在当今数字化转型的浪潮中,大模型技术已然成为企业提升竞争力的关键驱动力。
阅读原文

清华大学《DeepSeek从入门到精通》系列版本,普通人必备的AI手册(附下载地址)

最近,清华大学的AI大神制作了一本超详细的电子书《DeepSeek从入门到精通》,里面把DeepSeek的基础知识和提示词用法讲得通俗易懂,一下子火遍全网! 目前,...
阅读原文

硅基流动:押注国产AI算力,Pre-A轮融资后迎来DeepSeek爆发

原标题:硅基流动:押注国产AI算力,Pre-A轮融资后迎来DeepSeek爆发 文章来源:小夏聊AIGC 内容字数:5558字硅基流动:乘风破浪,AI基础设施领域的“赛博菩萨”...
阅读原文

万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025

Transformer架构的非递归设计阻碍了跨层的记忆共享,或限制模型泛化能力。
阅读原文

文亲自上?创业十多年,DeepSeek梁文峰的“技术男”属性从没改变

2 月 18 日,DeepSeek 发布了一篇新论文,提出了一种新的注意力机制——NSA。
阅读原文

西安交大满血版Deepseek上线!

可快速创建多种智能体。
阅读原文

DeepSeek引发鲶鱼效应,中国算力市场呈现“四变”

这个AI领域千亿级市场,将辐射千家万户。
阅读原文

刚刚,DeepSeek又发高质量论文,梁文锋合著!

这篇论文的第一作者在实习期间完成了研究。
阅读原文