2 月 18 日,DeepSeek 发布了一篇新论文,提出了一种新的注意力机制——NSA。
原标题:文亲自上?创业十多年,DeepSeek梁文峰的“技术男”属性从没改变
文章来源:AI前线
内容字数:9083字
DeepSeek创始人梁文锋:低调的技术天才与“创始人模式”
本文概要介绍了DeepSeek创始人梁文锋及其公司DeepSeek的最新进展,以及其独特的管理模式和技术理念。
NSA注意力机制与DeepSeek的快速发展
DeepSeek团队发布了新的注意力机制NSA,该机制结合了算法创新和硬件适配优化,实现了超快速的长文本训练。NSA在多个基准测试中表现出色,甚至超越了全注意力模型。梁文锋亲自参与编写并上传了该论文,这引起了广泛关注,也体现了他作为技术人的核心地位。
梁文锋:技术人与企业家的融合
文章详细介绍了梁文锋的个人经历,从浙江大学电子信息工程专业毕业,到在艾麒信息担任部门经理,再到创立幻方量化并最终创立DeepSeek。他始终保持着对技术的热情和追求,并将技术理念贯穿于量化投资和AI领域的发展中。他被外界冠以企业家、投资人等标签,但他更重要的身份是技术人,这从他亲自参与代码建设和技术研发中可见一斑。
“创始人模式”与DeepSeek的扁平化管理
梁文锋的管理风格体现了“创始人模式”,他亲自参与解决问题,了解每个岗位的需求,高效配置资源。DeepSeek采用扁平化管理结构,给予员工充分的信任和度,鼓励自主决策和知识共享。这种模式在《DeepSeek-V3 Technical Report》论文的贡献者名单中得到了体现,长达两页的名单包含了大量的研发工程师、数据标注人员和商务人员,这在其他论文中是罕见的。DeepSeek的“员工可以用卡”的资源调配方式,也为其他公司提供了宝贵的参考。
人才招聘与团队文化
DeepSeek的招聘注重候选人的热爱和扎实的基础能力,而非项目经验。这吸引了一批高水平的算法人才,他们对技术充满热情,并在春节期间依然积极投入工作。DeepSeek的面试过程也体现了对专业技术的重视,面试官会深入考察候选人的思维方式和技术能力。
DeepSeek的未来发展
文章最后探讨了DeepSeek未来的发展方向,以及梁文锋是否会继续深入研发细节,还是转向宏观战略规划的问题。这将有待时间来解答。文章也提及了DeepSeek系列直播,将进一步解析其技术突破、商业化路径和行业影响。
联系作者
文章来源:AI前线
作者微信:
作者简介:面向AI爱好者、开发者和科学家,提供大模型最新资讯、AI技术分享干货、一线业界实践案例,助你全面拥抱AIGC。