六问 DeepSeek!
原标题:开源大模型 DeepSeek 到底开放了什么?
文章来源:人工智能学家
内容字数:11038字
DeepSeek开源大模型深度解析:开放程度、许可证及合规性
本文深入探讨了DeepSeek开源大模型的开源程度、许可证类型及其合规性问题。DeepSeek作为一款性能媲美闭源大模型的开源项目,其开源策略备受关注。
1. DeepSeek的性能与版本迭代
DeepSeek经历了V2、V2.5、V3、R1-Zero、R1等多个版本迭代。其中,V3版本在多个基准测试中展现出优异性能,甚至与领先的闭源模型相媲美。R1版本则通过强化学习而非监督微调提升了模型能力,在部分测试项中超越了OpenAI的o1模型。
2. DeepSeek的开源许可证
DeepSeek在Hugging Face平台上开放了68个模型和一个数据集。其中,DeepSeek-R1和DeepSeek-R1-Zero模型采用MIT许可证,其余模型则采用DeepSeek许可证(代码部分仍为MIT许可证)。此外,DeepSeek还基于Qwen和Llama模型蒸馏出6个模型,其许可证分别为MIT、Apache 2.0和Llama许可证。
3. DeepSeek的开放层级
根据LF AI&Data基金会的模型开放框架(MOF),DeepSeek的开放层级尚未达到最高级别。DeepSeek开放了模型架构、模型卡、模型参数、技术报告和评估结果等,但并未开放训练代码、推理代码、评估代码和数据集等关键组件。
4. DeepSeek的使用和分发限制
除R1系列模型外,其他DeepSeek模型受DeepSeek许可证约束,该许可证基于负责任人工智能许可证(RAIL)设计,包含诸多使用限制,例如禁止用于军事用途、生成虚假信息、歧视特定群体等。而MIT许可证下的R1模型则没有这些限制。值得注意的是,DeepSeek许可证中明确指出数据未获得许可。
5. DeepSeek的知识产权许可
DeepSeek许可证授予用户永久、全球、非排他、免费、免版税、不可撤销的版权和专利许可(专利许可存在例外情况)。这些条款与常见的Apache 2.0许可证类似。
6. DeepSeek模型的分发条件
分发DeepSeek模型需遵守多项条件,包括将使用限制纳入法律协议、提供DeepSeek许可证副本、保留版权声明等。未遵守这些条件将构成违约或侵权。
7. 蒸馏模型的额外限制
使用DeepSeek基于Qwen和Llama蒸馏的模型,除了需满足MIT许可证外,还需遵守Qwen的Apache 2.0许可证和Llama许可证,后者包含商业使用限制。
8. DeepSeek的合规性问题
DeepSeek自身可能并未完全遵守其引用的开源许可证,例如未在所有模型分发材料中附带许可证副本,未充分履行署名义务等。这并不意味着使用者可以忽视许可证要求,反而更应严格遵守,以促进负责任的人工智能发展。
总而言之,DeepSeek的开源策略是复杂且多面的。虽然其模型性能出色,但其开源程度和许可证合规性仍需进一步完善。使用者和分发者都应认真理解并遵守相关许可证条款,共同构建负责任的人工智能生态。
联系作者
文章来源:人工智能学家
作者微信:
作者简介:致力成为权威的人工智能科技媒体和前沿科技研究机构