秒杀700亿Llama 2!最新国产大模型亮相,无需申请即可免费商用,背后公司来自私募巨头

AIGC动态11个月前发布 量子位
24 0 0

秒杀700亿Llama 2!最新国产大模型亮相,无需申请即可免费商用,背后公司来自私募巨头

AIGC动态欢迎阅读

原标题:秒杀700亿Llama 2!最新国产大模型亮相,无需申请即可免费商用,背后公司来自私募巨头

关键字:模型,能力,参数,数学,版本

文章来源:量子位

内容字数:3989字

内容摘要:丰色 发自 凹非寺量子位 | 公众号QbitAI国产大模型刚刚出了一位全新选手:参数670亿的DeepSeek。它在近20个中英文的公开评测榜单上直接超越了同量级、700亿的Llama 2。并尤其以推理、数学和编码能力为突出。其中在数学能力上,它测了Grok刚刚参与过的匈牙利今年最新的高中数学考试题,得了65分。对比Grok当时公布的成绩:59分,以及GPT-4的68分,表现十分出色。DeepSeek主打一个发布即开源:共包含70亿和670亿两个参数版本,每个版本均含基础模型和指令微调模型,无需申请,即可免费商用。同时,它已开放了全面内测,注册一下就能玩。Ps. DeepSeek的中文能力在GPT-3.5之上,可以使用中文进行测试。在推特上,DeepSeek也引起了一大批技术同行的关注:早期测试过的人表示没毛病。还有人赞誉DeepSeek弥补了开源LLM在数学和编码上的短板。那么,Deep…

原文链接:点此阅读原文:秒杀700亿Llama 2!最新国产大模型亮相,无需申请即可免费商用,背后公司来自私募巨头

联系作者

文章来源:量子位

作者微信:QbitAI

作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...