马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4

AIGC动态6个月前发布 量子位
6 0 0

马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4

AIGC动态欢迎阅读

原标题:马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分GPT-4
关键字:腾讯,得分,能力,上下文,模型
文章来源:量子位
内容字数:2957字

内容摘要:


丰色 西风 发自 凹非寺量子位 | 公众号 QbitAI就在刚刚,马斯克Grok大模型宣布重大升级。
难怪之前突然开源了Grok-1,因为他有更强的Grok-1.5了,主打推理能力。
来自xAI的官方推送啥也没说,直接甩链接。主打一个“字少事大”
新版本Grok有啥突破?
一是上下文长度飙升,从8192增长到128k,和GPT-4齐平。
二是推理性能大幅提升,数学能力直接涨点50%之多、HumanEval数据集上得分超过GPT-4。
消息一出,评论区立刻就躁起来了。
具体跑分结果如何,咱们立马来看。
Grok-1.5来了首先,对于上下文窗口。
这次是一把直接提升到之前的16倍,来到128k量级。
这也就意味着Grok可以处理更长和更复杂的提示,同时保持其遵循指令的能力。
在“大海捞针”(NIAH)测试中,Grok-1.5在128K token的上下文中完美检索嵌入的文本。
整个图一水儿的蓝色(100%的检索深度):
其次,推理方面。
Grok-1.5处理编程和数学相关任务的能力大幅提升,全面超越Grok-1、Mistral Large、Claude 2。
数学方面,Grok-1.5在M


原文链接:马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...