马斯克突发Grok 1.5！上下文长度至128k、HumanEval得分超GPT-4

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：马斯克突发Grok 1.5！上下文长度至128k、HumanEval得分超GPT-4
关键字：腾讯,得分,能力,上下文,模型
文章来源：量子位
内容字数：2957字

内容摘要：

丰色西风发自凹非寺量子位 | 公众号 QbitAI就在刚刚，马斯克Grok大模型宣布重大升级。
难怪之前突然开源了Grok-1，因为他有更强的Grok-1.5了，主打推理能力。
来自xAI的官方推送啥也没说，直接甩链接。主打一个“字少事大”
新版本Grok有啥突破？
一是上下文长度飙升，从8192增长到128k，和GPT-4齐平。
二是推理性能大幅提升，数学能力直接涨点50%之多、HumanEval数据集上得分超过GPT-4。
消息一出，评论区立刻就躁起来了。
具体跑分结果如何，咱们立马来看。
Grok-1.5来了首先，对于上下文窗口。
这次是一把直接提升到之前的16倍，来到128k量级。
这也就意味着Grok可以处理更长和更复杂的提示，同时保持其遵循指令的能力。
在“大海捞针”（NIAH）测试中，Grok-1.5在128K token的上下文中完美检索嵌入的文本。
整个图一水儿的蓝色（100%的检索深度）：
其次，推理方面。
Grok-1.5处理编程和数学相关任务的能力大幅提升，全面超越Grok-1、Mistral Large、Claude 2。
数学方面，Grok-1.5在M

原文链接：马斯克突发Grok 1.5！上下文长度至128k、HumanEval得分超GPT-4