o1研发团队首次集体访谈：教AI数r用了一年半

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：o1研发团队首次集体访谈：教AI数r用了一年半
关键字：模型,问题,发现,工作,范式
文章来源：量子位
内容字数：0字

内容摘要：

克雷西明敏发自凹非寺量子位 | 公众号 QbitAI笑死，原来o1也像人类一样喜欢赶ddl。
这是在o1团队的“大型见面会”上，OpenAI创始成员Wojciech Zaremba揭开的o1“黑历史”。
包括Zaremba在内的18名团队成员，在首席研究官Bob McGrew的带领之下围坐一团。
o1核心贡献者Hyung Won Chung、Noam Brown等关键人物，也都在此列。
随着成员们的踊跃发言，o1的发展历程也逐渐被揭开——受AlphaGo和早期GPT模型的启发，想到了将两张背后的范式结合。
后来，团队训练出了第一个可以生成连贯思维链的模型，标志着研究方向开始逐渐明朗和聚焦……
在充满松弛感的气氛当中，众人还分享了有关o1研发的许多趣事：
在OpenAI内部，也喜欢用“数r”来测试大模型能力
为了解决“数r”的问题，OpenAI花费了一年半
技术人员会把代错信息直接丢给o1去debug
o1曾经说过，生命的意义是“42”，还试图用代数来定义“love”
同时在研究过程中他们还发现，o1不仅比人类更善于发现新的CoT推理步骤，并且还涌现出了自我批评能力。
有网友称

原文链接：o1研发团队首次集体访谈：教AI数r用了一年半