李飞飞DeepMind全新「代码链」碾压CoT！大模型用Python代码推理，性能暴涨12%

AIGC动态3年前 (2023)发布新智元

AIGC动态欢迎阅读

原标题：李飞飞DeepMind全新「代码链」碾压CoT！大模型用Python代码推理，性能暴涨12%
关键字：代码,模型,任务,研究人员,语义
文章来源：新智元
内容字数：6117字

内容摘要：

新智元报道编辑：桃子
【新智元导读】激发大模型解决复杂问题的重要技术之一CoT，如今要被颠覆了？谷歌DeepMind斯坦福UC伯克利共同提出了「代码链」（CoC），让LLM在代码中学会了思考。思维链（CoT），最具开拓性和影响力的提示工程技术之一，能增强LLM在推理决策中的表现。
那么，如果大模型可以在代码中「思考」，会如何呢？
最近，谷歌DeepMind、斯坦福、UC伯克利团队联手提出了全新技术——「代码链」（CoC）。
论文地址：https://arxiv.org/pdf/2312.04474.pdf
「代码链」是一种将编码逻辑与自然语言理解相结合，简单却非常有效的创新方法，能够提升LLM基于代码的推理能力，让其更智能、更通用。
再通俗点讲，CoC允许LLM生成「伪代码」来分解难题，通过LMulator执行有效代码，模拟无效代码。
研究结果显示，在BIG-Bench Hard基准上，CoC实现了84%的准确率，比CoT提高了12%。
另外，在BIG-Bench Hard的23项任务中，CoC在18项任务中超过了人类的平均表现。
看得出，「代码链」将CoT向前推进了一步，并将生成用

原文链接：李飞飞DeepMind全新「代码链」碾压CoT！大模型用Python代码推理，性能暴涨12%