李飞飞DeepMind全新「代码链」碾压CoT!大模型用Python代码推理,性能暴涨12%

AIGC动态9个月前发布 新智元
24 0 0

李飞飞DeepMind全新「代码链」碾压CoT!大模型用Python代码推理,性能暴涨12%

AIGC动态欢迎阅读

原标题:李飞飞DeepMind全新「代码链」碾压CoT!大模型用Python代码推理,性能暴涨12%
关键字:代码,模型,任务,研究人员,语义
文章来源:新智元
内容字数:6117字

内容摘要:


新智元报道编辑:桃子
【新智元导读】激发大模型解决复杂问题的重要技术之一CoT,如今要被颠覆了?谷歌DeepMind斯坦福UC伯克利共同提出了「代码链」(CoC),让LLM在代码中学会了思考。思维链(CoT),最具开拓性和影响力的提示工程技术之一,能增强LLM在推理决策中的表现。
那么,如果大模型可以在代码中「思考」,会如何呢?
最近,谷歌DeepMind、斯坦福、UC伯克利团队联手提出了全新技术——「代码链」(CoC)。
论文地址:https://arxiv.org/pdf/2312.04474.pdf
「代码链」是一种将编码逻辑与自然语言理解相结合,简单却非常有效的创新方法,能够提升LLM基于代码的推理能力,让其更智能、更通用。
再通俗点讲,CoC允许LLM生成「伪代码」来分解难题,通过LMulator执行有效代码,模拟无效代码。
研究结果显示,在BIG-Bench Hard基准上,CoC实现了84%的准确率,比CoT提高了12%。
另外,在BIG-Bench Hard的23项任务中,CoC在18项任务中超过了人类的平均表现。
看得出,「代码链」将CoT向前推进了一步,并将生成用


原文链接:李飞飞DeepMind全新「代码链」碾压CoT!大模型用Python代码推理,性能暴涨12%

联系作者

文章来源:新智元
作者微信:AI_era
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...