一文回顾o1模型中CoT推理及其发展

AIGC动态2年前 (2024)发布智猩猩GenAI

一文回顾o1模型中CoT推理及其发展

AIGC动态欢迎阅读

原标题：一文回顾o1模型中CoT推理及其发展
关键字：模型,示例,提示,步骤,问题
文章来源：智猩猩GenAI
内容字数：0字

内容摘要：

大会预告12月5日-6日，2024中国生成式AI大会（上海站）将举办。上海科大助理教授、博导顾家远，腾讯优图实验室天衍研究中心负责人吴贤，银河通用机器人合伙人张直政，趣丸科技副总裁贾朔，旷视研究院高级研究员李华东已确认参会，将围绕大模型、具身智能、AI视频生成带来分享，欢迎报名。LLM（大语言模型）或许已经深入读者你生活的方方面面，但不可否认的是，LLM自身的不可解释性和易产生幻觉等问题，使我们难以信任LLM生成的回答。同时，在强逻辑推断、数学推断等问题上，LLM的能力往往远不及普通人类。但Openai o1模型的发布似乎让这一切有了些许转变。今天我们通过简要介绍几篇里程碑式的论文及其局限性，来盘一盘o1模型中起重要作用的CoT（思维链）的前世今生，让大家更深入地理解这项技术。
首先我觉得需要澄清的是，CoT 并不是指某个或某类具体的技术，而是一种引导模型解决复杂问题的方。思维链的概念是由 Google 在 NIPS 2022 的论文 “Chain-of-Thought Prompting Elicits Reasoning in Large Language Models[1]”

原文链接：一文回顾o1模型中CoT推理及其发展