一文回顾o1模型中CoT推理及其发展

一文回顾o1模型中CoT推理及其发展

AIGC动态欢迎阅读

原标题:一文回顾o1模型中CoT推理及其发展
关键字:模型,示例,提示,步骤,问题
文章来源:智猩猩GenAI
内容字数:0字

内容摘要:


大会预告12月5日-6日,2024中国生成式AI大会(上海站)将举办。上海科大助理教授、博导顾家远,腾讯优图实验室天衍研究中心负责人吴贤,银河通用机器人合伙人张直政,趣丸科技副总裁贾朔,旷视研究院高级研究员李华东已确认参会,将围绕大模型、具身智能、AI视频生成带来分享,欢迎报名。LLM(大语言模型)或许已经深入读者你生活的方方面面,但不可否认的是,LLM自身的不可解释性和易产生幻觉等问题,使我们难以信任LLM生成的回答。同时,在强逻辑推断、数学推断等问题上,LLM的能力往往远不及普通人类。但Openai o1模型的发布似乎让这一切有了些许转变。今天我们通过简要介绍几篇里程碑式的论文及其局限性,来盘一盘o1模型中起重要作用的CoT(思维链)的前世今生,让大家更深入地理解这项技术。
首先我觉得需要澄清的是,CoT 并不是指某个或某类具体的技术,而是一种引导模型解决复杂问题的方法论。思维链的概念是由 Google 在 NIPS 2022 的论文 “Chain-of-Thought Prompting Elicits Reasoning in Large Language Models[1]”


原文链接:一文回顾o1模型中CoT推理及其发展

联系作者

文章来源:智猩猩GenAI
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...