AIGC动态欢迎阅读
原标题:一文看懂LLM推理,UCL汪军教授解读OpenAI ο1的相关方法
关键字:模型,步骤,过程,策略,方法
文章来源:机器之心
内容字数:0字
内容摘要:
机器之心报道
机器之心编辑部OpenAI 最近发布的 o1 系列模型堪称迈向强人工智能的一次飞跃,其强大的推理能力为我们描绘出了下一代人工智能模型的未来图景。近日,伦敦大学学院(UCL)人工智能中心汪军教授撰写了一份「LLM 推理教程」,深入详细地介绍了 OpenAI ο1 模型背后的相关方法。
他将在 10 月 12 号本周星期六早上于香港科技大学(广州)RLChina 2024 大会(http://rlchina.org/rlchina_2024/)上作相关内容的主题报告,并发布其团队开发的 LLM 推理开源框架以推动 o1 相关模型的发展。链接:https://github.com/openreasoner/openr/blob/main/reports/Tutorial-LLM-Reasoning-Wang.pdf
o1 的训练使用了强化学习技术,通过显式地嵌入一个原生「思维链」(NCoT)过程,可出色地完成复杂的推理任务。也就是说,o1 在生成响应之前可通过一步步地推理实现「深度思考」。
从 OpenAI 发布的数据看,相比于之前的 ChatGPT 4o,o1 在数学和编程任
原文链接:一文看懂LLM推理,UCL汪军教授解读OpenAI ο1的相关方法
联系作者
文章来源:机器之心
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...