揭秘 OpenR：首个类 o1 开源推理框架，增强大型语言模型复杂推理能力

AIGC动态2年前 (2024)发布 AI科技评论

AIGC动态欢迎阅读

原标题：揭秘 OpenR：首个类 o1 开源推理框架，增强大型语言模型复杂推理能力
关键字：模型,步骤,报告,过程,数据
文章来源：AI科技评论
内容字数：0字

内容摘要：

OpenR 研究团队成员包括：汪军教授，伦敦大学学院（UCL）计算机系教授，阿兰・图灵研究所 Turing Fellow，其指导的 UCL 一年级博士生宋研。利物浦大学助理教授方蒙。上海交通大学 Apex 和多智能体实验室张伟楠教授（上海交通大学计算机系教授、博士生导师、副系主任），温颖副教授（上海交通大学约翰・霍普克罗夫特计算机科学中心副教授）以及其指导的博士生万梓煜、温睦宁、朱家琛。张伟楠教授和温颖副教授博士期间就读于 UCL，指导教师为汪军教授。香港科技大学（广州）创校校长，倪明选（Lionel M. Ni），香港工程科学院院士，香港科技大学（广州）讲席教授。陈雷，香港科技大学（广州）信息枢纽院长，讲席教授。香港科技大学（广州）一年级博士生刘安杰、龚子钦受汪军教授和杨林易博士联合执导，以及西湖大学工学院助理教授（研究）杨林易。o1 作为 OpenAI 在推理领域的最新模型，大幅度提升了 GPT-4o 在推理任务上的表现，甚至超过了平均人类水平。o1 背后的技术到底是什么？OpenAI 技术报告中所强调的强化学习和推断阶段的 Scaling Law 如何实现？
为了尝试回答这些问题

原文链接：揭秘 OpenR：首个类 o1 开源推理框架，增强大型语言模型复杂推理能力