揭秘 OpenR:首个类 o1 开源推理框架,增强大型语言模型复杂推理能力

揭秘 OpenR:首个类 o1 开源推理框架,增强大型语言模型复杂推理能力

AIGC动态欢迎阅读

原标题:揭秘 OpenR:首个类 o1 开源推理框架,增强大型语言模型复杂推理能力
关键字:模型,步骤,报告,过程,数据
文章来源:AI科技评论
内容字数:0字

内容摘要:


OpenR 研究团队成员包括:汪军教授,伦敦大学学院(UCL)计算机系教授,阿兰・图灵研究所 Turing Fellow,其指导的 UCL 一年级博士生宋研。利物浦大学助理教授方蒙。上海交通大学 Apex 和多智能体实验室张伟楠教授(上海交通大学计算机系教授、博士生导师、副系主任),温颖副教授(上海交通大学约翰・霍普克罗夫特计算机科学中心副教授)以及其指导的博士生万梓煜、温睦宁、朱家琛。张伟楠教授和温颖副教授博士期间就读于 UCL,指导教师为汪军教授。香港科技大学(广州)创校校长,倪明选(Lionel M. Ni),香港工程科学院院士,香港科技大学(广州)讲席教授。陈雷,香港科技大学(广州)信息枢纽院长,讲席教授。香港科技大学(广州)一年级博士生刘安杰、龚子钦受汪军教授和杨林易博士联合执导,以及西湖大学工学院助理教授(研究)杨林易。o1 作为 OpenAI 在推理领域的最新模型,大幅度提升了 GPT-4o 在推理任务上的表现,甚至超过了平均人类水平。o1 背后的技术到底是什么?OpenAI 技术报告中所强调的强化学习和推断阶段的 Scaling Law 如何实现?
为了尝试回答这些问题


原文链接:揭秘 OpenR:首个类 o1 开源推理框架,增强大型语言模型复杂推理能力

联系作者

文章来源:AI科技评论
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...