AIGC动态欢迎阅读
原标题:迈向复现 OpenAI o1 的一小步:Steiner 开源模型阶段性进展报告
关键字:模型,知乎,侵权,数据,线性
文章来源:智猩猩GenAI
内容字数:0字
内容摘要:
讲座预告11月1日上午10点,南开大学在读博士李森茂,将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解,欢迎扫码报名~导读作者为季逸超
原文来自知乎,地址:https://zhuanlan.zhihu.com/p/2340089725
本文只做学术/技术分享,如有侵权,联系删文。从 OpenAI o1 发布以来,我就把复现 o1 作为业余时间的兴趣项目,其过程中获得了很多有趣的知识与洞察 (与失败)。考虑到个人能力、精力、财力有限,我很可能不是走到最后的选手,因此我觉得很有必要将这些价值数十张 H100 的经验及时分享出来。本文算是这系列文章的第二篇。
本文的英文版同步发表于:https://medium.com/@peakji/a-small-step-towards-reproducing-openai-o1-b9a756a00855
01TL;DRSteiner 是一个 reasoning 模型,能在推理时以自回归的形式探索多种路径,并在必要时自主进行验证或回溯。训练过程分为三个步骤:首先,通过随机截断合成的 reasoning path 并进行引导式再补全,将每个样本
原文链接:迈向复现 OpenAI o1 的一小步:Steiner 开源模型阶段性进展报告
联系作者
文章来源:智猩猩GenAI
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...