LLM的范式转移：RL带来新的 Scaling Law

AIGC动态2年前 (2024)发布智猩猩AGI

AIGC动态欢迎阅读

原标题：LLM的范式转移：RL带来新的 Scaling Law
关键字：模型,报告,范式,领域,数据
文章来源：智猩猩AGI
内容字数：0字

内容摘要：

9月6-7日，智猩猩发起主办的2024全球AI芯片峰会将在北京辽宁大厦盛大举行。峰会设有开幕式、数据中心AI芯片专场、AI芯片架构创新专场、边缘/端侧AI芯片专场、智算集群技术论坛、Chiplet关键技术论坛、中国RISC-V计算芯片创新论坛。目前，终极议程已公布，50+位来自AI芯片、Chiplet、RISC-V、智算集群与AI Infra系统软件等领域的嘉宾，将带来报告、演讲、高端对话和圆桌Panel。扫名或购票～从几周前 Sam Altman 在 X 上发布草莓照片开始，整个行业都在期待 OpenAI 发布新模型。根据 The information 的报道，Strawberry 就是之前的 Q-star，其合成数据的方大幅提升 LLM 的智能推理能力，尤其体现在数学解题、解字谜、代码生成等复杂推理任务。这个方法也会用在 GPT 系列的提升上，帮助 OpenAI 新一代 Orion。
OpenAI 不是唯一重视 RL 和 Self-Play 的公司，Google 用 AlphaGeometry 2 + Alphaproof 夺得 IMO 银牌之后，基于 LLM 做 rew

原文链接：LLM的范式转移：RL带来新的 Scaling Law