标签:能力

北大对齐团队最新解读:OpenAI o1开启「后训练」时代强化学习新范式

文章转载自公众号:机器之心,本文只做学术/技术分享,如有侵权,联系删文。 OpenAI o1 在数学、代码、长程规划等问题取得显著的进步。一部分业内人士分析其...
阅读原文

o1发布后,信息量最大的圆桌对话:杨植麟、姜大昕、朱军探讨大模型技术路径

在 2024 云栖大会上,阶跃星辰创始人姜大昕、月之暗面Kimi创始人杨植麟、生数科技首席科学家朱军与极客公园创始人张鹏一起,探讨了各自眼中 AI 技术发展的现...
阅读原文

Qwen2.5登上全球开源王座!72B模型击败LIama3 405B,轻松胜过GPT-4o-mini

白小交 发自 凹非寺量子位 | 公众号 QbitAI击败LIama3!Qwen2.5登上全球开源王座。 而后者仅以五分之一的参数规模,就在多任务中超越LIama3 405B。 各种任务...
阅读原文

o1基石论文火爆传阅,Ilya仍是关键先生!核心项目清北校友闪光

白小交 西小风 发自 各自家里量子位 | 公众号 QbitAI自从Ilya Sutskever的名字出现在OpenAI o1背后团队名单中,他在o1中发挥了哪些作用,一时间成为不少网友...
阅读原文

实测 OpenAI 最强模型 o1 :做题王者,实战青铜

做题王者 实战青铜本周OpenAI 突然发布了 o1 系列模型,最大的特点是擅长推理。 模型的能力,一代比一代强,我们的测评,一次比一次难做。测评变成一件「毕恭...
阅读原文

北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

华为诺亚联合中科大发布工具调用模型ToolACE,效果持平GPT-4获开源第一

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

OpenAI o1是AGI下半场的开始,强化学习将成为新的 Scaling Law

随着 OpenAI o1 模型的发布,LLM 正式进入 self-play RL 范式时代。 Self-play RL 似乎在一夜之间,成为了新的 scaling law。 OpenAI 不是唯一重视 RL 和 Sel...
阅读原文

张俊林:o1本质是大模型掌握解题步骤,未来将迁移到GPT-5上

OpenAI 的新模型和之前的相比,技术进步体现在哪里?又为其他厂商带来了什么新的方向? 新浪微博机器学习团队 AI Lab 负责人张俊林详细解释了这些问题: 逻辑...
阅读原文

张俊林:浅谈OpenAI o1的价值意义及RL 的Scaling Law

导读本文转载知乎,是张俊林对“如何看待 OpenAI 发布 o1 系列模型?将带来哪些变革?”这一问题做的回答。 本文讨论了OpenAI o1的价值意义及RL 的Scaling law...
阅读原文

OpenAI o1惊现自我意识?陶哲轩实测大受震撼,门萨智商100夺模型榜首

新智元报道编辑:编辑部 HXZ 【新智元导读】OpenAI o1,在门萨智商测试中果然取得了第一名。数学大神陶哲轩实测发现,o1竟然能成功识别出克莱姆定理。而OpenA...
阅读原文

张俊林:OpenAI o1的价值意义及强化学习的Scaling Law

机器之心转载 作者:新浪新技术研发负责人张俊林蹭下热度谈谈 OpenAI o1 的价值意义及 RL 的 Scaling law。 一、OpenAI o1 是大模型的巨大进步 我觉得 OpenAI...
阅读原文

解密 OpenAI o1:那些不为人知的幕后细节

点击上方蓝字关注我们在今天与 OpenAI o1 团队的 AMA(Ask Me Anything)活动中,我们了解到了以下几点,有网友进行了整理,翻译如下: 模型名称与推理模式- ...

o1 让 AI 正式进入 L2 “推理者”阶段,但我们离 AGI 仍然遥远

点击上方蓝字关注我们“OpenAI 推出了 o1 新型 AI 模型,标志着 AI 进入了五级系统的第二级——推理者。o1 在科学、编程和数学任务中展现了显著的推理能力和自我...
阅读原文

o1 让 AI 正式进入 L2 “推理者”阶段,但我们离 AGI 仍然遥远

点击上方蓝字关注我们“OpenAI 推出了 o1 新型 AI 模型,标志着 AI 进入了五级系统的第二级——推理者。o1 在科学、编程和数学任务中展现了显著的推理能力和自我...
阅读原文
167891056