标签:能力

Qwen2.5登上全球开源王座!72B模型击败LIama3 405B,轻松胜过GPT-4o-mini

白小交 发自 凹非寺量子位 | 公众号 QbitAI击败LIama3!Qwen2.5登上全球开源王座。 而后者仅以五分之一的参数规模,就在多任务中超越LIama3 405B。 各种任务...
阅读原文

o1基石论文火爆传阅,Ilya仍是关键先生!核心项目清北校友闪光

白小交 西小风 发自 各自家里量子位 | 公众号 QbitAI自从Ilya Sutskever的名字出现在OpenAI o1背后团队名单中,他在o1中发挥了哪些作用,一时间成为不少网友...
阅读原文

实测 OpenAI 最强模型 o1 :做题王者,实战青铜

做题王者 实战青铜本周OpenAI 突然发布了 o1 系列模型,最大的特点是擅长推理。 模型的能力,一代比一代强,我们的测评,一次比一次难做。测评变成一件「毕恭...
阅读原文

北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

华为诺亚联合中科大发布工具调用模型ToolACE,效果持平GPT-4获开源第一

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

OpenAI o1是AGI下半场的开始,强化学习将成为新的 Scaling Law

随着 OpenAI o1 模型的发布,LLM 正式进入 self-play RL 范式时代。 Self-play RL 似乎在一夜之间,成为了新的 scaling law。 OpenAI 不是唯一重视 RL 和 Sel...
阅读原文

张俊林:o1本质是大模型掌握解题步骤,未来将迁移到GPT-5上

OpenAI 的新模型和之前的相比,技术进步体现在哪里?又为其他厂商带来了什么新的方向? 新浪微博机器学习团队 AI Lab 负责人张俊林详细解释了这些问题: 逻辑...
阅读原文

张俊林:浅谈OpenAI o1的价值意义及RL 的Scaling Law

导读本文转载知乎,是张俊林对“如何看待 OpenAI 发布 o1 系列模型?将带来哪些变革?”这一问题做的回答。 本文讨论了OpenAI o1的价值意义及RL 的Scaling law...
阅读原文

OpenAI o1惊现自我意识?陶哲轩实测大受震撼,门萨智商100夺模型榜首

新智元报道编辑:编辑部 HXZ 【新智元导读】OpenAI o1,在门萨智商测试中果然取得了第一名。数学大神陶哲轩实测发现,o1竟然能成功识别出克莱姆定理。而OpenA...
阅读原文

张俊林:OpenAI o1的价值意义及强化学习的Scaling Law

机器之心转载 作者:新浪新技术研发负责人张俊林蹭下热度谈谈 OpenAI o1 的价值意义及 RL 的 Scaling law。 一、OpenAI o1 是大模型的巨大进步 我觉得 OpenAI...
阅读原文

解密 OpenAI o1:那些不为人知的幕后细节

点击上方蓝字关注我们在今天与 OpenAI o1 团队的 AMA(Ask Me Anything)活动中,我们了解到了以下几点,有网友进行了整理,翻译如下: 模型名称与推理模式- ...

o1 让 AI 正式进入 L2 “推理者”阶段,但我们离 AGI 仍然遥远

点击上方蓝字关注我们“OpenAI 推出了 o1 新型 AI 模型,标志着 AI 进入了五级系统的第二级——推理者。o1 在科学、编程和数学任务中展现了显著的推理能力和自我...
阅读原文

o1 让 AI 正式进入 L2 “推理者”阶段,但我们离 AGI 仍然遥远

点击上方蓝字关注我们“OpenAI 推出了 o1 新型 AI 模型,标志着 AI 进入了五级系统的第二级——推理者。o1 在科学、编程和数学任务中展现了显著的推理能力和自我...
阅读原文

浅谈OpenAI最新发布的o1大模型:RL深度思考,技术差距拉开

openai放大招了,是奥特曼在推上宣传了很久的草莓真身,这次它真的来了。又给大家带来一点小小的震撼,国内大模型老板们也不再迷茫了,4o的多模态的还没赶上...
阅读原文

实测 | GPT-o1:学会了思考,也学会了偷懒

警惕 AI 用思考时长等效答案质量。作者丨林杰鑫 编辑丨陈彩娴 我可能是全网第一个花钱向 GPT-o1 提问,人在深圳靠一条网线横跨太平洋到美国硅谷让 OpenAI 最...
阅读原文
15678955