标签:能力
Qwen2.5登上全球开源王座!72B模型击败LIama3 405B,轻松胜过GPT-4o-mini
白小交 发自 凹非寺量子位 | 公众号 QbitAI击败LIama3!Qwen2.5登上全球开源王座。 而后者仅以五分之一的参数规模,就在多任务中超越LIama3 405B。 各种任务...
o1基石论文火爆传阅,Ilya仍是关键先生!核心项目清北校友闪光
白小交 西小风 发自 各自家里量子位 | 公众号 QbitAI自从Ilya Sutskever的名字出现在OpenAI o1背后团队名单中,他在o1中发挥了哪些作用,一时间成为不少网友...
实测 OpenAI 最强模型 o1 :做题王者,实战青铜
做题王者 实战青铜本周OpenAI 突然发布了 o1 系列模型,最大的特点是擅长推理。 模型的能力,一代比一代强,我们的测评,一次比一次难做。测评变成一件「毕恭...
北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
华为诺亚联合中科大发布工具调用模型ToolACE,效果持平GPT-4获开源第一
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
OpenAI o1是AGI下半场的开始,强化学习将成为新的 Scaling Law
随着 OpenAI o1 模型的发布,LLM 正式进入 self-play RL 范式时代。 Self-play RL 似乎在一夜之间,成为了新的 scaling law。 OpenAI 不是唯一重视 RL 和 Sel...
张俊林:o1本质是大模型掌握解题步骤,未来将迁移到GPT-5上
OpenAI 的新模型和之前的相比,技术进步体现在哪里?又为其他厂商带来了什么新的方向? 新浪微博机器学习团队 AI Lab 负责人张俊林详细解释了这些问题: 逻辑...
张俊林:浅谈OpenAI o1的价值意义及RL 的Scaling Law
导读本文转载知乎,是张俊林对“如何看待 OpenAI 发布 o1 系列模型?将带来哪些变革?”这一问题做的回答。 本文讨论了OpenAI o1的价值意义及RL 的Scaling law...
OpenAI o1惊现自我意识?陶哲轩实测大受震撼,门萨智商100夺模型榜首
新智元报道编辑:编辑部 HXZ 【新智元导读】OpenAI o1,在门萨智商测试中果然取得了第一名。数学大神陶哲轩实测发现,o1竟然能成功识别出克莱姆定理。而OpenA...
张俊林:OpenAI o1的价值意义及强化学习的Scaling Law
机器之心转载 作者:新浪新技术研发负责人张俊林蹭下热度谈谈 OpenAI o1 的价值意义及 RL 的 Scaling law。 一、OpenAI o1 是大模型的巨大进步 我觉得 OpenAI...
解密 OpenAI o1:那些不为人知的幕后细节
点击上方蓝字关注我们在今天与 OpenAI o1 团队的 AMA(Ask Me Anything)活动中,我们了解到了以下几点,有网友进行了整理,翻译如下: 模型名称与推理模式- ...
o1 让 AI 正式进入 L2 “推理者”阶段,但我们离 AGI 仍然遥远
点击上方蓝字关注我们“OpenAI 推出了 o1 新型 AI 模型,标志着 AI 进入了五级系统的第二级——推理者。o1 在科学、编程和数学任务中展现了显著的推理能力和自我...
o1 让 AI 正式进入 L2 “推理者”阶段,但我们离 AGI 仍然遥远
点击上方蓝字关注我们“OpenAI 推出了 o1 新型 AI 模型,标志着 AI 进入了五级系统的第二级——推理者。o1 在科学、编程和数学任务中展现了显著的推理能力和自我...
浅谈OpenAI最新发布的o1大模型:RL深度思考,技术差距拉开
openai放大招了,是奥特曼在推上宣传了很久的草莓真身,这次它真的来了。又给大家带来一点小小的震撼,国内大模型老板们也不再迷茫了,4o的多模态的还没赶上...
实测 | GPT-o1:学会了思考,也学会了偷懒
警惕 AI 用思考时长等效答案质量。作者丨林杰鑫 编辑丨陈彩娴 我可能是全网第一个花钱向 GPT-o1 提问,人在深圳靠一条网线横跨太平洋到美国硅谷让 OpenAI 最...