标签:问题
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
新智元报道编辑:桃子 【新智元导读】多个LLM联合,可以迈向更强大系统!最新研究发现,GPT-4能够提升同伴的性能,能够让数学能力暴涨11.6%。AI如何成为「更...
o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo
机器之心报道 机器之心编辑部自从 OpenAI 的 o1 问世以来,它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练,它就能直接拿下数学奥赛金牌,甚至可...
万字探讨:国内AI应用创业陷入恶性循环,问题在哪里,出路是什么?
自从ChatGPT引起的大模型进化至今,没有人怀疑LLM和其应用范式将会对人类产生极其重大的影响。 无论是大模型本身的chatbot,multi-agent,多模态对话,还是大...
Sam Altman 最新演讲:o1 堪比 GPT-2时刻,AI Agent 时代即将到来
来源:AI寒武纪 OpenAI CEO Sam Altman 刚刚在 T-Mobile 资本市场日上发表演讲,不仅谈到了 OpenAI 与 T-Mobile 的合作,还重点介绍了 OpenAI 的全新推理模型...
o1方法的推理能力无上限?LeCun怒怼:两层网络还可以万能近似呢
来源:AI科技前沿 OpenAI的o1大模型一经亮相,AI界便热议如何复制其成果。OpenAI对技术细节严格保密,试图从AI中获取完整推理过程,稍有过问即遭警告。技术报...
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
新智元报道编辑:编辑部 HXZ 【新智元导读】随OpenAI爆火的CoT,已经引发了大佬间的激战!谷歌DeepMind首席科学家Denny Zhou拿出一篇ICLR 2024论文称:CoT可...
万字长文解读百度大模型原生安全构建之路
演讲嘉宾 |冯景辉 编辑 |蔡芳芳 策划 |AICon 全球人工智能开发与应用大会 大模型以其更智能、不确定和不可解释的特点,给安全领域,尤其是内容安全带来了...
ICML 2024丨多轨图卷积网络:解决过平滑与过碾压的新思路
图神经网络(Graph Neural Networks)是强大的图(关系与交互系统)分析工具,已成功应用在推荐系统、金融风控、知识工程、分子动力学模拟、芯片设计等诸多领...
o1方法性能无上限!姚班马腾宇等数学证明:推理token够多,就能解决任意问题
来源:量子位 | 公众号 QbitAI克雷西 发自 凹非寺OpenAI用o1开启推理算力Scaling Law,能走多远? 数学证明来了:没有上限。 斯隆奖得主马腾宇以及Google Bra...
超强o1模型智商已超120!1小时写出NASA博士1年代码,最新编程赛超越99.8%选手
新智元报道编辑:桃子 乔杨 【新智元导读】OpenAI博士级别的智能,真的实现了!一位UCI物理学博士实测o1,发现自己用时1年完成的博士论文代码,竟被AI在1个小...
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
新智元报道编辑:LRS 【新智元导读】MMMU-Pro通过三步构建过程(筛选问题、增加候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新...
实测 OpenAI 最强模型 o1 :做题王者,实战青铜
做题王者 实战青铜本周OpenAI 突然发布了 o1 系列模型,最大的特点是擅长推理。 模型的能力,一代比一代强,我们的测评,一次比一次难做。测评变成一件「毕恭...
「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢
机器之心报道 编辑:陈陈LLM 应该改名吗?你怎么看。在 AI 领域,几乎每个人都在谈论大型语言模型,其英文全称为 Large Language Models,简写为 LLM。 因为 ...
陶哲轩提前实测满血版o1:能当研究生使唤
白小交 衡宇 发自 凹非寺量子位 | 公众号 QbitAI好羡慕!原来早在8月份,陶哲轩就已经用上了OpenAI o1。 还是现在大家都用不上的满血版本(眼泪不争气地从嘴...
实测 | GPT-o1:学会了思考,也学会了偷懒
警惕 AI 用思考时长等效答案质量。作者丨林杰鑫 编辑丨陈彩娴 我可能是全网第一个花钱向 GPT-o1 提问,人在深圳靠一条网线横跨太平洋到美国硅谷让 OpenAI 最...