标签:人类
AI会「说谎」,RLHF竟是帮凶
机器之心报道 机器之心编辑部虽然 RLHF 的初衷是用来控制人工智能(AI),但实际上它可能会帮助 AI 欺骗人类。语言模型 (LM) 可能会产生人类难以察觉的错误,...
o1谎称自己没有CoT?清华UC伯克利:RLHF让模型学会撒谎摸鱼,伪造证据PUA人类
新智元报道编辑:编辑部 HXZ 【新智元导读】清华、UC伯克利等机构研究者发现,RLHF之后,AI模型学会更有效地欺骗人类了!种种证据证明,LLM被RLHF后学会了玩...
GPT-4o能玩《黑神话》!精英怪胜率超人类,无强化学习纯大模型方案
小明 发自 凹非寺量子位 | 公众号 QbitAIAI玩黑神话,第一个精英怪牯护院轻松拿捏啊。 有方向感,视角也没有问题。 躲闪劈棍很丝滑。 甚至在打鸦香客和牯护院...
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
新智元报道编辑:LRS 【新智元导读】DeepMind最近的研究提出了一种新框架AligNet,通过模拟人类判断来训练教师模型,并将类人结构迁移到预训练的视觉基础模型...
o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo
机器之心报道 机器之心编辑部自从 OpenAI 的 o1 问世以来,它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练,它就能直接拿下数学奥赛金牌,甚至可...
在大语言模型中分离语言和思想
来源:清熙 作者: Kyle Mahowald* 德克萨斯大学奥斯汀分校 mahowald@utexas.edu Anna A. Ivanova* 佐治亚理工学院 a.ivanova@gatech.edu Idan A. Blank,加...
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
新智元报道编辑:编辑部 HXZ 【新智元导读】随OpenAI爆火的CoT,已经引发了大佬间的激战!谷歌DeepMind首席科学家Denny Zhou拿出一篇ICLR 2024论文称:CoT可...
英伟达Jim Fan预测:未来2~3年机器人将迎来“GPT-3时刻”
夕小瑶科技说 原创作者 | 海野在这个科技不断进步的时代,我们终将迎来“与机器人共存”的未来。你认为,未来会是人机和平共处,还是《终结者》式未来? 随着科...
OpenAI o1全方位SOTA登顶lmsys排行榜!数学能力碾压Claude和谷歌模型,o1-mini并列第一
新智元报道编辑:乔杨 【新智元导读】o1模型发布1周,lmsys的6k+投票就将o1-preview送上了排行榜榜首。同时,为了满足大家对模型「IOI金牌水平」的好奇心,Op...
1000个Agent圈地模拟人类社会,北大校友创业AI版「我的世界」
一水 发自 凹非寺量子位 | 公众号 QbitAI北大校友打造的1000个智能体「我的世界」,火爆AI圈! 随便一条推文,都能引来几十万网友围观: 在这里,有着真正意...
大模型今起进入 o1 时代!OpenAI 取得重大进展,并决定从此放弃 GPT 品牌
点击上方蓝字关注我们“OpenAI发布了一款名为o1的新AI模型,它在复杂任务处理上更像人类。o1目前只对付费ChatGPT用户和部分程序员开放预览。虽然细节不多,但...
o1 让 AI 正式进入 L2 “推理者”阶段,但我们离 AGI 仍然遥远
点击上方蓝字关注我们“OpenAI 推出了 o1 新型 AI 模型,标志着 AI 进入了五级系统的第二级——推理者。o1 在科学、编程和数学任务中展现了显著的推理能力和自我...
o1 让 AI 正式进入 L2 “推理者”阶段,但我们离 AGI 仍然遥远
点击上方蓝字关注我们“OpenAI 推出了 o1 新型 AI 模型,标志着 AI 进入了五级系统的第二级——推理者。o1 在科学、编程和数学任务中展现了显著的推理能力和自我...
信息中的计算机:自主决定、创造思考
本文整理自《智人之上》 尤瓦尔·赫拉利著 中信出版集团2024.9 几乎所有人都已经发现,我们正生活在一场前所未有的信息革命之中。但这到底是一场怎样的革命?...
OpenAI o1模型问世,五级AGI再突破!推理极限超博士,清北复旦华人立功
新智元报道编辑:编辑部 【新智元导读】OpenAI的「草莓」——o1系列模型,居然迅雷不及掩耳地上线了!在复杂推理、数学和代码问题上,它又提升到了全新高度,可...