标签:现象

斯坦福最新理论研究:RLHF中奖励过度优化现象也存在Scaling Laws

大数据文摘授权转载自将门创投 作者:seven_ 可以说,人类反馈强化学习 (RLHF) 是一把解锁大型语言模型(LLMs)涌现能力的金钥匙。它使拥有庞大参数规模的语言...
阅读原文

物理学研究对象详解:什么不属于物理学?

《三体》中,杨冬说过一句经典:“物理学,不存在了”。 Netflix版《三体》的上映,让这部备受期待的改编剧也备受争议,槽点云集,然而能够带来这么大的讨论度...
阅读原文

逼迫大模型消除幻觉,就像杨永信电击治疗网瘾少年

夕小瑶科技说 原创作者 | 智商掉了一地在科技高速发展的领域,进步往往伴随着争议。数字化时代,我们被海量信息所环绕,利用大模型来提取信息和生成答案,有...
阅读原文

智能澎湃,大有可为——机器之心2023年度榜单揭晓

人工智能发展史上有几个重要的年份:比如 1956、2012…… 如今又多了个 2023 。 这一年,ChatGPT 引爆的「百模大战」在国内外科技领域打响,没有一家公司敢在这...
阅读原文

AI「领悟」有理论解释了!谷歌:两种脑回路内部竞争,训练久了突然不再死记硬背

梦晨 发自 凹非寺量子位 | 公众号 QbitAI谷歌PAIR团队不久前撰文介绍了AI的“领悟”(Grokking)现象——训练久了突然不再死记硬背,而是学会举一反三,有了泛化...
阅读原文