标签:对数
陈丹琦团队新作:微调8B模型超越Claude3 Opus,背后是RLHF新平替
克雷西 发自 凹非寺量子位 | 公众号 QbitAI比斯坦福DPO(直接偏好优化)更简单的RLHF平替来了,来自陈丹琦团队。 该方式在多项测试中性能都远超DPO,还能让8B...
全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型
机器之心报道 编辑:Panda为了将大型语言模型(LLM)与人类的价值和意图对齐,学习人类反馈至关重要,这能确保它们是有用的、诚实的和无害的。在对齐 LLM 方...
北大团队:诱导大模型“幻觉”只需一串乱码!大小羊驼全中招
kid 投稿自 凹非寺量子位 | 公众号 QbitAI北大团队最新研究发现:随机token都能诱发大模型出现幻觉!比如喂给大模型(Vicuna-7B)一段“乱码”,它就莫名其妙弄...