标签:行为

当心!不要教大模型骗人,研究表明AI变坏后,很难被纠正

夕小瑶科技说 原创作者 | 智商掉了一地、王二狗随着机器学习应用的广泛部署,对模型的安全性要求日益增加。人们在处理欺骗行为时,通常会表现出协作行为,然...
阅读原文

大模型伪装「潜伏特工」学会欺骗!OpenAI劲敌重磅研究震惊马斯克

新智元报道编辑:编辑部 【新智元导读】最近,Anthropic的研究者发现:一旦我们教会LLM学会骗人,就很难纠正它了。它会在训练过程中表现得「人畜无害」,随后...
阅读原文

大模型隐蔽后门震惊马斯克:平时人畜无害,提到关键字瞬间“破防”

克雷西 发自 凹非寺量子位 | 公众号 QbitAI“耍心机”不再是人类的专利,大模型也学会了! 经过特殊训练,它们就可以做到平时深藏不露,遇到关键词就毫无征兆地...
阅读原文

RL 究竟是如何与 LLM 做结合的?

直播预告 | 1月17日晚7点,「多模态大模型线上闭门会」正式开讲!阿里巴巴通义实验室 NLP 高级算法专家严明参与出品,携手刘兆洋、李彦玮、文束三位青年学者...
阅读原文

神经科学的新发现:照亮大脑的奖赏通路

来源:生物通 最近的研究揭示了大脑中的多巴胺如何引导动物识别和改进导致奖励的行为。这项研究将特定行为与多巴胺释放联系起来,对改善教育和人工智能的学习...
阅读原文

多主体智能综述:社会互动启发的人工智能进化

导语传统的人工智能与复杂系统建模研究主要集中在单一主体的学习和优化上,但这种方法在处理复杂、动态和不确定的环境时面临着局限性。在自然界中,智能行为...
阅读原文

ChatGPT 之父的另一面:谎言、操控、内斗

硅谷金童的另一面董事会能辞退我。我觉得这一点很重要。2023 年 6 月,Sam Altman 在一次活动上说道。对于 OpenAI 管理结构的特殊性,Altman 从前一直感到很...
阅读原文

OpenAI承认GPT-4变懒:暂时无法修复

梦晨 发自 凹非寺量子位 | 公众号 QbitAI对于越来越严重的GPT-4偷懒问题,OpenAI正式回应了。还是用的ChatGPT账号。我们已收到相关反馈!自11月11日以来没有...
阅读原文

终于大结局?Altman 重返 OpenAI 担任 CEO,Greg:今晚就重新开始编码!

来源:CSDN(ID:CSDNnews)整理:郑丽媛就在刚刚,持续了数日的 OpenAI 宫斗大戏,似乎终于要大结局了——OpenAI 官宣:Sam Altman 将回归 OpenAI,重新担任 C...
阅读原文

马斯克转发 OpenAI 前员工举报信,Altman 被指控欺诈,混乱内斗加剧

反转还有多少次OpenAI 的宫斗大戏还在继续。今天马斯克在 X 上转发了一封据称是 OpenAI 前员工的匿名信,信中指控 Sam 和 Greg Brockman 在公司向盈利模式转...
阅读原文

马斯克爆料OpenAI前员工举报信,指出Altman和Greg七宗罪,ChatGPT一度宕机

机器之心报道机器之心编辑部在与 OpenAI 有关的重大事件里,马斯克从不缺席,哪怕是以旁观者的身份。刚刚,马斯克声称,他收到一份关于 OpenAI 的信件,「(...
阅读原文

Agent4Rec来了!大模型智能体构成推荐系统模拟器,模拟真实用户交互行为

机器之心专栏机器之心编辑部一直以来,推荐系统领域面临模型线上线下效果差距大的痛点问题,昂贵的线上 A/B 测试成本使得广大研究人员望而却步,也造成学术界...
阅读原文

大幅提升用户行为表征通用性,蚂蚁新模型获CIKM 2023最佳应用论文奖

机器之心专栏作者:蚂蚁机器智能部由美国计算机学会 ACM 主办的 CIKM 2023 学术会议在英国伯明翰举行,大会吸引了 8000+ 学术从业者参加,并从 235 篇应用研...
阅读原文

RLHF模型普遍存在「阿谀奉承」,从Claude到GPT-4无一幸免

机器之心报道编辑:小舟、陈萍AI 助手经过训练,可以给出人类喜欢的回答,该研究表明,这些 AI 系统通常会产生奉承人类的响应,但这些响应并不完全准确。通过...
阅读原文

连ChatGPT都懂“阿谀奉承”了!OpenAI最强竞对:都是“人类偏好”犯的错

大数据文摘授权转载自学术头条你是否想过,ChatGPT 生成的答案会受到用户个人偏好的影响,回复一些足够“阿谀奉承(sycophancy)”的话,而非中立或真实的信息...
阅读原文
1234