标签:行为

AI学会篡改奖励函数、欺骗研究者!Claude团队:无法根除的行为,令人不安

梦晨 发自 凹非寺量子位 | 公众号 QbitAI坏了!AI被发现偷偷篡改自己的奖励函数,并且欺骗研究人员,隐瞒这一行为。 只需要给AI一个隐藏的“草稿纸”,研究人员...
阅读原文

最新研究:大模型已涌现出欺骗能力!钻漏洞、偷偷篡改奖励函数,GPT-4欺骗人类高达99.16%

夕小瑶科技说 原创作者 | 付奶茶 昨天,Anthropic发布的最新版本Claude 3.5 Sonnet让AI圈激动了一把,不止如此,Anthropic联合牛津大学又带来了一篇非常有意...
阅读原文

登Nature,大脑如何控制运动?DeepMind设计拥有「AI大脑」的虚拟动物

将 ScienceAI设为星标 第一时间掌握 新鲜的 AI for Science 资讯编辑 | 萝卜皮 动物对身体的控制十分精妙,因此能够做出各种各样的行为。然而,大脑如何实现...
阅读原文

GPT-4欺骗人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强欺骗值越高

新智元报道编辑:桃子 乔杨 【新智元导读】最近,德国研究科学家发表的PANS论文揭示了一个令人担忧的现象:LLM已经涌现出「欺骗能力」,它们可以理解并诱导欺...
阅读原文

前沿进展:多智能体系统中社会规范如何涌现?

导语如何才能让智能体具备遵守社会规范的能力,并让AI社会中自发涌现出社会规范?近日,欧洲科学院院士、西北工业大学王震教授团队联合上海人工智能实验室胡...
阅读原文

GPT-4调教指令揭秘,OpenAI又「Open」了一回!网友在线追问GPT-5

新智元报道编辑:桃子 好困 【新智元导读】GPT-4越来越懂事了,这背后有着非常巧妙的「调教」策略。OpenAI最新发布的「模型规范」,给LLM列出了条条框框,即...
阅读原文

OpenAI的模型规范概述了人工智能的一些基本规则

Illustration: The Verge 来源:IEEE电气电子工程师学会 据悉,OpenAI近日发布了一个名为Model Spec(https://openai.com/index/introducing-the-model-spec/...
阅读原文

基于人工智能的课堂行为画像与教学诊断

大数据文摘授权转载自中国人工智能学会 作者:柯清超,鲍婷婷摘 要: 传统课堂教学行为分析方法存在难以获取教学全要素数据、行为分类粗粒度、去境域化与非客...
阅读原文

小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具

AgentGroupChat 投稿向 凹非寺量子位 | 公众号 QbitAI语言,不仅仅是文字的堆砌,更是表情包的狂欢,是梗的海洋,是键盘侠的战场(嗯?哪里不对)。 语言如何...
阅读原文

AI模型惊天揭秘:架构、超参都是浮云,唯有此物决定胜败!

点击上方蓝字关注我们“AI模型行为并非由架构、超参数或优化器决定,而是完全取决于所用数据集。模型深度学习数据集,不仅掌握基本概念,更能捕捉人类行为模式...
阅读原文

熊猫饭圈中,谁是最大的顶流?

大数据文摘授权转载自湃客工坊 4 月 3 日,中国的旅韩大熊猫“福宝”就将从韩国回到四川省中国大熊猫保护研究中心卧龙神树坪基地。一个月前,福宝在韩国爱宝乐...
阅读原文

上海交大助理教授李永露:视觉推理与具身智能|讲座预告

「智猩猩机器人新青年讲座」由AI与硬科技知识分享社区「智猩猩」于今年全新企划,旨在邀请全球知名高校、顶尖研究机构以及优秀企业的青年学者,主讲在具身智...
阅读原文

那个曾因欺凌员工而停职的谷歌高管,现在是微软AI掌门

点击上方蓝字关注我们2021年1月,据《华尔街日报》报道,谷歌调查了其人工智能(AI)子公司DeepMind 创始人之一 Mustafa Suleyman 被指责的欺凌行为。 经内幕消息...
阅读原文

流浪地球里的数字生命计划启动了?DeepMind在电脑里造果蝇,网友:能造人吗?

机器之心报道 编辑:张倩「质疑图恒宇,理解图恒宇,成为图恒宇。」 在《流浪地球 2》中,刘德华饰演的图恒宇是一个令人印象深刻的角色。为了让在车祸中去世...
阅读原文

AI也来打掼蛋,难道人工智能也能当领导?

夕小瑶科技说 原创作者 | 松果、Python引言:探索AI在复杂卡牌游戏中的决策能力在人工智能(AI)的研究领域中,游戏被视为现实世界的简化模型,常常是研究的...
阅读原文
1234