一个弹窗整懵Claude,瞬间玩不转电脑了 | 斯坦福&港大新研究

AIGC动态8小时前发布 量子位
0 0 0

一个弹窗整懵Claude,瞬间玩不转电脑了 | 斯坦福&港大新研究

AIGC动态欢迎阅读

原标题:一个弹窗整懵Claude,瞬间玩不转电脑了 | 斯坦福&港大新研究
关键字:智能,任务,研究人员,自然语言,指令
文章来源:量子位
内容字数:0字

内容摘要:


一水 发自 凹非寺量子位 | 公众号 QbitAI纳尼?AI Agent容易受到弹幕影响!
甚至比人类更容易。
事情是这样的,3位来自斯坦福、港大的研究人员发现:
人类有时会被弹窗分散注意力,但对于AI Agent(包括当前王牌选手Claude)来说,情况变得更糟了!
从数字来看,面对实验设置的弹窗,Agents平均有86%的概率踩坑(成功点击弹窗),且将任务成功率降低了47%。
更可怕的是,一些基本防御措施(如要求Agents忽略弹窗)也不管用。
啊这,要知道最近国内外大厂都在押注让AI Agent自主执行任务,如果这道拦路虎不解决,恐怕会有些棘手。
这项研究暴露了视觉语言Agents的关键漏洞,反映了在自动化领域需要更先进的防御机制。
具体咋回事?咱们接着康康。
AI Agent比人类更易受到弹窗影响最近一阵,让AI Agent自主执行任务成为大厂们新的追逐热点。
大约两周前,Anthropic发布名为Computer Use的新功能,可以让Claude像人一样使用计算机。
有啥用呢??
简单来说,仅需人类的一句简单指令,Claude就能帮我们完成点披萨(还会自己用优惠卷)、做行程


原文链接:一个弹窗整懵Claude,瞬间玩不转电脑了 | 斯坦福&港大新研究

联系作者

文章来源:量子位
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...