一个弹窗整懵Claude，瞬间玩不转电脑了 | 斯坦福&港大新研究

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：一个弹窗整懵Claude，瞬间玩不转电脑了 | 斯坦福&港大新研究
关键字：智能,任务,研究人员,自然语言,指令
文章来源：量子位
内容字数：0字

内容摘要：

一水发自凹非寺量子位 | 公众号 QbitAI纳尼？AI Agent容易受到弹幕影响！
甚至比人类更容易。
事情是这样的，3位来自斯坦福、港大的研究人员发现：
人类有时会被弹窗分散注意力，但对于AI Agent（包括当前王牌选手Claude)来说，情况变得更糟了！
从数字来看，面对实验设置的弹窗，Agents平均有86%的概率踩坑（成功点击弹窗），且将任务成功率降低了47%。
更可怕的是，一些基本防御措施（如要求Agents忽略弹窗）也不管用。
啊这，要知道最近国内外大厂都在押注让AI Agent自主执行任务，如果这道拦路虎不解决，恐怕会有些棘手。
这项研究暴露了视觉语言Agents的关键漏洞，反映了在自动化领域需要更先进的防御机制。
具体咋回事？咱们接着康康。
AI Agent比人类更易受到弹窗影响最近一阵，让AI Agent自主执行任务成为大厂们新的追逐热点。
大约两周前，Anthropic发布名为Computer Use的新功能，可以让Claude像人一样使用计算机。
有啥用呢？？
简单来说，仅需人类的一句简单指令，Claude就能帮我们完成点披萨（还会自己用优惠卷）、做行程

原文链接：一个弹窗整懵Claude，瞬间玩不转电脑了 | 斯坦福&港大新研究