剑桥大学：基于语音的大模型攻击，轻松“操纵”多模态大模型

AIGC动态1年前 (2024)发布夕小瑶科技说

AIGC动态欢迎阅读

原标题：剑桥大学：基于语音的大模型攻击，轻松“操纵”多模态大模型
关键字：模型,语音,英语,转录,方法
文章来源：夕小瑶科技说
内容字数：0字

内容摘要：

夕小瑶科技说原创作者 | Richard随着人工智能技术的快速发展，基于语音的大模型正在成为一个热门领域。这些模型不仅能实现语音识别，还可以执行翻译等多种任务。然而，最近剑桥大学的研究人员发现了一个令人担忧的安全隐患 —— 通过简单的声音操控，就可以轻松”操纵”这些多模态大模型的行为。
研究人员以OpenAI的Whisper模型为例，展示了如何通过在输入音频前添加一小段特制的声音，就能迫使模型执行翻译而非预设的转录任务。这种攻击方法不需要接触模型内部，而且具有普遍适用性，对不同语言都有效。
这项研究揭示了语音大模型面临的新型安全威胁，同时也为我们敲响了警钟：在部署这类灵活的多任务模型时需要更加谨慎，采取更严格的安全措施。接下来，让我们深入了解这项有趣而又发人深省的研究。
论文标题：CONTROLLING WHISPER: UNIVERSAL ACOUSTIC ADVERSARIAL ATTACKS TO CONTROL SPEECH FOUNDATION MODELS
论文链接：https://arxiv.org/pdf/2407.04482
语音大模型的新威胁Whisper采用了编

原文链接：剑桥大学：基于语音的大模型攻击，轻松“操纵”多模态大模型

联系作者

文章来源：夕小瑶科技说
作者微信：xixiaoyaoQAQ
作者简介：专业、有趣、深度价值导向的科技媒体。聚集30万AI工程师、研究员，覆盖500多家海内外机构投资人，互联网大厂中高管和AI公司创始人。一线作者来自清北、国内外顶级AI实验室和大厂，兼备敏锐的行业嗅觉和洞察深度。商务合作：zym5189

阅读原文