标签:大模型越狱攻击

揭秘多轮越狱攻击新框架:RACE 如何利用大模型推理能力突破安全防线?

北航等单位提出RACE框架,攻击成功率高达96%,OpenAI、DeepSeek等主流模型均被攻破。
阅读原文