OpenAI发布AGI安全风险框架！董事会可随时叫停GPT-5等模型发布，奥特曼也得乖乖听话

AIGC动态2年前 (2023)发布夕小瑶科技说

AIGC动态欢迎阅读

原标题：OpenAI发布AGI安全风险框架！董事会可随时叫停GPT-5等模型发布，奥特曼也得乖乖听话
关键字：报告,模型,风险,团队,框架
文章来源：夕小瑶科技说
内容字数：4618字

内容摘要：

夕小瑶科技说原创作者 | 小戏、王二狗OpenAI 再次强调模型安全性！AGI 安全团队 Preparedness 发布模型安全评估与监控框架！
这两天关注 AI 圈新闻的小伙伴们可能也有发现，近期的 OpenAI 可谓进行了一系列动作反复强调模型的“安全性”。
前有 OpenAI 安全系统（Safety Systems）负责人长文梳理针对 LLM 的对抗攻击类型与防御方法，后有 Ilya Sutskever 领衔的“超级对齐”团队（Superalignment）发布论文探索使用小模型监督对齐大模型，这些工作无一例外都在开头强调“伴随着模型正在逼近 AGI……”
而就在今天，OpenAI 又官宣了一项安全性工作，由 OpenAI 负责 AGI 安全性的新团队 Preparedness 推出了“Preparedness 框架”——一个负责对模型安全性进行评估与监控的系统文件，详细介绍了目前 OpenAI 针对模型安全评估监控的工作思路：
Preparedness 框架提出的背景Preparedness 框架的提出主要基于 OpenAI 的两个判断：
（1）我们的系统正在逐渐逼近 AGI

原文链接：OpenAI发布AGI安全风险框架！董事会可随时叫停GPT-5等模型发布，奥特曼也得乖乖听话