GPT-4批评GPT-4实现「自我提升」！OpenAI前超级对齐团队又一力作被公开

AIGC动态2年前 (2024)发布新智元

AIGC动态欢迎阅读

原标题：GPT-4 批评GPT-4实现「自我提升」！OpenAI前超级对齐团队又一力作被公开
关键字：模型,人类,批评,错误,意见
文章来源：新智元
内容字数：0字

内容摘要：

新智元报道编辑：乔杨
【新智元导读】今天，OpenAI悄悄在博客上发布了一篇新论文——CriticGPT，而这也是前任超级对齐团队的「遗作」之一。CriticGPT同样基于GPT-4训练，但目的却是用来指正GPT-4的输出错误，实现「自我批评」。OpenAI最近的拖延症状逐渐严重，不仅GPT-5遥遥无期，前几天还宣布GPG-4o的语音功能将推迟一个月发布。
或许是为了缓解广大网友的热切期待，OpenAI在今天放出了新模型CriticGPT，相当于GPT-4的「拐杖」。
我们训练了一个模型CriticGPT，来捕获GPT-4生成代码中的错误。我们开始将此类模型集成到RLHF对齐管道中，以帮助人类监督AI执行困难的任务。
值得注意的是，CriticGPT依旧是用GPT-4模型训练的，但被用于给GPT-4生成的代码「捉虫」，这似乎有点「自我闭环」的意思？
网友迅速质疑，「我用石头摧毁石头」，矛盾得有点好笑。
但也有人从另一个角度发现了华点：这难道就是模型自我提升的开始？
官方发布的推文和博客中还没有提及CriticGPT何时会集成到ChatGPT中，但技术文章已经发布，而且又是一篇离职

原文链接：GPT-4批评GPT-4实现「自我提升」！OpenAI前超级对齐团队又一力作被公开