OpenAI超级对齐团队再发「绝唱」！首提「证明者-验证者」博弈，训练GPT说人话

AIGC动态2年前 (2024)发布新智元

AIGC动态欢迎阅读

原标题：OpenAI超级对齐团队再发「绝唱」！首提「证明者-验证者」博弈，训练GPT说人话
关键字：模型,可读性,答案,年龄,人类
文章来源：新智元
内容字数：0字

内容摘要：

新智元报道编辑：乔杨好困
【新智元导读】当我们不停在CoT等领域大下苦功、试图提升LLM推理准确性的同时，OpenAI的对齐团队从另一个角度发现了华点——除了准确性，生成答案的清晰度、可读性和可验证性也同样重要。不知道你有没有过这样的经历：碰到一道做不出的数学题，于是丢给ChatGPT。
结果一通生成之后，ChatGPT的「不知所云」让你从之前的略有头绪瞬间变成完全迷茫。不管它是对是错，反正人类是看不懂了。
提高LLM的数学和推理能力是最近研究关注的焦点，但同样重要的是，确保模型生成可理解的文本。
否则即使答案正确，99%的人类都理解不了，也不能让LLM真正协助我们处理复杂任务。
OpenAI近期发表的一篇论文就旨在研究并解决模型性能和可读性（legibility）之间的平衡。
论文地址：https://openai.com/index/prover-verifier-games-improve-legibility/
和之前发出来的两篇一样，这次又是Jan Leike的库存作品，但共同一作是两位在职研究员Jan Hendrik Kirchner和Yining Chen。
估计超级

原文链接：OpenAI超级对齐团队再发「绝唱」！首提「证明者-验证者」博弈，训练GPT说人话