OpenAI凌晨发布新研究成果！证明者和验证者无限套娃，大模型黑盒变可解释又近一大步！

AIGC动态2年前 (2024)发布人工智能学家

AIGC动态欢迎阅读

原标题：OpenAI凌晨发布新研究成果！证明者和验证者无限套娃，大模型黑盒变可解释又近一大步！
关键字：模型,解决方案,年龄,父亲,问题
文章来源：人工智能学家
内容字数：0字

内容摘要：

夕小瑶科技说原创作者 | 付奶茶
昨天凌晨，OpenAI发布了一项名为Prover-Verifier-Games（证明者-验证者博弈）的新研究！
这项研究的目的是确保语言模型生成的文本易于理解，以提高它们在处理复杂任务（如解决数学问题）时的实用性。
OpenAI的研究人员认为，仅仅为了得到正确答案而优化强大模型的解题过程，可能会使生成的解决方案变得难以理解。而且在人类评估中，这样高度优化的解决方案甚至错误率更高！因此在AI生成文本中，不仅要追求正确性，还要注重清晰度和易于验证性。
研究人员尝试用高级语言模型生成较弱模型容易验证的文本，来提升输出答案的可读性和验证性，为此OpenAI提出设计两个角色：“证明者”生成解决方案，“验证者”检查其准确性。
接下来和奶茶一起来看下怎么个事！
提高可读性研究人员的灵感来自于小学数学问题的思维链条，提出证明者VS验证者的博弈理论框架，鼓励模型以可验证的方式解决决策问题。
研究人员举了一个这样的例子来模拟验证、证明的博弈学习过程：Shawna的父亲比她大五倍。Shawna目前比Aliya大三倍。如果Aliya三岁了，Shawna的父亲多大？
1.模型

原文链接：OpenAI凌晨发布新研究成果！证明者和验证者无限套娃，大模型黑盒变可解释又近一大步！