AIGC动态欢迎阅读
原标题:OpenAI凌晨发布新研究成果!证明者和验证者无限套娃,大模型黑盒变可解释又近一大步!
关键字:模型,解决方案,年龄,父亲,问题
文章来源:人工智能学家
内容字数:0字
内容摘要:
夕小瑶科技说 原创作者 | 付奶茶
昨天凌晨,OpenAI发布了一项名为Prover-Verifier-Games(证明者-验证者博弈)的新研究!
这项研究的目的是确保语言模型生成的文本易于理解,以提高它们在处理复杂任务(如解决数学问题)时的实用性。
OpenAI的研究人员认为,仅仅为了得到正确答案而优化强大模型的解题过程,可能会使生成的解决方案变得难以理解。而且在人类评估中,这样高度优化的解决方案甚至错误率更高!因此在AI生成文本中,不仅要追求正确性,还要注重清晰度和易于验证性。
研究人员尝试用高级语言模型生成较弱模型容易验证的文本,来提升输出答案的可读性和验证性,为此OpenAI提出设计两个角色:“证明者”生成解决方案,“验证者”检查其准确性。
接下来和奶茶一起来看下怎么个事!
提高可读性研究人员的灵感来自于小学数学问题的思维链条,提出证明者VS验证者的博弈理论框架,鼓励模型以可验证的方式解决决策问题。
研究人员举了一个这样的例子来模拟验证、证明的博弈学习过程:Shawna的父亲比她大五倍。Shawna目前比Aliya大三倍。如果Aliya三岁了,Shawna的父亲多大?
1.模型
原文链接:OpenAI凌晨发布新研究成果!证明者和验证者无限套娃,大模型黑盒变可解释又近一大步!
联系作者
文章来源:人工智能学家
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...