LLM实践系列-细聊LLM的拒绝采样

LLM实践系列-细聊LLM的拒绝采样

AIGC动态欢迎阅读

原标题:LLM实践系列-细聊LLM的拒绝采样
关键字:模型,腾讯,知乎,样本,语言
文章来源:智猩猩GenAI
内容字数:0字

内容摘要:


大会预告12月5-6日,智猩猩共同主办的2024中国生成式AI大会(上海站)将举办。北大(临港)大模型对齐中心执行主任徐骅,腾讯优图实验室天衍研究中心负责人吴贤,银河通用机器人合伙人张直政,西湖心辰CEO醒辰,趣丸科技副总裁贾朔等20+位嘉宾已确认参会演讲。欢迎报名~今天给大家带来一篇知乎好友@ybq的文章,《拒绝采样》。
最近学强化的过程中,总是遇到“拒绝采样”这个概念,我尝试科普一下,争取用最大白话的方式让每个感兴趣的同学都理解其中思想。
拒绝采样是 LLM 从统计学借鉴过来的一个概念。其实大家很早就接触过这个概念,每个刷过 leetcode 的同学大概率都遇到过这样一个问题:“如何用一枚骰子获得 1/7 的概率?”
答案很简单:把骰子扔两次,获得 6 * 6 = 36 种可能的结果,丢弃最后一个结果,剩下的 35 个结果平分成 7 份,对应的概率值便为 1/7 。使用这种思想,我们可以利用一枚骰子获得任意 1/N 的概率。
在这个问题中,我们可以看到拒绝采样的一些关键要素:
采样:从易于采样的分布(两个骰子的所有可能结果)中生成样本;
缩放:(扔两次骰子)获得更大的样本分布;


原文链接:LLM实践系列-细聊LLM的拒绝采样

联系作者

文章来源:智猩猩GenAI
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...