LLM实践系列-细聊LLM的拒绝采样

AIGC动态2年前 (2024)发布智猩猩GenAI

LLM实践系列-细聊LLM的拒绝采样

AIGC动态欢迎阅读

原标题：LLM实践系列-细聊LLM的拒绝采样
关键字：模型,腾讯,知乎,样本,语言
文章来源：智猩猩GenAI
内容字数：0字

内容摘要：

大会预告12月5-6日，智猩猩共同主办的2024中国生成式AI大会（上海站）将举办。北大（临港）大模型对齐中心执行主任徐骅，腾讯优图实验室天衍研究中心负责人吴贤，银河通用机器人合伙人张直政，西湖心辰CEO醒辰，趣丸科技副总裁贾朔等20+位嘉宾已确认参会演讲。欢迎报名~今天给大家带来一篇知乎好友@ybq的文章，《拒绝采样》。
最近学强化的过程中，总是遇到“拒绝采样”这个概念，我尝试科普一下，争取用最大白话的方式让每个感兴趣的同学都理解其中思想。
拒绝采样是 LLM 从统计学借鉴过来的一个概念。其实大家很早就接触过这个概念，每个刷过 leetcode 的同学大概率都遇到过这样一个问题：“如何用一枚骰子获得 1/7 的概率？”
答案很简单：把骰子扔两次，获得 6 * 6 = 36 种可能的结果，丢弃最后一个结果，剩下的 35 个结果平分成 7 份，对应的概率值便为 1/7 。使用这种思想，我们可以利用一枚骰子获得任意 1/N 的概率。
在这个问题中，我们可以看到拒绝采样的一些关键要素：
采样：从易于采样的分布（两个骰子的所有可能结果）中生成样本；
缩放：（扔两次骰子）获得更大的样本分布；
拒

原文链接：LLM实践系列-细聊LLM的拒绝采样