思维链提出者Jason Wei：关于大模型的6个直觉

AIGC动态3年前 (2023)发布机器之心

AIGC动态欢迎阅读

原标题：思维链提出者Jason Wei：关于大模型的6个直觉

文章来源：机器之心

内容字数：7373字

内容摘要：选自 jasonwei.net/blog作者：Jason Wei机器之心编译编辑：Panda大模型究竟从下一个词预测任务中学到了什么呢？还记得 Jason Wei 吗？这位思维链的提出者还曾共同领导了指令调优的早期工作，并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 参与 ChatGPT 的开发工作。机器之心曾经报道过他为年轻 AI 研究者提供的一些。近日，他以客座讲师的身份为斯坦福的 CS 330 深度多任务学习与元学习课程讲了一堂课，分享了他对大型语言模型的一些直观认识。目前斯坦福尚未公布其演讲视频，但他本人已经在自己的博客上总结了其中的主要内容。当今的 AI 领域有一个仍待解答的问题：大型语言模型的表现为何如此之好？对此，Jason Wei 谈到了六个直觉认识。这些直觉认识中许多都是通过人工检查数据得到的，Jason Wei 表示…

原文链接：点此阅读原文：思维链提出者Jason Wei：关于大模型的6个直觉