思维链提出者Jason Wei:关于大模型的6个直觉

AIGC动态11个月前发布 机器之心
8 0 0

思维链提出者Jason Wei:关于大模型的6个直觉

AIGC动态欢迎阅读

原标题:思维链提出者Jason Wei:关于大模型的6个直觉

关键字:模型,任务,语言,能力,数据

文章来源:机器之心

内容字数:7373字

内容摘要:选自 jasonwei.net/blog作者:Jason Wei机器之心编译编辑:Panda大模型究竟从下一个词预测任务中学到了什么呢?还记得 Jason Wei 吗?这位思维链的提出者还曾共同领导了指令调优的早期工作,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 参与 ChatGPT 的开发工作。机器之心曾经报道过他为年轻 AI 研究者提供的一些。近日,他以客座讲师的身份为斯坦福的 CS 330 深度多任务学习与元学习课程讲了一堂课,分享了他对大型语言模型的一些直观认识。目前斯坦福尚未公布其演讲视频,但他本人已经在自己的博客上总结了其中的主要内容。当今的 AI 领域有一个仍待解答的问题:大型语言模型的表现为何如此之好?对此,Jason Wei 谈到了六个直觉认识。这些直觉认识中许多都是通过人工检查数据得到的,Jason Wei 表示…

原文链接:点此阅读原文:思维链提出者Jason Wei:关于大模型的6个直觉

联系作者

文章来源:机器之心

作者微信:almosthuman2014

作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...