AIGC动态欢迎阅读
原标题:微软发布Orca2,“式”教会小规模大语言模型如何推理!
文章来源:夕小瑶科技说
内容字数:7713字
内容摘要:夕小瑶科技说 原创作者 | 付奶茶我们都知道在大多数情况下,语言模型的体量和其推理能力之间存在着正相关的关系:模型越大,其处理复杂任务的能力往往越强。然而,这并不意味着小型模型就永远无法展现出色的推理性能。最近,奶茶发现了微软的Orca2公开了论文,它详细探讨了如何提升小型大语言模型的推理能力,这样的研究无疑是在资源有限或对模型大小有特定要求的场景的重大进步。接下来,让我们一起来了解这篇论文的详细工作吧!论文题目:Orca 2: Teaching Small Language Models How to Reason论文链接: https://arxiv.org/pdf/2311.11045.pdf在研究团队之前发布的Orca1中,通过使用解释跟踪这类更丰富的信号训练模型,已经超过了传统指令调优模型在BigBench Hard和AGIEval基准测试中的表现。在Orca2中,研究团队继续探…
原文链接:点此阅读原文:微软发布Orca2,“式”教会小规模大语言模型如何推理!
联系作者
文章来源:夕小瑶科技说
作者微信:xixiaoyaoQAQ
作者简介:更快的AI前沿,更深的行业洞见。聚集25万AI应用开发者、算法工程师和研究人员。一线作者均来自清北、国外顶级AI实验室和互联网大厂,兼备媒体sense与技术深度。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...