微软发布Orca2，“式”教会小规模大语言模型如何推理！

AIGC动态3年前 (2023)发布夕小瑶科技说

微软发布Orca2，“调教式”教会小规模大语言模型如何推理！

AIGC动态欢迎阅读

原标题：微软发布Orca2，“式”教会小规模大语言模型如何推理！

文章来源：夕小瑶科技说

内容字数：7713字

内容摘要：夕小瑶科技说原创作者 | 付奶茶我们都知道在大多数情况下，语言模型的体量和其推理能力之间存在着正相关的关系：模型越大，其处理复杂任务的能力往往越强。然而，这并不意味着小型模型就永远无法展现出色的推理性能。最近，奶茶发现了微软的Orca2公开了论文，它详细探讨了如何提升小型大语言模型的推理能力，这样的研究无疑是在资源有限或对模型大小有特定要求的场景的重大进步。接下来，让我们一起来了解这篇论文的详细工作吧！论文题目：Orca 2: Teaching Small Language Models How to Reason论文链接： https://arxiv.org/pdf/2311.11045.pdf在研究团队之前发布的Orca1中，通过使用解释跟踪这类更丰富的信号训练模型，已经超过了传统指令调优模型在BigBench Hard和AGIEval基准测试中的表现。在Orca2中，研究团队继续探…

原文链接：点此阅读原文：微软发布Orca2，“式”教会小规模大语言模型如何推理！