微软推出2.7B「小语言模型」，碾压Gemini Nano，能打Llama 2 70B

AIGC动态3年前 (2023)发布 Founder Park

AIGC动态欢迎阅读

原标题：微软推出2.7B「小语言模型」，碾压Gemini Nano，能打Llama 2 70B

关键字：模型,微软,性能,数据,语言

文章来源：Founder Park

内容字数：6732字

内容摘要：大模型现在真的是越来越卷了！11月OpenAI先是用GPTs革了套壳GPT们的命，然后再不惜献祭董事会搏了一波天大的流量。谷歌急了，赶在年底之前仓促发布了超大模型Gemini，卷起了多模态，甚至不惜「视频造假」。就在今天，微软正式发布了曾在11月Ignite大会上预告的Phi-2！凭借着2.7B的参数，「小语言模型（SLM）」Phi-2几乎打穿了所有13B以下的大模型——包括谷歌最新发布的Gemini Nano 2。通过模型扩展和训练数据管理方面的创新，Phi-2展现了出色的推理和语言理解能力，在复杂的基准测试中，Phi-2的性能可以打平比自己大25倍的模型，甚至略占上风。它用非常「苗条」的尺寸，获得了良好的性能。这让研究人员和模型开发人员能够很方便地使用Phi-2进行可解释性、安全性方面的改进，并针对其他任务进行微调。Phi-2目前已经可以通过Azure AI Studio访问。但是…

原文链接：点此阅读原文：微软推出2.7B「小语言模型」，碾压Gemini Nano，能打Llama 2 70B