微软推出2.7B「小语言模型」,碾压Gemini Nano,能打Llama 2 70B

AIGC动态9个月前发布 Founder Park
16 0 0

微软推出2.7B「小语言模型」,碾压Gemini Nano,能打Llama 2 70B

AIGC动态欢迎阅读

原标题:微软推出2.7B「小语言模型」,碾压Gemini Nano,能打Llama 2 70B

关键字:模型,微软,性能,数据,语言

文章来源:Founder Park

内容字数:6732字

内容摘要:大模型现在真的是越来越卷了!11月OpenAI先是用GPTs革了套壳GPT们的命,然后再不惜献祭董事会搏了一波天大的流量。谷歌被逼急了,赶在年底之前仓促发布了超大模型Gemini,卷起了多模态,甚至不惜「视频造假」。就在今天,微软正式发布了曾在11月Ignite大会上预告的Phi-2!凭借着2.7B的参数,「小语言模型(SLM)」Phi-2几乎打穿了所有13B以下的大模型——包括谷歌最新发布的Gemini Nano 2。通过模型扩展和训练数据管理方面的创新,Phi-2展现了出色的推理和语言理解能力,在复杂的基准测试中,Phi-2的性能可以打平比自己大25倍的模型,甚至略占上风。它用非常「苗条」的尺寸,获得了良好的性能。这让研究人员和模型开发人员能够很方便地使用Phi-2进行可解释性、安全性方面的改进,并针对其他任务进行微调。Phi-2目前已经可以通过Azure AI Studio访问。但是…

原文链接:点此阅读原文:微软推出2.7B「小语言模型」,碾压Gemini Nano,能打Llama 2 70B

联系作者

文章来源:Founder Park

作者微信:Founder-Park

作者简介:来自极客公园,专注与科技创业者聊「真问题」。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...