微软发布Phi-3,性能超Llama-3,可手机端运行

微软发布Phi-3,性能超Llama-3,可手机端运行

AIGC动态欢迎阅读

原标题:微软发布Phi-3,性能超Llama-3,可手机端运行
关键字:模型,报告,微软,数据,基准
文章来源:机器之心
内容字数:3522字

内容摘要:


机器之心报道
编辑:小舟、泽南数据已成为提升大模型能力的重点。Llama-3 刚发布没多久,竞争对手就来了,而且是可以在手机上运行的小体量模型。
本周二,微软发布了自研小尺寸模型 Phi-3。
新模型有三个版本,其中 Phi-3 mini 是一个拥有 38 亿参数的语言模型,经过 3.3 万亿 token 的训练,其整体性能在学术基准和内部测试上成绩优异。
尽管 Phi-3 mini 被优化至可部署在手机上,但它的性能可以与 Mixtral 8x7B 和 GPT-3.5 等模型相媲美。微软表示,创新主要在于用于训练的数据集。与此同时,Phi-3 与 Llama-2 使用相同的架构,方便开源社区在其基础上开发。此前,微软的 Phi 系列模型曾经引发了人们的热议,去年 6 月,微软发布了《Textbooks Are All You Need》论文,用规模仅为 7B token 的「教科书质量」数据训练 1.3B 参数的模型 phi-1,实现了良好的性能。
去年 9 月,微软进一步探索这条道路,让 1.3B 参数的 Transformer 架构语言模型 Phi-1.5 显示出强大的编码能力。


原文链接:微软发布Phi-3,性能超Llama-3,可手机端运行

联系作者

文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...