数学奇迹:微软Phi-4小模型如何以14B参数超越GPT-4o!

数学奇迹:微软Phi-4小模型如何以14B参数超越GPT-4o!

原标题:微软Phi-4封神,14B小模型数学击败GPT-4o!合成数据占比40%,36页技术报告出炉
文章来源:新智元
内容字数:9233字

微软推出新一代小模型Phi-4

微软最近正式发布了其下一代小模型Phi-4,具有140亿个参数,创新性地使用40%的合成数据进行训练。该模型在数学推理和STEM领域的性能上显著超越了GPT-4o和Gemini Pro 1.5,为人工智能模型的发展带来了新的突破。

1. Phi-4的核心技术

Phi-4的成功主要得益于三大核心技术:使用合成数据进行预训练和中训练、高质量有机数据的筛选与过滤,以及先进的后训练方法。合成数据的高比例和高质量使得Phi-4在推理任务上表现出色,甚至与更大模型的表现相当。

2. 优越的数学性能

在2024 ACM数学竞赛中,Phi-4取得了91.8%的准确率,显示出其在数学推理方面的卓越能力。研究表明,Phi-4在许多基准测试中,其表现超越了其教师模型GPT-4o,并在STEM问答任务中展现出强大的实力。

3. 合成数据的优势

合成数据为Phi-4训练的主要组成部分,通过多种技术生成,避免了传统数据集中的一些弱点。相比于有机数据,合成数据在结构化和支持渐进式学习方面具有优势,使得模型学习效率更高。

4. 后训练技术的创新

后训练阶段的关键技术——关键token搜索(PTS),能够识别出影响模型正确性的关键token,从而优化模型的输出。结合拒绝采样和直接偏好优化(DPO),Phi-4在减少幻觉现象上也取得了显著进展。

5. 展望未来

尽管Phi-4在多个基准测试中表现优秀,但研究团队仍发现该模型在遵循指令方面存在不足。未来,团队计划通过有针对性的合成数据进一步提升Phi系列模型的指令跟随性能,期待后续发布的模型带来更多惊喜。


联系作者

文章来源:新智元
作者微信:
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人对人类社会与文明进化的影响,领航中国新智能时代。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...