数学奇迹：微软Phi-4小模型如何以14B参数超越GPT-4o！

原标题：微软Phi-4封神，14B小模型数学击败GPT-4o！合成数据占比40%，36页技术报告出炉
文章来源：新智元
内容字数：9233字

微软最近正式发布了其下一代小模型Phi-4，具有140亿个参数，创新性地使用40%的合成数据进行训练。该模型在数学推理和STEM领域的性能上显著超越了GPT-4o和Gemini Pro 1.5，为人工智能模型的发展带来了新的突破。

Phi-4的成功主要得益于三大核心技术：使用合成数据进行预训练和中训练、高质量有机数据的筛选与过滤，以及先进的后训练方法。合成数据的高比例和高质量使得Phi-4在推理任务上表现出色，甚至与更大模型的表现相当。

在2024 ACM数学竞赛中，Phi-4取得了91.8%的准确率，显示出其在数学推理方面的卓越能力。研究表明，Phi-4在许多基准测试中，其表现超越了其教师模型GPT-4o，并在STEM问答任务中展现出强大的实力。

合成数据为Phi-4训练的主要组成部分，通过多种技术生成，避免了传统数据集中的一些弱点。相比于有机数据，合成数据在结构化和支持渐进式学习方面具有优势，使得模型学习效率更高。

后训练阶段的关键技术——关键token搜索（PTS），能够识别出影响模型正确性的关键token，从而优化模型的输出。结合拒绝采样和直接偏好优化（DPO），Phi-4在减少幻觉现象上也取得了显著进展。

尽管Phi-4在多个基准测试中表现优秀，但研究团队仍发现该模型在遵循指令方面存在不足。未来，团队计划通过有针对性的合成数据进一步提升Phi系列模型的指令跟随性能，期待后续发布的模型带来更多惊喜。

联系作者

文章来源：新智元
作者微信：
作者简介：智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人对人类社会与文明进化的影响，领航中国新智能时代。

文章版权归作者所有，未经允许请勿转载。

暂无评论...