GPT-5屡遭重创：漫长数月的重训与数据重建之路

OpenAI正在尝试调整战略

原标题：Ilya宣判后GPT-5被曝屡训屡败，一次训数月，数据要人工从头构建
文章来源：量子位
内容字数：7074字

近期关于GPT-5的消息引发广泛关注。OpenAI在连续12场发布会后，未能展示GPT-5的影子，华尔街日报的爆料透露，GPT-5已经完成至少两轮长达数月的训练，但每次训练都遇到新问题。OpenAI目前正在雇佣专门人员为GPT-5从头创建数据，尽管使用合成数据，但效率仍不足以满足预训练需求。

根据市场估算，一次长达6个月的训练算力成本高达5亿美元，而GPT-4的训练成本仅超1亿美元。尽管GPT-5在性能上有所期待，如科学探索和更少错误，但与其消耗的巨大成本相比，提升并不明显。OpenAI前CTO曾指出，预训练的时代或将结束，这与当前的进展相呼应。

为了应对挑战，OpenAI正考虑调整战略，推出o1、o3系列。尽管GPT-5的发布未定，投资者仍对其未来寄予厚望，OpenAI近期融资66亿美元，估值升至1570亿美元。尽管如此，GPT-5的发展历程坎坷，曾放弃代号为Arrakis的模型，表明需要巨大的计算资源和时间来训练更大规模的模型。

在o3系列的发布中，OpenAI实现了ARC-AGI测试的显著突破。o3在公共任务上取得了高达91.5%的准确率，显示出其在解决复杂问题上的潜力。尽管成本高昂，但o3的成绩证明了架构的重要性，并为AGI的探索提供了新思路。

尽管o3在某些简单任务上仍存在不足，AGI的愿景依旧吸引人。专家认为，o3的开发标志着AI领域的重要进展，但仍需在更广泛的任务上取得突破。OpenAI最新的研究成果显示，通过推理模型的对齐，可以显著提高模型的安全性，未来的研究将集中于如何在模型中进一步实现这一目标。

文章来源：量子位
作者微信：
作者简介：追踪人工智能新趋势，关注科技行业新突破

文章版权归作者所有，未经允许请勿转载。

暂无评论...