GPT-5屡遭重创:漫长数月的重训与数据重建之路

OpenAI正在尝试调整战略

GPT-5屡遭重创:漫长数月的重训与数据重建之路

原标题:Ilya宣判后GPT-5被曝屡训屡败,一次训数月,数据要人工从头构建
文章来源:量子位
内容字数:7074字

GPT-5发布进展滞后,OpenAI面临挑战

近期关于GPT-5的消息引发广泛关注。OpenAI在连续12场发布会后,未能展示GPT-5的影子,华尔街日报的爆料透露,GPT-5已经完成至少两轮长达数月的训练,但每次训练都遇到新问题。OpenAI目前正在雇佣专门人员为GPT-5从头创建数据,尽管使用合成数据,但效率仍不足以满足预训练需求。

高成本与低效益

根据市场估算,一次长达6个月的训练算力成本高达5亿美元,而GPT-4的训练成本仅超1亿美元。尽管GPT-5在性能上有所期待,如科学探索和更少错误,但与其消耗的巨大成本相比,提升并不明显。OpenAI前CTO曾指出,预训练的时代或将结束,这与当前的进展相呼应。

新策略与市场预期

为了应对挑战,OpenAI正考虑调整战略,推出o1、o3系列。尽管GPT-5的发布未定,投资者仍对其未来寄予厚望,OpenAI近期融资66亿美元,估值升至1570亿美元。尽管如此,GPT-5的发展历程坎坷,曾放弃代号为Arrakis的模型,表明需要巨大的计算资源和时间来训练更大规模的模型。

ARC-AGI测试的突破

在o3系列的发布中,OpenAI实现了ARC-AGI测试的显著突破。o3在公共任务上取得了高达91.5%的准确率,显示出其在解决复杂问题上的潜力。尽管成本高昂,但o3的成绩证明了架构的重要性,并为AGI的探索提供了新思路。

未来展望

尽管o3在某些简单任务上仍存在不足,AGI的愿景依旧吸引人。专家认为,o3的开发标志着AI领域的重要进展,但仍需在更广泛的任务上取得突破。OpenAI最新的研究成果显示,通过推理模型的对齐,可以显著提高模型的安全性,未来的研究将集中于如何在模型中进一步实现这一目标。


联系作者

文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...