未来打工人何去何从
原标题:o3 发布了,摔碎了码农的饭碗
文章来源:智猩猩GenAI
内容字数:6916字
引言
随着科技的飞速发展,人工智能(AI)在各个领域的应用越来越广泛,尤其是在编程和数学等领域。OpenAI近期发布的o3模型引发了广泛关注,尤其是在编程竞技平台Codeforces和SWE-bench中的卓越表现,预示着未来程序员职业可能面临巨大的挑战。
1. o3模型的重大突破
o3模型在编程竞技平台Codeforces中排名第175,击败了99.9%的程序员,显示出其在编程能力方面的强大。这一成绩远超之前的版本,如GPT-4o和o1,使得o3成为顶尖程序员的代表。
2. 在实际软件工程中的应用
SWE-bench测试反映了o3在解决实际软件工程问题中的能力,其准确率达到了71.7%。这意味着,o3能够为大约70%的工程问题生成有效的代码补丁,极大地减少了人类程序员的工作需求。
3. 数学能力的提升
o3在数学测试中也表现优异,AIME 2024测试得分为96.7%,而在ARC-AGI和FrontierMath等高级数学推理测试中,o3的得分分别达到了87.5%和25.2%,显示出其在复杂数学问题上的潜力。
4. 提升的成本与思考时间
尽管o3展现出强大的能力,但其研发成本也非常高,是OpenAI见过的最昂贵的模型。此外,o3的思考时间显著增加,o3 mini版本的平均思考时间达到了23.33秒,说明模型在处理问题时需要更多时间。
5. o3 mini的发布预告
令人振奋的是,o3 mini预计将在明年一月底发布,将开放API调用,并具备o1的所有功能。这一版本的发布将进一步推动AI在编程和其他领域的应用。
结论
o3的发布标志着AI在编程和数学领域的重大进步,未来可能对程序员职业产生深远影响。这不仅让我们对AI的能力有了新的认识,也促使我们思考人类在未来职场中的角色与定位。
联系作者
文章来源:智猩猩GenAI
作者微信:
作者简介:智猩猩旗下公众号之一,深入关注大模型与AI智能体,及时搜罗生成式AI技术产品。