2025 年了,OpenAI 预热多时要发的超级智能体又一次没赶在前边。
原标题:OpenAI 想了快 10 年的超级智能体终于来了!有惊喜,但比智谱晚还“翻车”系数高?
文章来源:AI前线
内容字数:5736字
2025年智能体竞赛:OpenAI与智谱的角逐
2025年,OpenAI和智谱AI在智能体领域展开激烈竞争。OpenAI姗姗来迟地发布了Operator,一款能够访问网页并执行任务的智能体,而智谱AI则升级了其GLM-PC智能体,进一步提升了代码思维和逻辑推理能力。
1. OpenAI的Operator:好坏参半的初体验
Operator作为OpenAI首款真正模拟人类操作网页浏览器的智能体,能够完成预订、购物等复杂任务。它支持多任务同时运行,并允许用户保存常用提示词,方便重复性操作。然而,Operator也存在不足,例如在处理复杂界面时表现不佳,且在演示过程现过“翻车”情况。OpenAI官方也承认Operator目前仍处于研究预览阶段,存在出错的可能性。
2. 智谱AI的GLM-PC升级:代码思维与深度思考
智谱AI的GLM-PC v1.1在去年发布的v1.0基础上进行了升级,加入了“深度思考”模式,增强了逻辑推理和代码生成能力。它采用“左右脑”协作模式,左脑负责代码生成和逻辑执行,右脑专注于深度感知和交互体验。GLM-PC能够处理复杂逻辑任务,并展现出更高的适应能力和创造力,在实际应用中表现出色,例如自动生成个性化微信群祝福语等。
3. 技术路线的差异与比较
Operator由CUA模型支持,结合了GPT-4o的视觉功能和强化学习,能够与图形用户界面交互。GLM-PC则采用CogAgent和CodeGeex模型,以代码形式指挥工作流程。评测结果显示,CogAgent在部分指标上表现出色,但在某些方面仍逊于Claude-3.5-Sonnet和结合外接GUI grounding模型的GPT-4o。
4. 超级智能体的未来展望
OpenAI计划公开Operator的CUA模型API,方便开发者构建自己的智能体。智谱AI则计划将GLM-PC与AIPC深度融合,并与PC厂商合作。业内人士认为未来十年是智能体的十年,智能体将像自动驾驶系统一样辅助人类完成任务,甚至可能管理公司运营。然而,多模态技术与大语言模型的整合以及处理超长任务周期等挑战仍然存在。
5. QCon全球软件开发大会推荐
文章最后推荐了2025年4月10-12日举办的QCon全球软件开发大会,主题为“智能融合,引领未来”,旨在探讨AI大模型技术对软件开发领域的变革与机遇。
联系作者
文章来源:AI前线
作者微信:
作者简介:面向AI爱好者、开发者和科学家,提供大模型最新资讯、AI技术分享干货、一线业界实践案例,助你全面拥抱AIGC。