原标题:AI能帮你订机票了!OpenAI 将推出计算机操控功能
文章来源:AI范儿
内容字数:2636字
OpenAI 的 Operator:AI 操控电脑的突破与挑战
OpenAI 计划推出名为 Operator 的计算机操作代理系统,它能在用户的网络浏览器中完成各项任务,标志着 AI 向取代人工任务迈进了一大步。其他公司如 Google 和 Anthropic 也在开发类似的“代理”系统,希望以此实现通用人工智能 (AGI) 的承诺。
1. Operator 的功能与应用
Operator 将提供旅行、餐饮、活动等方面的建议,并能协助用户完成相关任务,例如查找航班。虽然它不能完成实际交易,但能极大简化操作流程。 老年人可以使用它发送邮件等,而企业可以利用它进行网站测试等质量保证工作。其工作原理是通过捕获浏览器截图,发送给 OpenAI 分析,再发送指令控制浏览器操作。
2. 技术原理与多模态能力
Operator 利用了 OpenAI 等公司开发的多模态技术,能够同时处理文本和图像等多种输入,从而实现对浏览器的精确控制。这需要强大的 AI 模型来理解用户的指令并将其转化为具体的浏览器操作。
3. AGI 的追求与挑战
许多 AI 初创公司都在追求 AGI,希望 AI 能够替代人类完成大多数任务。随着语言模型性能提升速度放缓,计算机使用代理成为新的突破口。然而,要实现 AGI,AI 必须能够实际完成任务,而不仅仅是写作。Anthropic 的早期测试显示,这类系统仍不成熟,存在诸多问题,例如容易陷入循环、遗忘任务、运行速度慢以及高昂的运营成本。
4. 潜在风险与滥用问题
这类系统也存在潜在风险。一些初创公司已经利用类似技术进行网络营销垃圾信息的自动发布,绕过 API 限制。因此,防止滥用至关重要,否则网络环境将进一步恶化。
5. 发展前景与行业趋势
计算机使用代理的发展可能类似于自动驾驶汽车,初期容易实现简单任务,但解决复杂情况需要更长时间。OpenAI 将 AGI 的实现定义为创造出能产生至少 1000 亿美元利润的 AI 系统,这是一个极具挑战性的目标。 同时,企业客户对 AI 工具的采用速度不及预期,这表明 AI 技术的实际应用仍面临诸多挑战。
6. 重要结论
Operator 代表着 AI 技术发展的一个重要方向,但同时也面临着诸多挑战,包括技术成熟度、安全风险和商业化难题。 AGI 的实现仍然是一个长期的目标,需要持续的技术突破和完善的监管机制。
联系作者
文章来源:AI范儿
作者微信:
作者简介:专注于探索 AIGC,发掘人工智能的乐趣。