一句话让Agent自主干活,清华复旦斯坦福等开源的智能体开发框架抢先了OpenAI

抢先 OpenAI 发布开源版「虚拟员工」开发框架。

一句话让Agent自主干活,清华复旦斯坦福等开源的智能体开发框架抢先了OpenAI

原标题:一句话让Agent自主干活,清华复旦斯坦福等开源的智能体开发框架抢先了OpenAI
文章来源:机器之心
内容字数:6854字

Eko框架:革新生产级智能体开发

机器之心AIxiv专栏报道了清华、复旦和斯坦福的研究者联合提出的Eko Agent开发框架,旨在简化生产级“虚拟员工”的构建。 Eko允许开发者通过简洁的代码和自然语言快速构建AI代理,实现自动化工作流程,例如写代码、预订旅行等。这与OpenAI计划于2025年推出的“Operator”虚拟员工计划不谋而合,都旨在提升工作效率。

1. Eko框架的核心技术创新

Eko框架的主要技术创新体现在以下几个方面:

  1. 混合智能体表示:Eko结合了自然语言(高层次设计)和程序语言(低层次实现),实现无缝衔接。

  2. 跨平台Agent框架:基于环境感知架构,Eko支持浏览器、电脑和浏览器插件等多种环境,使用同一套框架和编程语言。

  3. 生产级干预机制:不同于强调完全自主性的现有框架,Eko提供了显性的生产级干预机制,允许随时中断和调整智能体工作流,确保人类对流程的有效监管。

2. Eko框架的易用性与实际应用

Eko框架的易用性令人印象深刻。只需一句自然语言指令,例如“在雅虎财经上收集纳斯达克的最新数据,包括主要股票的价格变化、市值、交易量,分析数据并生成可视化报告”,Eko就能生成一个完整的Agent来执行任务。 另一个例子是自动化登录页面测试,Eko可以根据自然语言描述自动生成测试用例并生成测试报告。

3. Eko框架的环境感知架构

Eko的跨平台能力源于其环境感知架构,该架构由三个层次构成:

  1. 通用核心:提供与环境无关的基本功能,如工作流管理、工具注册管理、LLM集成和钩子系统。

  2. 环境特定工具:为不同环境(浏览器扩展、Web环境、Node.js环境)提供优化的工具集。

  3. 环境桥接:负责环境检测、工具注册、资源管理和安全控制,确保不同平台间的顺利交互。

4. Eko框架的安全性和访问控制

Eko针对不同环境实施了相应安全措施,例如浏览器扩展和Web环境采用严格的权限控制和API密钥管理,Node.js环境则基于用户权限进行文件操作和命令执行,并在必要时请求用户确认。

5. Eko框架的层次化规划与优化

Eko采用层次化规划框架,将任务拆解为规划层和执行层,并通过多步合并优化机制加快推理速度。 其视觉-交互要素联合感知(VIEP)框架,通过结合视觉识别和元素上下文信息,提升了在复杂网页中任务的精度和效率。

6. Eko框架的生产级可干预机制

Eko提供工作流钩子、子任务钩子以及工具钩子三种不同层级的钩子,允许开发者在工作流执行的不同阶段进行监控、调整和干预,确保流程的可靠性和安全性。

7. 总结与展望

Eko框架为AI开发者和自动化使用者提供了一种更灵活高效的工具,能够将虚拟员工部署到实际生产环境中,提升工作效率和质量。 其易用性和强大的功能使其成为未来生产力工具的有力竞争者。


联系作者

文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...