截胡OpenAI!清华复旦等抢先开源智能体框架Eko,一句话打造「虚拟员工」

截胡OpenAI!清华复旦等抢先开源智能体框架Eko,一句话打造「虚拟员工」

原标题:截胡OpenAI!清华复旦等抢先开源智能体框架Eko,一句话打造「虚拟员工」
文章来源:新智元
内容字数:6728字

Eko:革新生产级智能体开发框架

本文概要介绍Eko,一个由清华、复旦和斯坦福的研究者联合开发的Agent开发框架。Eko旨在帮助开发者快速构建可用于生产环境的“虚拟员工”,以自动化完成各种任务,从简单的指令到复杂的工作流程。它通过创新技术,实现了高效、灵活且安全的自动化工作流程,抢先一步超越了OpenAI计划于2025年推出的“虚拟员工计划”Operator。

  1. 核心技术创新

    Eko的三大核心技术创新使其脱颖而出:

    1. 混合智能体表示 (Mixed Agentic representation):Eko无缝结合了自然语言(高层次设计)和程序语言(低层次实现),简化了开发流程。开发者可以使用自然语言描述任务,同时利用代码实现细节控制。

    2. 跨平台Agent框架:Eko采用环境感知架构,支持浏览器、电脑以及浏览器插件等多种平台,开发者只需编写一套代码即可在不同环境中运行。

    3. 生产级干预机制:不同于强调完全自主性的现有Agent框架,Eko提供了显性的生产级干预机制,允许开发者随时中断和调整智能体的工作流程,确保对生产环境的有效监管和控制。

  2. 易用性与实际应用

    Eko的易用性令人印象深刻。只需一句话,即可让Eko生成一个完整的Agent来执行复杂任务,例如股票分析或自动化测试。例如,一句“在雅虎财经上收集纳斯达克的最新数据,包括主要股票的价格变化、市值、交易量,分析数据并生成可视化报告”就能启动一个完整的股票分析Agent。

    文章还提供了当前登录页面自动化测试的例子,展示了Eko如何轻松处理复杂的测试流程,并生成测试报告。

  3. 架构设计

    Eko的跨平台能力源于其环境感知架构,该架构由三个关键层次构成:

    1. 通用核心 (Universal Core):提供与环境无关的基本功能,如工作流管理、工具注册管理、LLM集成和钩子系统。

    2. 环境特定工具 (Environment-Specific Tools):为每种环境(浏览器扩展、Web环境、Node.js环境等)提供优化的工具集。

    3. 环境桥接 (Environment Bridge):负责环境检测、工具注册、资源管理和安全控制,确保不同平台间的顺利交互。

  4. 安全性和访问控制

    Eko在安全性方面也考虑周全。它针对不同环境实施了适当的安全措施,例如浏览器扩展和Web环境采用严格的权限控制和API密钥管理,而Node.js环境则基于用户权限进行文件操作和命令执行,并提供执行前的用户确认机制。

  5. 层次化规划与优化

    Eko采用层次化感知框架,将任务拆解为Planning layer和Execution layer。Planning layer负责将用户需求分解成任务图,Execution layer则根据任务图调用LLM合成具体的执行行为和工具调用。Eko还实现了多步合并优化,提高了推理速度。

  6. 视觉-交互要素联合感知 (VIEP)

    Eko的VIEP技术显著提升了浏览器自动化任务的准确性和效率。它通过结合视觉识别和元素上下文信息,精确定位并操作网页交互元素,并通过生成精简的伪HTML结构,降低了资源消耗和处理难度,大幅提升了自动化操作的处理速度和精准度。

  7. 生产级的可干预机制

    Eko的钩子系统允许开发者在工作流执行前后插入自定义逻辑,从而实现对自动化流程的监控、调整和干预。它提供了三种不同层级的钩子:工作流钩子、子任务钩子以及工具钩子,满足不同的监控和干预需求。

  8. 总结

    Eko是一个功能强大且易于使用的Agent开发框架,它为开发者提供了构建生产级“虚拟员工”的有效工具,显著提升工作效率和质量。其创新技术和易用性使其成为自动化领域的一大进步。


联系作者

文章来源:新智元
作者微信:
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人对人类社会与文明进化的影响,领航中国新智能时代。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...
第五届
全国人工智能大赛

总奖金超 233 万!

报名即将截止