OpenSquilla

AI工具36分钟前更新 AI工具集
0 0 0

OpenSquilla – 开源的微内核 AI Agent 框架,可降低Token成本

OpenSquilla:引领AI Agent新纪元的经济高效微内核运行时

在人工智能飞速发展的浪潮中,如何以更低的成本实现更强大的智能是行业面临的关键挑战。OpenSquilla应运而生,它是一款开源、可自托管的AI Agent运行时,以其“同样的预算,更高的智能密度”为核心理念,旨在彻底改变我们对AI Agent成本效益的认知。

OpenSquilla的核心优势在于其极简的微内核架构,仅需约100行代码即可支撑整个系统的运行。通过一系列创新技术,包括本地机器学习模型路由、自适应推理深度调整、四层认知记忆系统以及按需加载的技能模块,OpenSquilla能够显著降低Token成本,最高可达60-80%。

OpenSquilla的独特之处

OpenSquilla不仅仅是一个AI Agent的运行时,更是一个集成了多项前沿技术的智能平台。它支持接入OpenAI、Anthropic、DeepSeek、Gemini等超过20家主流大语言模型提供商,并内置了分层安全沙箱、支持Web、Slack、飞书、钉钉等多种沟通渠道的统一,以及一套丰富的工具集。此外,它还提供了从OpenClaw和Hermes Agent平滑迁移的工具,方便用户过渡。

OpenSquilla的核心功能解析

  • SquillaRouter智能路由:该功能利用本地部署的LightGBM和ONNX分类器,能够依据消息长度、语言、代码块、关键词以及语义嵌入评分,将任务智能地分配到T0-T3四个不同成本层级的模型中,确保以最低成本完成任务,且所有分类过程都在本地完成,无额外云端开销。
  • 自适应推理深度:OpenSquilla能够智能识别任务的复杂度,仅对需要深度分析的复杂查询启用耗费Token的推理过程,而对于简单问题则直接响应,避免不必要的资源浪费。系统Prompt也会根据任务的实际需求进行动态调整,避免过度消耗。
  • 多LLM提供商统一接入:无论是OpenRouter、OpenAI、Anthropic,还是Ollama、DeepSeek、Gemini、Qwen/DashScope、Moonshot、Mistral、Groq等,OpenSquilla都能提供统一的接口。它还支持主模型与备用模型的自动切换,确保服务的稳定性和可用性。
  • 四层认知记忆架构:系统构建了包括工作记忆、情景记忆、语义记忆和原始记忆在内的四层记忆体系。它融合了向量语义检索(sqlite-vec)与BM25关键词搜索,并具备记忆的自动衰减与“冒泡”晋升机制。更有趣的是,它还支持“梦境模式”,在系统空闲时自动提炼新的技能候选。
  • MetaSkills可组合工作流:OpenSquilla支持灵活的工作流编排,用户可以通过meta-skill-creator进行自助创作。系统内置了超过10种技能,并能检索社区中的N+技能,同时支持Replay回放和Dream模式下的自我进化。
  • 分层安全沙箱:提供Standard/Strict/Locked三档安全策略,在Linux环境下利用Bubblewrap系统调用级隔离技术,对CPU、内存、时长和网络进行精细化控制,无需Docker即可在Serverless环境中安全部署。
  • 统一与多通道接入:基于Starlette ASGI构建的本地(默认127.0.0.1:18791),能够整合Web UI、CLI、Slack、Discord、Telegram、飞书、钉钉、企业微信、QQ、Matrix等多种通信平台,实现Agent能力的统一分发。
  • 丰富内置工具集:OpenSquilla提供了包括文件读写编辑、Shell与后台进程执行、Git操作、网页搜索(Brave/DuckDuckGo)、SSRF防护、PPT/Word/Excel/PDF生成、图像生成、TTS等在内的强大工具集。
  • 成本追踪与配额管理:系统能够实时汇总每轮和每会话的Token消耗与费用,并内置配额钩子,可自动触发节流机制,有效防止预算超支,实现精细化的成本控制。
  • 微内核插件架构:核心编排器仅约100行代码,负责状态机与管道的协调。所有功能模块(Provider、Memory、Channels、Tools、Sandbox等)均以插件形式运行在“用户空间”,确保了核心的稳定性和插件的性,插件崩溃不会影响核心,核心升级也不会破坏插件。

如需加入AI开源项目交流群,请关注微信公众号并回复“开源”。

OpenSquilla的简易使用指南

  • 环境准备与安装:请确保您的系统已安装Python 3.12或更高版本。使用uv工具即可一键安装OpenSquilla(当前版本0.3.1),支持Windows、macOS和Linux全平台。
  • 初始化配置:运行opensquilla onboard命令,完成首次引导配置,包括设置默认LLM提供商、API Key、记忆存储路径以及安全沙箱策略(Standard/Strict/Locked)。
  • 启动本地:执行opensquilla gateway run命令,启动基于Starlette ASGI的统一,默认127.0.0.1:18791。通过浏览器访问http://127.0.0.1:18791/control/即可进入Web控制台。
  • 配置多LLM提供商:在控制台或配置文件中,添加OpenAI、Anthropic、DeepSeek、Gemini、Qwen、Moonshot等20+提供商的API Key,并设置主备模型,以启用SquillaRouter的自动路由功能。
  • 通过Web UI交互:在控制台中直接输入您的指令,系统将自动完成模型路由、推理深度判断、记忆检索及工具调用,并实时显示每轮的Token消耗和费用。
  • 接入多通道平台:配置Slack、Discord、Telegram、飞书、钉钉、企业微信、QQ、Matrix等平台的Webhook或Bot Token,即可实现多平台共享Agent能力。
  • 使用与创作MetaSkills:您可以直接调用内置Skills处理日常任务,或通过meta-skill-creator自助创建可组合工作流。开启Dream模式,让系统在空闲时自动挖掘新的技能候选。
  • 管理记忆与上下文:系统会自动维护工作记忆、情景记忆、语义记忆、原始记忆这四层记忆结构。您可以手动查看、编辑记忆条目,并配置自动衰减和冒泡晋升策略。
  • 配置安全沙箱:在Linux环境下,启用Bubblewrap系统调用级隔离,限制CPU、内存、执行时长和网络访问,无需Docker即可安全执行Shell和文件操作。
  • 监控与配额管理:在控制台即可查看每轮/每会话的Token与费用明细,并可设置配额阈值,实现自动节流,有效控制预算。
  • 数据迁移(可选):如果您是从OpenClaw或Hermes Agent迁移,可以使用官方迁移工具导入记忆、人格文件、Skills和通道配置,并进行冲突项的预览和处理。

OpenSquilla的官方信息

  • 项目官网:https://opensquilla.ai/zh/ 或 https://opensquilla.ai/
  • GitHub仓库:https://github.com/opensquilla/opensquilla

OpenSquilla的核心优势亮点

  • Token成本大幅降低:通过智能本地路由、分级推理、Prompt优化以及按需技能加载,OpenSquilla在同等预算下实现了60-80%的成本节约,显著提升了智能密度。
  • 极致精简的微内核架构:核心编排器代码量极小(约100行),所有功能均以插件形式运行,保证了系统的稳定性和可维护性,插件崩溃不影响核心,核心升级不影响插件。
  • 本地智能模型路由:SquillaRouter利用本地ML模型在设备端完成任务的智能分类,将任务分配至成本最低的可用模型,消除了云端路由的额外开销。
  • 先进的四层认知记忆系统:分层记忆管理结合向量+关键词检索,并支持记忆的动态衰减与“冒泡”晋升,使Agent的记忆越用越精准。
  • 智能推理与Prompt自适应:系统仅对复杂任务进行深度推理,简单任务零成本;Prompt长度也根据任务复杂度自动调整,避免不必要的Token消耗。
  • 系统级安全沙箱:在Linux环境下,通过Bubblewrap实现CPU/内存/时长/网络的系统调用级隔离,无需Docker即可在Serverless环境中安全运行。
  • 统一的多通道接入:基于Starlette ASGI的本地,整合了Web UI、CLI及多种即时通讯工具,实现Agent能力的跨平台统一访问。
  • MetaSkills的自我进化能力:支持可组合工作流、自助创作以及社区技能的自动检索,配合梦境模式,Agent能够持续学习和进化,不断提升自身能力。

OpenSquilla与竞品对比分析

维度OpenSquillaOpenClawHermes Agent
架构设计微内核,五层分离,核心代码极简,插件支持自动跳过与回滚。插件生态成熟,但系统层级相对较多。单体同步主循环设计,逻辑耦合度较高。
成本优化策略结合ML路由、推理分级、Prompt缓存及按需技能加载,实现60-80%的成本节约。模型链配置写死,不支持动态自动选择。采用基于关键词和字数的粗略判断,路由单一。
MetaSkills能力支持可组合工作流、自助创作、社区技能检索及梦境进化。Prompt串联的skill chain,缺乏meta-protocol层。无复用工作流抽象,每次都需要从头编写。
记忆系统融合向量+关键词检索,支持去重、衰减、冒泡及自动迁移。具备衰减/冒泡/重排功能,但缺少四层认知结构。仅支持关键词搜索,语义记忆需额外集成。
安全沙箱机制系统调用级隔离,无需Docker,适合Serverless部署。可选Docker,OpenShell轻量但仍有一定开销。提供危险命令审批及六种执行环境。
成本追踪功能实时显示每次调用的实际成本,并支持配额自动节流。内置定价表,成本信息会写入会话元数据。细分追踪输入、输出、缓存和推理Token。

OpenSquilla的应用场景展望

  • 个人与开发者低成本AI助手:借助SquillaRouter智能路由和自适应推理,OpenSquilla将Token成本降低60-80%,非常适合预算有限的个人开发者、创作者或学生,作为日常编程、写作和问答的AI助手。
  • 企业多平台智能客服与办公助手:通过统一,OpenSquilla可同时接入飞书、钉钉、企业微信、Slack、Discord等多个沟通平台,实现一套Agent能力覆盖全公司沟通渠道,高效处理内部咨询、工单流转和知识问答。
  • 高敏感数据场景的私有化AI部署:OpenSquilla支持完全自托管和本地运行,四层记忆数据存储在本地,配合Bubblewrap系统级安全沙箱,特别适用于金融、医疗、法律等对数据隐私和合规性要求极高的行业。
  • 自动化工作流与任务编排:利用MetaSkills可组合工作流和丰富的内置工具集(如文件编辑、Git、网页搜索、文档生成等),OpenSquilla能够自动化报告生成、代码审查、数据抓取、PPT/Excel批量处理等重复性工作。
  • 多模型策略管理与A/B测试:系统支持接入20+ LLM提供商并配置主备模型,企业可以根据任务复杂度灵活分配模型资源,也可用于不同模型间的效果评估和成本优化实验。
  • Serverless与边缘计算部署:其微内核架构轻量级,安全沙箱无需Docker即可运行,非常适合部署在Serverless函数计算或边缘设备上,作为低资源占用的嵌入式AI服务。
阅读原文
© 版权声明

相关文章

AI聚合视觉工厂

暂无评论

暂无评论...