OpenSquilla

OpenSquilla – 开源的微内核 AI Agent 框架，可降低Token成本

OpenSquilla：引领AI Agent新纪元的经济高效微内核运行时

在人工智能飞速发展的浪潮中，如何以更低的成本实现更强大的智能是行业面临的关键挑战。OpenSquilla应运而生，它是一款开源、可自托管的AI Agent运行时，以其“同样的预算，更高的智能密度”为核心理念，旨在彻底改变我们对AI Agent成本效益的认知。

OpenSquilla的核心优势在于其极简的微内核架构，仅需约100行代码即可支撑整个系统的运行。通过一系列创新技术，包括本地机器学习模型路由、自适应推理深度调整、四层认知记忆系统以及按需加载的技能模块，OpenSquilla能够显著降低Token成本，最高可达60-80%。

OpenSquilla的独特之处

OpenSquilla不仅仅是一个AI Agent的运行时，更是一个集成了多项前沿技术的智能平台。它支持接入OpenAI、Anthropic、DeepSeek、Gemini等超过20家主流大语言模型提供商，并内置了分层安全沙箱、支持Web、Slack、飞书、钉钉等多种沟通渠道的统一，以及一套丰富的工具集。此外，它还提供了从OpenClaw和Hermes Agent平滑迁移的工具，方便用户过渡。

OpenSquilla的核心功能解析

SquillaRouter智能路由：该功能利用本地部署的LightGBM和ONNX分类器，能够依据消息长度、语言、代码块、关键词以及语义嵌入评分，将任务智能地分配到T0-T3四个不同成本层级的模型中，确保以最低成本完成任务，且所有分类过程都在本地完成，无额外云端开销。
自适应推理深度：OpenSquilla能够智能识别任务的复杂度，仅对需要深度分析的复杂查询启用耗费Token的推理过程，而对于简单问题则直接响应，避免不必要的资源浪费。系统Prompt也会根据任务的实际需求进行动态调整，避免过度消耗。
多LLM提供商统一接入：无论是OpenRouter、OpenAI、Anthropic，还是Ollama、DeepSeek、Gemini、Qwen/DashScope、Moonshot、Mistral、Groq等，OpenSquilla都能提供统一的接口。它还支持主模型与备用模型的自动切换，确保服务的稳定性和可用性。
四层认知记忆架构：系统构建了包括工作记忆、情景记忆、语义记忆和原始记忆在内的四层记忆体系。它融合了向量语义检索（sqlite-vec）与BM25关键词搜索，并具备记忆的自动衰减与“冒泡”晋升机制。更有趣的是，它还支持“梦境模式”，在系统空闲时自动提炼新的技能候选。
MetaSkills可组合工作流：OpenSquilla支持灵活的工作流编排，用户可以通过meta-skill-creator进行自助创作。系统内置了超过10种技能，并能检索社区中的N+技能，同时支持Replay回放和Dream模式下的自我进化。
分层安全沙箱：提供Standard/Strict/Locked三档安全策略，在Linux环境下利用Bubblewrap系统调用级隔离技术，对CPU、内存、时长和网络进行精细化控制，无需Docker即可在Serverless环境中安全部署。
统一与多通道接入：基于Starlette ASGI构建的本地（默认127.0.0.1:18791），能够整合Web UI、CLI、Slack、Discord、Telegram、飞书、钉钉、企业微信、QQ、Matrix等多种通信平台，实现Agent能力的统一分发。
丰富内置工具集：OpenSquilla提供了包括文件读写编辑、Shell与后台进程执行、Git操作、网页搜索（Brave/DuckDuckGo）、SSRF防护、PPT/Word/Excel/PDF生成、图像生成、TTS等在内的强大工具集。
成本追踪与配额管理：系统能够实时汇总每轮和每会话的Token消耗与费用，并内置配额钩子，可自动触发节流机制，有效防止预算超支，实现精细化的成本控制。
微内核插件架构：核心编排器仅约100行代码，负责状态机与管道的协调。所有功能模块（Provider、Memory、Channels、Tools、Sandbox等）均以插件形式运行在“用户空间”，确保了核心的稳定性和插件的性，插件崩溃不会影响核心，核心升级也不会破坏插件。

如需加入AI开源项目交流群，请关注微信公众号并回复“开源”。

OpenSquilla的简易使用指南

环境准备与安装：请确保您的系统已安装Python 3.12或更高版本。使用uv工具即可一键安装OpenSquilla（当前版本0.3.1），支持Windows、macOS和Linux全平台。
初始化配置：运行opensquilla onboard命令，完成首次引导配置，包括设置默认LLM提供商、API Key、记忆存储路径以及安全沙箱策略（Standard/Strict/Locked）。
启动本地：执行opensquilla gateway run命令，启动基于Starlette ASGI的统一，默认127.0.0.1:18791。通过浏览器访问http://127.0.0.1:18791/control/即可进入Web控制台。
配置多LLM提供商：在控制台或配置文件中，添加OpenAI、Anthropic、DeepSeek、Gemini、Qwen、Moonshot等20+提供商的API Key，并设置主备模型，以启用SquillaRouter的自动路由功能。
通过Web UI交互：在控制台中直接输入您的指令，系统将自动完成模型路由、推理深度判断、记忆检索及工具调用，并实时显示每轮的Token消耗和费用。
接入多通道平台：配置Slack、Discord、Telegram、飞书、钉钉、企业微信、QQ、Matrix等平台的Webhook或Bot Token，即可实现多平台共享Agent能力。
使用与创作MetaSkills：您可以直接调用内置Skills处理日常任务，或通过meta-skill-creator自助创建可组合工作流。开启Dream模式，让系统在空闲时自动挖掘新的技能候选。
管理记忆与上下文：系统会自动维护工作记忆、情景记忆、语义记忆、原始记忆这四层记忆结构。您可以手动查看、编辑记忆条目，并配置自动衰减和冒泡晋升策略。
配置安全沙箱：在Linux环境下，启用Bubblewrap系统调用级隔离，限制CPU、内存、执行时长和网络访问，无需Docker即可安全执行Shell和文件操作。
监控与配额管理：在控制台即可查看每轮/每会话的Token与费用明细，并可设置配额阈值，实现自动节流，有效控制预算。
数据迁移（可选）：如果您是从OpenClaw或Hermes Agent迁移，可以使用官方迁移工具导入记忆、人格文件、Skills和通道配置，并进行冲突项的预览和处理。

OpenSquilla的官方信息

项目官网：https://opensquilla.ai/zh/ 或 https://opensquilla.ai/
GitHub仓库：https://github.com/opensquilla/opensquilla

OpenSquilla的核心优势亮点

Token成本大幅降低：通过智能本地路由、分级推理、Prompt优化以及按需技能加载，OpenSquilla在同等预算下实现了60-80%的成本节约，显著提升了智能密度。
极致精简的微内核架构：核心编排器代码量极小（约100行），所有功能均以插件形式运行，保证了系统的稳定性和可维护性，插件崩溃不影响核心，核心升级不影响插件。
本地智能模型路由：SquillaRouter利用本地ML模型在设备端完成任务的智能分类，将任务分配至成本最低的可用模型，消除了云端路由的额外开销。
先进的四层认知记忆系统：分层记忆管理结合向量+关键词检索，并支持记忆的动态衰减与“冒泡”晋升，使Agent的记忆越用越精准。
智能推理与Prompt自适应：系统仅对复杂任务进行深度推理，简单任务零成本；Prompt长度也根据任务复杂度自动调整，避免不必要的Token消耗。
系统级安全沙箱：在Linux环境下，通过Bubblewrap实现CPU/内存/时长/网络的系统调用级隔离，无需Docker即可在Serverless环境中安全运行。
统一的多通道接入：基于Starlette ASGI的本地，整合了Web UI、CLI及多种即时通讯工具，实现Agent能力的跨平台统一访问。
MetaSkills的自我进化能力：支持可组合工作流、自助创作以及社区技能的自动检索，配合梦境模式，Agent能够持续学习和进化，不断提升自身能力。

OpenSquilla与竞品对比分析

维度	OpenSquilla	OpenClaw	Hermes Agent
架构设计	微内核，五层分离，核心代码极简，插件支持自动跳过与回滚。	插件生态成熟，但系统层级相对较多。	单体同步主循环设计，逻辑耦合度较高。
成本优化策略	结合ML路由、推理分级、Prompt缓存及按需技能加载，实现60-80%的成本节约。	模型链配置写死，不支持动态自动选择。	采用基于关键词和字数的粗略判断，路由单一。
MetaSkills能力	支持可组合工作流、自助创作、社区技能检索及梦境进化。	Prompt串联的skill chain，缺乏meta-protocol层。	无复用工作流抽象，每次都需要从头编写。
记忆系统	融合向量+关键词检索，支持去重、衰减、冒泡及自动迁移。	具备衰减/冒泡/重排功能，但缺少四层认知结构。	仅支持关键词搜索，语义记忆需额外集成。
安全沙箱机制	系统调用级隔离，无需Docker，适合Serverless部署。	可选Docker，OpenShell轻量但仍有一定开销。	提供危险命令审批及六种执行环境。
成本追踪功能	实时显示每次调用的实际成本，并支持配额自动节流。	内置定价表，成本信息会写入会话元数据。	细分追踪输入、输出、缓存和推理Token。

OpenSquilla的应用场景展望

个人与开发者低成本AI助手：借助SquillaRouter智能路由和自适应推理，OpenSquilla将Token成本降低60-80%，非常适合预算有限的个人开发者、创作者或学生，作为日常编程、写作和问答的AI助手。
企业多平台智能客服与办公助手：通过统一，OpenSquilla可同时接入飞书、钉钉、企业微信、Slack、Discord等多个沟通平台，实现一套Agent能力覆盖全公司沟通渠道，高效处理内部咨询、工单流转和知识问答。
高敏感数据场景的私有化AI部署：OpenSquilla支持完全自托管和本地运行，四层记忆数据存储在本地，配合Bubblewrap系统级安全沙箱，特别适用于金融、医疗、法律等对数据隐私和合规性要求极高的行业。
自动化工作流与任务编排：利用MetaSkills可组合工作流和丰富的内置工具集（如文件编辑、Git、网页搜索、文档生成等），OpenSquilla能够自动化报告生成、代码审查、数据抓取、PPT/Excel批量处理等重复性工作。
多模型策略管理与A/B测试：系统支持接入20+ LLM提供商并配置主备模型，企业可以根据任务复杂度灵活分配模型资源，也可用于不同模型间的效果评估和成本优化实验。
Serverless与边缘计算部署：其微内核架构轻量级，安全沙箱无需Docker即可运行，非常适合部署在Serverless函数计算或边缘设备上，作为低资源占用的嵌入式AI服务。

阅读原文

# AI工具 # AI项目和框架 # AI内容生成 # AI写作平台 # OpenSquilla # SEO优化工具 # 内容创作助手 # 文章生成器

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...