SenseNova-Skills

SenseNova-Skills – 商汤团队开源的模块化 AI 办公技能库

SenseNova-Skills，由商汤团队倾力打造，是一款专为AI助手设计的模块化办公技能库。它将信息图制作、PPT生成、Excel数据分析以及深度研究等四大核心办公能力，拆解为的AI技能单元。这些技能能够无缝集成至OpenClaw、hermes-agent等主流Agent框架中，赋予AI助手强大的端到端专业办公执行力。

SenseNova-Skills的核心能力概览

精妙信息图生成：sn-infographic 技能提供了丰富的87种布局和66种风格选择，通过视觉语言模型（VLM）进行质量把控和多轮优化，能够将复杂的原始数据和冗长的报告转化为高度可视化的信息图。此外，sn-image-imitate 能够模仿参考图的风格创作新图，而sn-image-resume 则能自动化生成精美的简历视觉化呈现。
高效PPT自动化：以sn-ppt-entry作为统一入口，该功能支持解析PDF、DOCX、MD、TXT等多种格式文件。它可以根据需求选择创意模式（将每页内容转化为16:9的PNG图片）或标准模式（遵循样式规范，生成大纲，规划素材，经过VLM质检后输出HTML，再进行审阅并最终导出PPTX）。
精细数据分析：sn-da-excel-workflow 技能支持多工作表读取、自动将大型文件（超过1万行）转换为Parquet格式、数据清洗、筛选以及跨表聚合等操作。sn-da-image-caption 能够实现表格的OCR识别和图表内容的理解。而sn-da-large-file-analysis 则采用流式处理技术，高效应对超大文件。
深度研究能力：sn-deep-research 技能提供了一个完整的端到端研究流程，包括研究规划、多维度证据搜集、综合判断和最终报告撰写，并且支持断点续跑。其子技能包括sn-research-planning（自动生成研究计划）、sn-dimension-research（按维度执行搜索与交叉验证）以及sn-research-synthesis（整合多维度研究报告）。
多维度垂直搜索：该工具集覆盖了学术（ArXiv、PubMed）、开发者社区（GitHub、HuggingFace）、中文社交媒体（B站、知乎、抖音）以及英文社交媒体（Reddit、X、YouTube）等多个垂直领域，为深度研究提供全面的信息来源。

SenseNova-Skills的技术基石

分层技能架构：SenseNova-Skills采用了“基础层（Tier 0）”与“应用层（Tier 1）”相结合的设计理念。基础层（如sn-image-base提供的文生图和图识别能力）为上层应用技能（如sn-infographic）提供了可复用和组合的基础能力。
Agent Skills规范：每个技能都拥有自己的目录，并通过SKILL.md文件来声明其触发条件、核心能力和执行流程，确保了与OpenClaw和hermes-agent等Agent运行时的良好兼容性。
VLM驱动的质量闭环：在信息图和PPT的生成过程中，集成了视觉语言模型（VLM）进行多轮次的质量检验和评分，从而保证输出内容的专业度和符合出版级标准。
大文件流式处理技术：针对Excel等大型文件，通过openpyxl的只读模式结合iter_rows进行流式读取，并辅以Parquet格式转换和分块处理，有效降低了内存占用。
稳健的断点续跑机制：在深度研究流程中，关键的中间产物（如plan.json、sub_reports、synthesis.md）会被持久化存储到指定的report_dir目录下，使得研究过程在任何阶段中断后都能无缝恢复。

轻松上手SenseNova-Skills

Agent自动安装（推荐方式）：您可以通过向Agent（例如OpenClaw）发送自然语言指令，如：“请从https://github.com/OpenSenseNova/SenseNova-Skills安装SenseNova-Skills到技能目录。”完成安装后，重启Agent服务即可生效。
手动安装步骤：
- 克隆仓库：执行命令git clone https://github.com/OpenSenseNova/SenseNova-Skills.git --depth=1。
- 部署技能：将克隆下来的技能文件复制到Agent的技能目录中。OpenClaw用户将其放置于~/.openclaw/skills/，hermes-agent用户则复制到~/.hermes/skills/。
- 配置环境：根据每个技能目录下SKILL.md文件的指引，配置必要的API密钥和环境变量，通常在.env文件中完成。
- 重启Agent服务，然后通过自然语言指令即可调用相应技能。
直接在线体验：访问“办公小浣熊”平台，在Raccoon Pro计划中，您可以无需任何配置即可直接体验SenseNova-Skills的全套功能。

SenseNova-Skills的突出优势

全流程工作流编排：覆盖从数据分析、深度研究到PPT汇报的完整办公链条，实现复杂办公任务的一站式闭环处理。
原生Agent集成：该技能库直接嵌入Agent运行环境，用户可以通过自然语言指令调用，无需在多个SaaS平台间来回切换。
模块化与可组合性：底层能力与上层应用分离，开发者可以根据需求灵活调用单个技能或组合多个技能，构建定制化的工作流。
可控的输出质量：内置VLM质检、自动提示词评分及多轮迭代机制，显著提升了信息图和PPT的专业度和一致性。
即开即用：已集成至Raccoon Pro，为个人和企业用户提供零配置的体验；同时开源，为开发者提供无限的扩展可能。

SenseNova-Skills的项目链接

GitHub仓库：https://github.com/OpenSenseNova/SenseNova-Skills

SenseNova-Skills与同类竞品比较

维度	SenseNova-Skills	OpenClaw 办公技能生态	Microsoft Copilot Cowork
产品形态	开源端到端办公技能库	开源Agent框架及社区技能市场	闭源企业级办公Agent执行层
核心能力	信息图生成、PPT制作、Excel数据分析、深度研究、垂直搜索	邮件/日历/文档/项目管理/浏览器自动化等80+生产力技能	邮件起草、文档创建、PPT生成、日历管理、Teams发帖、跨应用研究
技能规模	20+核心技能，涵盖4大办公领域	ClawHub注册中心拥有超过13,000个社区技能，生产力类约占12%	13种内置技能，并支持最多20个自定义SKILL.md
工作流编排	端到端闭环（数据分析→深度研究→PPT汇报），技能可组合	以单点集成为主，复杂工作流需手动拼接多个技能	跨Microsoft 365应用自动拆解任务并执行，提供预置流程模板
质量保障	内置VLM视觉语言模型质检、自动提示词评分、多轮迭代优化	质量依赖社区维护，无统一质检机制，生产级技能约占10–15%	企业级安全与合规治理，无显式生成质量检查环节
运行时集成	OpenClaw、hermes-agent、Raccoon（小浣熊）Pro	原生OpenClaw运行时，兼容hermes-agent、Claude Code等	仅限Microsoft 365生态，无外部运行时扩展
自定义扩展	完全开源，可修改SKILL.md及分层技能逻辑	完全开源，社区可贡献任意技能，但缺乏办公领域统一标准	支持20个自定义SKILL.md，上限固定，不可修改内置逻辑
中文场景	原生支持，内置B站/知乎/抖音中文社交搜索及中文信息图生成	部分支持（Lark集成较好），多数技能面向国际工具链	支持中文输入，但搜索与内容源深度绑定国际版Office
部署方式	可本地/私有部署，API密钥自主管理	可本地自托管，数据完全可控	纯云端处理，依赖企业Microsoft 365合规体系
使用门槛	需配置Agent运行时及API密钥，面向技术用户	需技术背景安装与筛选技能，生态庞杂上手成本高	零配置，自然语言即可触发，面向全体知识工作者

SenseNova-Skills的典型应用场景

运营汇报自动化：利用sn-da-excel-workflow对月度运营Excel数据进行清洗与分析，结合sn-deep-research补充行业深度见解，最终通过sn-ppt-standard生成风格统一的汇报PPT。
智能化行业研究：输入行业名称，系统将自动启动研究规划、多维度证据搜集、冲突数据交叉验证及综合报告撰写流程，产出附带图表的Markdown格式报告及离线HTML版本。
信息图营销创意：将产品卖点或技术白皮书通过sn-infographic一键转化为87种布局的高密度信息图，适用于公众号、小红书、B站等多元传播渠道。
个性化简历与品牌视觉设计：使用sn-image-resume和sn-image-imitate，能够快速生成独具个性的简历视觉素材，以及符合品牌调性的视觉内容。
超大文件数据处理：对于包含万行数据的销售或财务表格，采用流式读取与Parquet转换技术，高效完成聚合分析，有效避免内存溢出问题。