SenseNova-Skills

AI工具21分钟前更新 AI工具集
0 0 0

SenseNova-Skills – 商汤团队开源的模块化 AI 办公技能库

SenseNova-Skills,由商汤团队倾力打造,是一款专为AI助手设计的模块化办公技能库。它将信息图制作、PPT生成、Excel数据分析以及深度研究等四大核心办公能力,拆解为的AI技能单元。这些技能能够无缝集成至OpenClaw、hermes-agent等主流Agent框架中,赋予AI助手强大的端到端专业办公执行力。

SenseNova-Skills的核心能力概览

  • 精妙信息图生成sn-infographic 技能提供了丰富的87种布局和66种风格选择,通过视觉语言模型(VLM)进行质量把控和多轮优化,能够将复杂的原始数据和冗长的报告转化为高度可视化的信息图。此外,sn-image-imitate 能够模仿参考图的风格创作新图,而sn-image-resume 则能自动化生成精美的简历视觉化呈现。
  • 高效PPT自动化:以sn-ppt-entry作为统一入口,该功能支持解析PDF、DOCX、MD、TXT等多种格式文件。它可以根据需求选择创意模式(将每页内容转化为16:9的PNG图片)或标准模式(遵循样式规范,生成大纲,规划素材,经过VLM质检后输出HTML,再进行审阅并最终导出PPTX)。
  • 精细数据分析sn-da-excel-workflow 技能支持多工作表读取、自动将大型文件(超过1万行)转换为Parquet格式、数据清洗、筛选以及跨表聚合等操作。sn-da-image-caption 能够实现表格的OCR识别和图表内容的理解。而sn-da-large-file-analysis 则采用流式处理技术,高效应对超大文件。
  • 深度研究能力sn-deep-research 技能提供了一个完整的端到端研究流程,包括研究规划、多维度证据搜集、综合判断和最终报告撰写,并且支持断点续跑。其子技能包括sn-research-planning(自动生成研究计划)、sn-dimension-research(按维度执行搜索与交叉验证)以及sn-research-synthesis(整合多维度研究报告)。
  • 多维度垂直搜索:该工具集覆盖了学术(ArXiv、PubMed)、开发者社区(GitHub、HuggingFace)、中文社交媒体(B站、知乎、抖音)以及英文社交媒体(Reddit、X、YouTube)等多个垂直领域,为深度研究提供全面的信息来源。

SenseNova-Skills的技术基石

  • 分层技能架构:SenseNova-Skills采用了“基础层(Tier 0)”与“应用层(Tier 1)”相结合的设计理念。基础层(如sn-image-base提供的文生图和图识别能力)为上层应用技能(如sn-infographic)提供了可复用和组合的基础能力。
  • Agent Skills规范:每个技能都拥有自己的目录,并通过SKILL.md文件来声明其触发条件、核心能力和执行流程,确保了与OpenClaw和hermes-agent等Agent运行时的良好兼容性。
  • VLM驱动的质量闭环:在信息图和PPT的生成过程中,集成了视觉语言模型(VLM)进行多轮次的质量检验和评分,从而保证输出内容的专业度和符合出版级标准。
  • 大文件流式处理技术:针对Excel等大型文件,通过openpyxl的只读模式结合iter_rows进行流式读取,并辅以Parquet格式转换和分块处理,有效降低了内存占用。
  • 稳健的断点续跑机制:在深度研究流程中,关键的中间产物(如plan.jsonsub_reportssynthesis.md)会被持久化存储到指定的report_dir目录下,使得研究过程在任何阶段中断后都能无缝恢复。

轻松上手SenseNova-Skills

  • Agent自动安装(推荐方式):您可以通过向Agent(例如OpenClaw)发送自然语言指令,如:“请从https://github.com/OpenSenseNova/SenseNova-Skills安装SenseNova-Skills到技能目录。”完成安装后,重启Agent服务即可生效。
  • 手动安装步骤
    • 克隆仓库:执行命令git clone https://github.com/OpenSenseNova/SenseNova-Skills.git --depth=1
    • 部署技能:将克隆下来的技能文件复制到Agent的技能目录中。OpenClaw用户将其放置于~/.openclaw/skills/,hermes-agent用户则复制到~/.hermes/skills/
    • 配置环境:根据每个技能目录下SKILL.md文件的指引,配置必要的API密钥和环境变量,通常在.env文件中完成。
    • 重启Agent服务,然后通过自然语言指令即可调用相应技能。
  • 直接在线体验:访问“办公小浣熊”平台,在Raccoon Pro计划中,您可以无需任何配置即可直接体验SenseNova-Skills的全套功能。

SenseNova-Skills的突出优势

  • 全流程工作流编排:覆盖从数据分析、深度研究到PPT汇报的完整办公链条,实现复杂办公任务的一站式闭环处理。
  • 原生Agent集成:该技能库直接嵌入Agent运行环境,用户可以通过自然语言指令调用,无需在多个SaaS平台间来回切换。
  • 模块化与可组合性:底层能力与上层应用分离,开发者可以根据需求灵活调用单个技能或组合多个技能,构建定制化的工作流。
  • 可控的输出质量:内置VLM质检、自动提示词评分及多轮迭代机制,显著提升了信息图和PPT的专业度和一致性。
  • 即开即用:已集成至Raccoon Pro,为个人和企业用户提供零配置的体验;同时开源,为开发者提供无限的扩展可能。

SenseNova-Skills的项目链接

  • GitHub仓库:https://github.com/OpenSenseNova/SenseNova-Skills

SenseNova-Skills与同类竞品比较

维度SenseNova-SkillsOpenClaw 办公技能生态Microsoft Copilot Cowork
产品形态开源端到端办公技能库开源Agent框架及社区技能市场闭源企业级办公Agent执行层
核心能力信息图生成、PPT制作、Excel数据分析、深度研究、垂直搜索邮件/日历/文档/项目管理/浏览器自动化等80+生产力技能邮件起草、文档创建、PPT生成、日历管理、Teams发帖、跨应用研究
技能规模20+核心技能,涵盖4大办公领域ClawHub注册中心拥有超过13,000个社区技能,生产力类约占12%13种内置技能,并支持最多20个自定义SKILL.md
工作流编排端到端闭环(数据分析→深度研究→PPT汇报),技能可组合以单点集成为主,复杂工作流需手动拼接多个技能跨Microsoft 365应用自动拆解任务并执行,提供预置流程模板
质量保障内置VLM视觉语言模型质检、自动提示词评分、多轮迭代优化质量依赖社区维护,无统一质检机制,生产级技能约占10–15%企业级安全与合规治理,无显式生成质量检查环节
运行时集成OpenClaw、hermes-agent、Raccoon(小浣熊)Pro原生OpenClaw运行时,兼容hermes-agent、Claude Code等仅限Microsoft 365生态,无外部运行时扩展
自定义扩展完全开源,可修改SKILL.md及分层技能逻辑完全开源,社区可贡献任意技能,但缺乏办公领域统一标准支持20个自定义SKILL.md,上限固定,不可修改内置逻辑
中文场景原生支持,内置B站/知乎/抖音中文社交搜索及中文信息图生成部分支持(Lark集成较好),多数技能面向国际工具链支持中文输入,但搜索与内容源深度绑定国际版Office
部署方式可本地/私有部署,API密钥自主管理可本地自托管,数据完全可控纯云端处理,依赖企业Microsoft 365合规体系
使用门槛需配置Agent运行时及API密钥,面向技术用户需技术背景安装与筛选技能,生态庞杂上手成本高零配置,自然语言即可触发,面向全体知识工作者

SenseNova-Skills的典型应用场景

  • 运营汇报自动化:利用sn-da-excel-workflow对月度运营Excel数据进行清洗与分析,结合sn-deep-research补充行业深度见解,最终通过sn-ppt-standard生成风格统一的汇报PPT。
  • 智能化行业研究:输入行业名称,系统将自动启动研究规划、多维度证据搜集、冲突数据交叉验证及综合报告撰写流程,产出附带图表的Markdown格式报告及离线HTML版本。
  • 信息图营销创意:将产品卖点或技术白皮书通过sn-infographic一键转化为87种布局的高密度信息图,适用于公众号、小红书、B站等多元传播渠道。
  • 个性化简历与品牌视觉设计:使用sn-image-resumesn-image-imitate,能够快速生成独具个性的简历视觉素材,以及符合品牌调性的视觉内容。
  • 超大文件数据处理:对于包含万行数据的销售或财务表格,采用流式读取与Parquet转换技术,高效完成聚合分析,有效避免内存溢出问题。
阅读原文
© 版权声明

相关文章

AI聚合视觉工厂

暂无评论

暂无评论...