Step 3.7 Flash

AI工具30分钟前更新 AI工具集
0 0 0

Step 3.7 Flash – 阶跃星辰开源的新一代 Flash 模型

Step 3.7 Flash:引领新一代开源大模型迈向生产化新纪元

阶跃星辰重磅推出其新一代开源大模型——Step 3.7 Flash,专为 Agent 的规模化应用而设计。该模型采用先进的稀疏 MoE 架构,在推理速度上实现了惊人的突破,最高可达每秒 400 个 token 的生成能力。Step 3.7 Flash 的诞生,标志着大模型在智能化代理(Agent)的实际落地与高效部署方面迈出了坚实的一步。

Step 3.7 Flash 的核心亮点

Step 3.7 Flash 聚焦于 Agent 在实际应用场景中的关键需求,围绕 Agent 核心能力、代码生成、联网搜索以及多模态工作流进行了深度优化。它在速度、成本效益、任务执行的可靠性以及处理复杂任务的能力之间找到了完美的平衡点,为开发者构建生产级 Agent 提供了一个高效且强大的基础模型。

Step 3.7 Flash 的主要功能集锦

  • 原生多模态理解与执行能力:该模型能够直接解析用户界面(UI)、各类图表、文档、图片以及应用程序界面,并将复杂的视觉信息转化为结构化的数据、可执行的代码或明确的任务指令。其强大的视觉处理能力还支持用户进行自主的图像裁剪、放大和重新阅读,极大地增强了模型的交互性和实用性。
  • 增强的联网与视觉搜索联动:Step 3.7 Flash 在联网信息检索和图像搜索方面得到了显著强化。在开放的信息环境中,它能够主动地跨越文本和图像的界限,搜集并交叉比对来自多个来源的证据,确保信息的准确性和全面性。
  • 高可靠的工具调用与工作流编排:在长程、多轮的 Agent 工作流程中,Step 3.7 Flash 展现了卓越的稳定性,能够可靠地调用 API、浏览器、终端、Office 套件以及其他外部系统。它能够有效维持任务执行的轨迹一致性,避免任务偏离或中断。
  • Agent 生态的无缝兼容:为了降低开发者接入成本,Step 3.7 Flash 针对 Claude Code、KiloCode、RooCode、OpenCode、Hermes Agent 以及 OpenClaw 等主流 Agent 框架进行了深度适配,同时兼容 MCP/Skills 协议,实现即插即用的便捷体验。
  • 灵活的双重部署模式:用户既可以选择通过云端 API 进行便捷调用,也能针对个人工作站进行本地部署优化。特别值得一提的是,它提供了 GGUF 多精度端侧版本,使得在资源受限的设备上也能流畅运行。

Step 3.7 Flash 的技术原理剖析

  • 高效的稀疏 MoE 架构:Step 3.7 Flash 采用了稀疏混合专家模型(MoE)架构。其总参数量高达 196B(文本部分)+ 1.8B(ViT 视觉部分),但激活参数量仅为 11B,这使得模型在保持强大能力的同时,大幅降低了推理成本,实现了性能与成本的最佳平衡。
  • 深度融合视觉感知、搜索与推理:该模型将视觉信息的感知、外部信息的搜索以及智能推理过程进行了深度整合。面对复杂的视觉问题时,它能够主动触发搜索机制,通过交叉验证来提升答案的准确性。
  • 长程任务轨迹的卓越保持力:通过精细的优化,Step 3.7 Flash 在多轮 Agent 工作流中能够有效维持任务执行的连贯性,显著降低了任务跑偏和执行失败的概率。
  • 多精度端侧优化方案:为满足不同硬件环境下的部署需求,Step 3.7 Flash 提供了 GGUF 格式的支持,用户可以根据自身硬件配置选择最适合的量化版本,实现本地高效运行。

如何轻松上手 Step 3.7 Flash

Step 3.7 Flash 的核心竞争优势

  • 极致推理速度:高达 400 TPS 的单请求处理能力,完美契合高频、多轮、低延迟的 Agent 应用场景。
  • 极低的激活参数消耗:仅需 11B 激活参数,推理成本大幅降低,为用户带来极高的性价比。
  • 生产级可靠性保障:在 Toolathlon(49.5%)、ClawEval-1.1(67.1%)、GDPval(45.8%)等真实场景基准测试中均表现出稳定优异的性能。
  • 深度的多模态理解能力:在 SimpleVQA(79.2%)、V*(95.3%)等复杂视觉任务上,其表现已能媲美更大规模的旗舰模型。
  • 即插即用的生态兼容性:针对主流 Agent 框架和 MCP/Skills 协议进行了预优化,大大简化了集成过程。

Step 3.7 Flash 的项目资源链接

Step 3.7 Flash 与同类竞品对比分析

对比维度Step 3.7 FlashStep 3.5 FlashGemini 2.5 Flash
架构稀疏 MoE,196B/11B 激活前代 Flash 架构未知
最高速度400 TPS较低较高
SWE-Bench Pro56.351.355.6
Terminal-Bench 2.159.553.462.0
SimpleVQA (Tool)79.278.278.2
V (Python)*95.389.096.9
ClawEval-1.167.143.657.8
Toolathlon49.533.352.8
HLE (Tool)47.235.745.1
开源✅ 完全开源✅ 开源❌ 闭源

Step 3.7 Flash 的广泛应用场景

  • Coding Agent 领域:在 SWE-Bench Pro 和 Terminal-Bench 等专业基准测试中表现卓越,能够稳定地完成代码生成、调试以及终端操作等开发任务。
  • 多模态知识工作助手:能够自主理解 UI 界面、图表、文档等视觉信息,并生成结构化的分析报告或操作指南,非常适用于产品分析、设计评审以及软件教程的自动化生成。
  • 企业流程自动化解决方案:通过稳定调用各类 API、Office 工具和外部系统,能够无缝集成到企业工作流程中,高效执行数据录入、报表生成以及跨系统操作等任务。
  • 智能视觉搜索与验证工具:在信息不明确的情况下,能够主动发起图像搜索并进行交叉验证,可广泛应用于电商比价、内容审核及事实核查等场景。
阅读原文
© 版权声明

相关文章

AI聚合视觉工厂

暂无评论

暂无评论...