星火X2-Flash

星火X2-Flash – 科大讯飞推出的MoE架构大语言模型

科大讯飞近期推出了一款名为“星火X2-Flash”的重磅级大语言模型，该模型采用了前沿的MoE（混合专家）架构，拥有300亿的庞大参数量，并具备令人瞩目的256K超长上下文处理能力。值得一提的是，星火X2-Flash的训练过程完全依托于华为昇腾910B国产算力集群，展现了我国在人工智能核心技术自主可控方面的显著进步。

揭秘星火X2-Flash：AI新时代的智能核心

星火X2-Flash，作为科大讯飞在AI领域的一项重要创新，是一款基于MoE架构设计的先进大语言模型。其300亿的参数规模，配合高达256K的超长上下文窗口，使其在处理复杂信息和长序列任务时游刃有余。该模型的诞生，离不开华为昇腾910B国产算力集群的强大支撑，这标志着国产算力在支撑顶尖大模型训练方面已达到全新高度。星火X2-Flash的问世，正是为了迎接Agent（智能体）时代的到来，它在智能体任务执行、代码生成以及深度研究等多个维度上，表现已能与动辄万亿参数的模型相媲美，但其Token消耗成本却控制在主流大模型的三分之一以内，极具经济效益。模型通过引入DSA（稀疏注意力）和MTP（多Token预测）等创新技术，实现了训练和推理的高效化。目前，星火X2-Flash的API已全面开放，并已成功集成至AstronClaw、Loomy等多个知名平台，为开发者提供了便捷的应用入口。

星火X2-Flash的核心能力概览

智能体任务的卓越执行力：星火X2-Flash能够深入理解和执行复杂的Agent工作流，包括生成详尽的研究报告、智能管理和调用各类Skill（技能），以及对系统进行精细化控制和操作，其表现已接近万亿级参数模型的水准。
高效的代码生成助手：该模型能够快速生成功能完备的复杂Skill，例如AI视频生成Skill，并提供完整的技能结构、核心功能实现以及实际使用案例，极大地提升了开发效率。
无缝处理海量信息：凭借其256K的超大上下文窗口，星火X2-Flash能够轻松应对Agent任务中可能涉及的数十万甚至上百万Token的庞大数据量，确保长链路任务的顺畅进行。
广泛的平台兼容性：模型已成功接入AstronClaw、Loomy等平台，并且能够与OpenClaw、Claude Code等主流Agent开发框架实现无缝兼容，为开发者提供了极大的灵活性。
便捷的API服务：开发者可以通过讯飞开放平台和星辰MaaS平台轻松调用星火X2-Flash的API。此外，星辰Coding Plan也已全面支持该模型，用户可以方便地进行切换使用。

星火X2-Flash背后的技术驱动力

MoE架构的效率优势：模型采用了混合专家（MoE）架构，尽管总参数量为300亿，但通过巧妙地分配计算资源，在保持强大性能的同时，显著提升了运行效率。
国产算力的自主赋能：星火X2-Flash的训练完全基于华为昇腾910B国产算力集群，通过针对国产芯片优化的算子和分布式训练策略，实现了高效且自主可控的训练过程。
智能体数据闭环的创新构建：模型通过一个大规模的智能体数据自动合成平台，实现了数据的闭环生成。在这个平台上，Agent能够自主搭建测试环境，并验证结果的准确性，从而高效地合成训练数据。
长文本训练效率的性突破：在国产算力环境下，星火X2-Flash率先将DSA（稀疏注意力）与MTP（多Token预测）技术相结合，将上下文长度拓展至256K。与同等规模的A800集群相比，其训练效率从20%大幅跃升至90%。
加速采样解码的引擎：在强化学习训练场景下，通过算法与工程上的创新，星火X2-Flash实现了采样解码效率的最高2倍以上提升，有效解决了长交互场景下RL训练面临的算力瓶颈。

星火X2-Flash的关键信息速览与使用指南

模型标识：星火X2-Flash
研发及发布方：科大讯飞 / 讯飞开放平台
核心架构：MoE（混合专家），总参数30B
上下文容量：最高支持256K Token
训练基座：华为昇腾910B国产集群
已集成平台：AstronClaw、Loomy
API接入点：讯飞开放平台、星辰MaaS平台
框架兼容性：OpenClaw、Claude Code等主流Agent框架
使用建议：
- 开发者可经由讯飞开放平台或星辰MaaS平台获取API访问权限。
- 星辰Coding Plan已全面集成该模型，新老用户均可便捷地选择和切换使用。

星火X2-Flash的独特优势剖析

无与伦比的性价比：在处理复杂的Agent任务时，其表现足以比肩万亿级参数的模型，而Token消耗仅为主流大模型的1/3，经济效益显著。
国产算力的自主保障：基于华为昇腾910B集群训练，确保了模型在本土算力架构上的高效运行和自主可控。
超长上下文的强大支撑：256K的上下文窗口，能够满足Agent工作流中对长链条信息处理的严苛需求。
训练效率的飞跃：DSA与MTP技术的融合，使国产算力下的训练效率实现了从20%到90%的惊人提升。
疾速的推理体验：采样解码效率的翻倍提升，大幅缩短了强化学习训练所需的时间。
为Agent而生的优化：深度适配OpenClaw等主流Agent框架，并支持智能体数据自动合成闭环，为Agent开发提供了原生支持。
生态快速落地：已成功接入AstronClaw、Loomy等应用，开发者可快速上手，即插即用。

星火X2-Flash与其他同类模型的纵向比较

对比维度	星火X2-Flash	DeepSeek-V3	Qwen2.5-72B
参数规模	30B（MoE）	671B MoE（激活37B）	72B（Dense）
上下文窗口	256K	128K	128K
模型架构	MoE	MoE	Dense（密集架构）
训练算力	华为昇腾910B（国产）	英伟达H800集群	英伟达/AMD等多类GPU
开源情况	闭源（API服务）	开源（支持本地部署）	开源（支持本地部署）
Agent适配	原生优化，深度兼容OpenClaw、Claude Code	通用能力强，Agent生态依赖社区/第三方	通用能力强，Agent生态依赖社区/第三方
任务效果	接近万亿级参数模型	接近GPT-4o水平，数学/代码突出	综合能力优秀，多语言支持好
Token成本	不到主流大尺寸模型1/3	API定价较低（约GPT-4o的1/10）	API定价较低（约GPT-4o的1/20）
核心定位	Agent时代的性价比引擎	高性能开源基座模型	开源生态旗舰模型

星火X2-Flash的广泛应用前景

复杂Agent工作流的构建：适用于生成深度研究报告、执行多步骤任务、以及进行多轮上下文的读取与修正等复杂场景。
Skill/工具的智能化开发：能够自动化生成和管理如AI视频生成Skill这类复杂工具，并提供详细的结构定义、核心功能实现及使用案例。
代码生成与系统自动化：在需要编写脚本、执行系统命令、进行自动化运维等场景下，提供强大的代码生成能力。
超长文档的深度分析：利用256K的上下文窗口，高效处理超长文档、论文、报告，实现摘要提取、信息问答等功能。
多模态任务的智能编排：作为Agent的“大脑”，能够协调文生视频、图生视频等多种平台工具链（如可灵、Runway、Pika等），实现复杂的多模态任务编排。

阅读原文