Qwen3.5 – 阿里通义千问开源的新一代原生多模态大模型
阿里巴巴通义千问团队重磅推出其最新一代的杰出之作——Qwen3.5,一款原生多模态大模型,现已正式开源。其首个开源版本Qwen3.5-397B-A17B,凭借其独树一帜的混合架构,巧妙融合了线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)技术。该模型拥有惊人的3970亿参数总量,然而在每次推理过程中,却仅需激活其中的170亿参数,真正实现了“以小博大”的战略优势。其性能表现已超越了拥有万亿参数的Qwen3-Max,同时,部署所需的显存大幅削减了60%,推理吞吐量更是实现了高达19倍的飞跃。
Qwen3.5的独到之处
Qwen3.5,作为一款原生视觉-语言模型,通过早期文本与视觉信息的深度融合,并辅以M-RoPE和3D位置编码等尖端技术,能够无缝处理文本、图像乃至视频等多种模态的任务。其语言支持能力也得到了显著扩展,从原有的119种扩展至201种。在多项备受瞩目的权威评测中,Qwen3.5的表现尤为抢眼:MMLU-Pro得分高达87.8,超越了GPT-5.2;GPQA得分88.4,领先于Claude 4.5;IFBench指令遵循评分更是达到了76.5,刷新了历史最高纪录。在定价方面,Qwen3.5极具竞争力,每百万Token仅需0.8元,相较于Gemini 3 Pro,价格优势高达18倍。开发者可以通过魔搭社区、HuggingFace平台或阿里云百炼轻松获取模型权重和调用接口。
Qwen3.5的核心功能概览
- 原生多模态洞察力:能够一体化地理解和处理文本、图像和视频内容,通过早期视觉-语言的融合,实现跨模态的深度推理。
- 强大的智能体实力:支持工具的调用、任务的规划与执行,在BFCL-V4等智能体评测中展现出卓越的性能。
- 高效的推理引擎:采用了Gated DeltaNet与MoE相结合的混合设计,尽管拥有397B参数,但仅激活17B即可达到业界顶尖的性能水平。
- 超长上下文处理能力:支持高达1M的上下文长度,在256K场景下,解码吞吐量相比前代产品提升了19倍。
- 广泛的多语言支持:能够覆盖201种语言及方言,词表规模扩展至25万,编码效率提升了10%至60%。
- 卓越的代码生成能力:在编程方面表现出色,支持多语言的代码编写、调试以及复杂项目的开发。
- 精细的视觉识别能力:实现对图像的细粒度理解、目标检测、OCR文档解析以及空间关系的推理。
- 增强的搜索集成:集成了BrowseComp等搜索智能体能力,能够实现联网信息检索与内容的整合。
Qwen3.5的技术基石
- 混合注意力架构的革新:结合了Gated DeltaNet的线性注意力和Gated Attention的稀疏注意力,实现了计算资源的自适应分配。
- MoE稀疏激活机制:总参数量为397B,但每次推理仅激活17B(约占4.3%),通过一个共享专家与512个路由专家(每次激活10个)的组合,显著降低了推理成本。
- 门控机制的精妙优化:采用了head-specific sigmoid门控,取代了传统的softmax注意力机制,该项创新成果荣获了2025年NeurIPS最佳论文奖。
- 原生多模态融合的实现:利用M-RoPE和3D位置编码,将时空信息原生嵌入到大语言模型中,从而实现了视觉与语言的早期融合。
- 异构训练框架的优势:视觉与语言组件采用解耦的并行策略,通过稀疏激活技术实现跨模块计算的重叠,使得训练吞吐量接近纯文本基线。
- FP8混合精度的应用:原生FP8流水线对激活、MoE路由和GEMM操作采用低精度计算,而对敏感层则保持BF16精度,显存占用降低超过50%。
- 异步强化学习的引入:构建了一个可扩展的异步强化学习框架,能够支持全尺寸模型,实现训练与推理的分离以及动态负载均衡,端到端加速可达3-5倍。
Qwen3.5的项目访问入口
- Hugging Face模型库:https://huggingface.co/collections/Qwen/qwen35
- GitHub仓库:https://github.com/QwenLM/Qwen3.5
如何便捷地使用Qwen3.5
- 网页端即时体验:访问Qwen Chat,或下载千问APP/PC客户端,即可直接通过文本输入或上传图片/视频进行多模态的互动交流。
- API的灵活调用:通过阿里云百炼平台获取API密钥,以每百万Token仅0.8元的超低价格接入模型服务。
- 本地部署的选择:您可以从HuggingFace或魔搭社区下载开源权重Qwen3.5-397B-A17B,然后在本地环境或私有云进行部署和运行。
- 智能体应用的开发:充分利用模型原生的智能体能力,结合工具调用接口,开发自动化任务执行、数据分析等各类创新应用。
- 多语言应用的无缝集成:直接使用201种支持语言中的任何一种进行对话,无需额外的翻译模块配置。
- 长文档处理的强大支持:上传超长文本、PDF文件或视频,模型将自动处理高达1M上下文的复杂推理任务。
Qwen3.5的模型定价策略
- 极具吸引力的输入价格:每百万Token仅需0.8元,位列全球顶级模型中的最低价格区间。
- 显著的价格优势:相比Gemini 3 Pro,价格低至1/18;对比GPT-5.2,价格低至1/15,性价比优势不言而喻。
- 完全免费的开源选项:Qwen3.5-397B-A17B的模型权重完全开源,开发者可以免费下载并在本地部署使用。
Qwen3.5的广泛应用场景
- 智能客服的全球化升级:支持201种语言的多轮对话和复杂问题解答,完美契合全球化企业客服系统的需求。
- 内容创作的强大助手:辅助文案撰写、视频脚本生成、多语言翻译以及本地化内容的适配。
- 代码开发的效率提升:提供代码生成、调试、重构等服务,支持复杂软件项目的开发与维护。
- 视觉分析的深度洞察:实现图像识别、文档OCR、视频内容理解以及细粒度的视觉问答。
- 智能体自动化流程的构建:创建自动化工作流,执行数据分析、信息检索、任务调度等各类智能体任务。
- 教育辅助的个性化创新:支持多语言教学、作业批改、个性化学习路径规划以及知识问答。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...


粤公网安备 44011502001135号