Qwen3.5

AI工具20分钟前更新 AI工具集
0 0 0

Qwen3.5 – 阿里通义千问开源的新一代原生多模态大模型

阿里巴巴通义千问团队重磅推出其最新一代的杰出之作——Qwen3.5,一款原生多模态大模型,现已正式开源。其首个开源版本Qwen3.5-397B-A17B,凭借其独树一帜的混合架构,巧妙融合了线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)技术。该模型拥有惊人的3970亿参数总量,然而在每次推理过程中,却仅需激活其中的170亿参数,真正实现了“以小博大”的战略优势。其性能表现已超越了拥有万亿参数的Qwen3-Max,同时,部署所需的显存大幅削减了60%,推理吞吐量更是实现了高达19倍的飞跃。

Qwen3.5的独到之处

Qwen3.5,作为一款原生视觉-语言模型,通过早期文本与视觉信息的深度融合,并辅以M-RoPE和3D位置编码等尖端技术,能够无缝处理文本、图像乃至视频等多种模态的任务。其语言支持能力也得到了显著扩展,从原有的119种扩展至201种。在多项备受瞩目的权威评测中,Qwen3.5的表现尤为抢眼:MMLU-Pro得分高达87.8,超越了GPT-5.2;GPQA得分88.4,领先于Claude 4.5;IFBench指令遵循评分更是达到了76.5,刷新了历史最高纪录。在定价方面,Qwen3.5极具竞争力,每百万Token仅需0.8元,相较于Gemini 3 Pro,价格优势高达18倍。开发者可以通过魔搭社区、HuggingFace平台或阿里云百炼轻松获取模型权重和调用接口。

Qwen3.5的核心功能概览

  • 原生多模态洞察力:能够一体化地理解和处理文本、图像和视频内容,通过早期视觉-语言的融合,实现跨模态的深度推理。
  • 强大的智能体实力:支持工具的调用、任务的规划与执行,在BFCL-V4等智能体评测中展现出卓越的性能。
  • 高效的推理引擎:采用了Gated DeltaNet与MoE相结合的混合设计,尽管拥有397B参数,但仅激活17B即可达到业界顶尖的性能水平。
  • 超长上下文处理能力:支持高达1M的上下文长度,在256K场景下,解码吞吐量相比前代产品提升了19倍。
  • 广泛的多语言支持:能够覆盖201种语言及方言,词表规模扩展至25万,编码效率提升了10%至60%。
  • 卓越的代码生成能力:在编程方面表现出色,支持多语言的代码编写、调试以及复杂项目的开发。
  • 精细的视觉识别能力:实现对图像的细粒度理解、目标检测、OCR文档解析以及空间关系的推理。
  • 增强的搜索集成:集成了BrowseComp等搜索智能体能力,能够实现联网信息检索与内容的整合。

Qwen3.5的技术基石

  • 混合注意力架构的革新:结合了Gated DeltaNet的线性注意力和Gated Attention的稀疏注意力,实现了计算资源的自适应分配。
  • MoE稀疏激活机制:总参数量为397B,但每次推理仅激活17B(约占4.3%),通过一个共享专家与512个路由专家(每次激活10个)的组合,显著降低了推理成本。
  • 门控机制的精妙优化:采用了head-specific sigmoid门控,取代了传统的softmax注意力机制,该项创新成果荣获了2025年NeurIPS最佳论文奖。
  • 原生多模态融合的实现:利用M-RoPE和3D位置编码,将时空信息原生嵌入到大语言模型中,从而实现了视觉与语言的早期融合。
  • 异构训练框架的优势:视觉与语言组件采用解耦的并行策略,通过稀疏激活技术实现跨模块计算的重叠,使得训练吞吐量接近纯文本基线。
  • FP8混合精度的应用:原生FP8流水线对激活、MoE路由和GEMM操作采用低精度计算,而对敏感层则保持BF16精度,显存占用降低超过50%。
  • 异步强化学习的引入:构建了一个可扩展的异步强化学习框架,能够支持全尺寸模型,实现训练与推理的分离以及动态负载均衡,端到端加速可达3-5倍。

Qwen3.5的项目访问入口

  • Hugging Face模型库:https://huggingface.co/collections/Qwen/qwen35
  • GitHub仓库:https://github.com/QwenLM/Qwen3.5

如何便捷地使用Qwen3.5

  • 网页端即时体验:访问Qwen Chat,或下载千问APP/PC客户端,即可直接通过文本输入或上传图片/视频进行多模态的互动交流。
  • API的灵活调用:通过阿里云百炼平台获取API密钥,以每百万Token仅0.8元的超低价格接入模型服务。
  • 本地部署的选择:您可以从HuggingFace或魔搭社区下载开源权重Qwen3.5-397B-A17B,然后在本地环境或私有云进行部署和运行。
  • 智能体应用的开发:充分利用模型原生的智能体能力,结合工具调用接口,开发自动化任务执行、数据分析等各类创新应用。
  • 多语言应用的无缝集成:直接使用201种支持语言中的任何一种进行对话,无需额外的翻译模块配置。
  • 长文档处理的强大支持:上传超长文本、PDF文件或视频,模型将自动处理高达1M上下文的复杂推理任务。

Qwen3.5的模型定价策略

  • 极具吸引力的输入价格:每百万Token仅需0.8元,位列全球顶级模型中的最低价格区间。
  • 显著的价格优势:相比Gemini 3 Pro,价格低至1/18;对比GPT-5.2,价格低至1/15,性价比优势不言而喻。
  • 完全免费的开源选项:Qwen3.5-397B-A17B的模型权重完全开源,开发者可以免费下载并在本地部署使用。

Qwen3.5的广泛应用场景

  • 智能客服的全球化升级:支持201种语言的多轮对话和复杂问题解答,完美契合全球化企业客服系统的需求。
  • 内容创作的强大助手:辅助文案撰写、视频脚本生成、多语言翻译以及本地化内容的适配。
  • 代码开发的效率提升:提供代码生成、调试、重构等服务,支持复杂软件项目的开发与维护。
  • 视觉分析的深度洞察:实现图像识别、文档OCR、视频内容理解以及细粒度的视觉问答。
  • 智能体自动化流程的构建:创建自动化工作流,执行数据分析、信息检索、任务调度等各类智能体任务。
  • 教育辅助的个性化创新:支持多语言教学、作业批改、个性化学习路径规划以及知识问答。
阅读原文
© 版权声明
蝉镜AI数字人

相关文章

蝉镜AI数字人

暂无评论

暂无评论...