华为昇腾疾速适配阿里Qwen3.5新模子,为多模态研讨应用供给手艺支持
2026-02-17 16:44:09
阿里云近日在人工智能领域再推重磅成果,正式上线Qwen3.5系列两款全新大模型——Qwen3.5-Plus与Qwen3.5-397B-A17B。这两款模型不仅支持文本处理,更突破性地实现了多模态任务处理能力,标志着阿里在通用人工智能领域的技术积累迈入新阶段。其中Qwen3.5-Plus作为3.5系列最新力作,Qwen3.5-397B-A17B则以开源旗舰定位,为全球开发者提供更强大的技术底座。
技术突破方面,Qwen3.5系列实现底层架构的全面革新。Qwen3.5-Plus版本总参数达3970亿,但通过动态激活机制仅需170亿参数即可运行,在保持性能超越前代万亿参数模型Qwen3-Max的同时,显存占用降低60%,推理吞吐量最高提升至19倍。该模型在视觉-文本联合训练数据规模上实现指数级增长,特别强化了中英文、多语言及STEM领域的数据质量,采用更严格的数据过滤标准,确保模型在复杂场景下的稳定性。
开源生态建设取得实质性进展。华为计算官方宣布,Qwen3.5模型发布后,昇腾AI团队在0天内完成技术适配,通过MindSpeed MM框架实现基于Atlas 800 A3、Atlas 900 A3SuperPoD等硬件的训练复现。该框架采用FSDP训练后端设计,将模型适配周期缩短80%,支持vLLM-Ascend和SGLang两种推理方案在Atlas 800 A2/A3设备上的高效部署,为产业界提供开箱即用的开发体验。
性能对比数据显示,Qwen3.5-397B-A17B在32k/256k上下文长度下,解码吞吐量分别达到Qwen3-Max的8.6倍和19.0倍,较Qwen3-235B-A22B提升3.5倍至7.2倍。多模态能力方面,该模型通过早期文本-视觉融合训练,在相近参数量级下显著优于Qwen3-VL。语言支持范围从119种扩展至201种语言及方言,词汇表扩容至25万,使多数语言的编码解码效率提升10%-60%。
技术文档显示,Qwen3.5系列采用Qwen3-Next架构,集成更高稀疏度的MoE(专家混合)机制、Gated DeltaNet+Gated Attention混合注意力模块,并通过稳定性优化和多token预测技术提升训练效率。目前,开发者可通过魔乐社区、gitcode社区获取vLLM部署方案,SGLang社区提供专用部署指导,形成完整的技术支持链条。
相关阅读
-
身体这两个部位乱推拿真的会要命,快停止科技前沿 2026-03-09 14:26:16
-
不会写代码也能用,OpenClaw若何帮通俗人脱节反复任务,提拔效率?深度解读 2026-03-09 14:22:05
-
比特币价格预测:2025 年底 15 万美元还是跌至 8.5 万?关键支撑位分析科技前沿 2026-03-09 14:11:28
-
小米2026届春季校园雇用启动:触及芯片、算法等20职类,需多轮测试科技前沿 2026-03-09 14:08:45
-
AI设计新神器来袭:无需专业技能,一句话解锁巨匠级海报创作资讯百科 2026-03-09 14:05:50
-
又一爆款预定,吉祥银河M7将于3月13日表态:1730km超长续航科技前沿 2026-03-09 14:03:26
-
2026百度Apollo Park参访:解锁智能驾驶手艺落地密码,赋能企业转型资讯百科 2026-03-09 14:00:39
-
国内油价本日将迎年内最大涨幅,网友实拍多地加油站排长队科技前沿 2026-03-09 13:57:03
-
智能办公本怎样选?科大讯飞X5等四款抢手产物功能特点大比拼,帮你找到心头好资讯百科 2026-03-09 13:55:27
-
谁动了稳定币的锚?复盘历年重大脱锚事件,一文汇总科技前沿 2026-03-09 13:54:08