阿里千问Qwen3-Coder-Next发布:以低推理本钱解锁高效编程智能体新能够
2026-02-04 21:26:36
阿里巴巴旗下千问团队近日正式发布全新语言模型Qwen3-Coder-Next,这款专为编码代理和本地开发场景设计的开放权重模型,通过创新架构与训练方法在编程智能体领域展现出显著优势。该模型基于Qwen3-Next-80B-A3B-Base构建,采用混合注意力机制与专家混合(MoE)架构,在保持低推理成本的同时实现了强大的编程能力。
在训练方法上,研究团队突破传统参数扩展模式,重点强化智能体训练信号的扩展性。通过构建包含大规模可验证编程任务和可执行环境的训练体系,模型能够直接从环境反馈中学习优化。具体训练流程涵盖四个阶段:首先在代码与智能体相关数据上进行持续预训练,随后利用高质量智能体轨迹数据进行监督微调,接着针对软件工程、QA测试、Web/UX设计等领域开展专家训练,最终将多领域专家能力蒸馏整合到单一可部署模型中。这种训练范式特别强化了长程推理、工具调用和错误恢复能力,这些特性对现实编程场景至关重要。
性能评估显示,该模型在多个权威编程智能体基准测试中表现突出。在SWE-Bench系列测试中,使用SWE-Agent框架时模型在Verified版本上取得超过70%的准确率,在多语言版本和更具挑战性的Pro版本中仍保持竞争力。特别值得注意的是,尽管激活参数规模仅30亿,其性能已可媲美激活参数多10-20倍的开源模型。在TerminalBench 2.0和Aider等基准测试中,模型同样展现出优异表现。
效率分析图表揭示,Qwen3-Coder-Next在性能与资源消耗间实现了更优平衡。在SWE-Bench-Pro测试中,30亿激活参数版本的性能与参数量大数十倍的模型相当,展现出显著的成本优势。虽然全注意力架构的专有模型在绝对性能上仍占优势,但该模型在低成本智能体部署场景中已处于领先位置,特别适合资源受限环境下的编程任务处理。
技术文档显示,模型开发团队将持续优化推理决策能力,计划扩展对更多编程任务类型的支持,并建立快速迭代机制根据用户反馈持续改进。目前该模型已通过ModelScope和Hugging Face平台开源,开发者可自由获取模型权重及训练代码进行二次开发。
相关阅读
-
身体这两个部位乱推拿真的会要命,快停止科技前沿 2026-03-09 14:26:16
-
不会写代码也能用,OpenClaw若何帮通俗人脱节反复任务,提拔效率?深度解读 2026-03-09 14:22:05
-
比特币价格预测:2025 年底 15 万美元还是跌至 8.5 万?关键支撑位分析科技前沿 2026-03-09 14:11:28
-
小米2026届春季校园雇用启动:触及芯片、算法等20职类,需多轮测试科技前沿 2026-03-09 14:08:45
-
AI设计新神器来袭:无需专业技能,一句话解锁巨匠级海报创作资讯百科 2026-03-09 14:05:50
-
又一爆款预定,吉祥银河M7将于3月13日表态:1730km超长续航科技前沿 2026-03-09 14:03:26
-
2026百度Apollo Park参访:解锁智能驾驶手艺落地密码,赋能企业转型资讯百科 2026-03-09 14:00:39
-
国内油价本日将迎年内最大涨幅,网友实拍多地加油站排长队科技前沿 2026-03-09 13:57:03
-
智能办公本怎样选?科大讯飞X5等四款抢手产物功能特点大比拼,帮你找到心头好资讯百科 2026-03-09 13:55:27
-
谁动了稳定币的锚?复盘历年重大脱锚事件,一文汇总科技前沿 2026-03-09 13:54:08