智谱GLM-5.1发布:国产开源模子新打破,8小时延续任务才能领跑全球
2026-04-08 20:53:06
智谱今日宣布推出新一代开源模型 GLM-5.1,官方宣称该模型在多项关键指标上达到全球领先水平,成为目前开源领域性能最强的智能体。据技术团队介绍,GLM-5.1 突破了传统模型的时间限制,首次实现单次任务持续运行超8小时,期间可自主完成规划、执行与优化,最终交付符合工程标准的完整成果。

在专业软件开发能力验证方面,GLM-5.1 在 SWE-bench Pro 基准测试中刷新全球纪录,超越 GPT-5.4 和 Claude Opus 4.6 等闭源模型。该测试要求模型在真实 GitHub 仓库中定位并修复高难度工程级 Bug,被业界视为衡量模型实用性的核心标准。技术文档显示,GLM-5.1 在处理复杂代码库时的准确率较前代提升37%,尤其在需要跨文件协作的场景中表现突出。
代码生成能力是此次升级的重点方向。根据 Terminal-Bench 2.0 和 NL2Repo 等权威评测数据,GLM-5.1 在命令行操作和完整代码仓库构建任务中取得全球第三、国产模型第一的成绩。技术团队透露,通过引入动态注意力机制和长程记忆模块,模型在处理超长上下文时的信息保留率提升至92%,较分钟级交互模型有质的飞跃。

伴随模型发布,智谱同步调整了商业服务价格体系。OpenRouter 平台数据显示,GLM-5.1 在 Coding 场景的缓存命中 Token 价格上调10%,调价后与 Anthropic 旗下 Claude Sonnet4.6 的定价持平。这是国产大模型首次在核心应用场景实现与海外头部产品的价格对齐,标志着中国AI技术在商业化层面取得重要突破。
技术白皮书指出,GLM-5.1 的突破性进展源于三大创新:一是引入自适应任务分割算法,使模型能动态调整工作节奏;二是构建多层级验证系统,确保长时间运行中的结果可靠性;三是开发专用代码优化器,可自动重构低效代码片段。这些特性使其在智能体工程、自动化运维等长周期任务中展现出独特优势。
相关阅读
-
深开鸿成果斐然:代码奉献超800万行,还启动M-Robots开源项目深度解读 2026-04-08 19:49:33
-
瑞士荷兰结合研发火星行走机械人,半自立勘测或开启生命索求新篇深度解读 2026-04-08 19:44:06
-
光伏电站无人值守系统:以智能手艺驱动降本增效与保险运维晋级深度解读 2026-04-08 18:35:04
-
六年质量据守,光荣条记本X14 Plus与X16 Plus 4月23日携多款新品退场资讯百科 2026-04-08 18:27:02
-
360“虾书”APP来袭:小龙虾AI自立社交,开启AI社区新玩法资讯百科 2026-04-08 18:21:22
-
小米可否跑赢特斯拉?关头看产能与品牌沉淀的两重考验资讯百科 2026-04-08 18:15:55
-
特斯拉FSD v14.3更新:MLIR框架加持,反映速度提拔停车应急更智能资讯百科 2026-04-08 18:09:16
-
2025年快递效劳提速:全程均匀时限缩短至51.22小时,72小时妥投率提拔资讯百科 2026-04-08 18:02:52
-
小米科技请求注册“XIAOMI YU7 GT”商标,高机能纯电SUV引等待资讯百科 2026-04-08 17:56:59
-
广电总局重拳整治「AI魔改」乱象 累计清算违规视频超5万条账号百余个深度解读 2026-04-08 17:53:18