国产AI大模子GLM-5.1登顶开源第一:可独立编程8小时
2026-04-11 11:02:36
4月10日消息,3月底智谱正式推出了GLM-5.1大模型,编程能力评分45.3分,号称比全球最强的Opus 4.6只低了2.6分。
前两天GLM-5.1大模型也正式开源,也深受开发者喜爱,现在最新的排名也来了——全球权威AI评测平台LMArena(百万用户参与盲测)更新Code Arena专项榜单,GLM-5.1登顶全球开源模型第一,位列全球模型第三。
除了榜单表现优秀,根据智谱的说法,GLM-5.1不仅继承了上一代模型的开源SOTA编码能力,还在长程任务(Long-Horizon Task)上取得突破,实现了:
·8小时从零构建Linux桌面
·655次迭代打破向量数据库优化瓶颈
·1000轮工具调用优化真实机器学习模型负载
值得一提的是,在METR榜单的同等评估标准下,GLM-5.1是唯一达到8小时级持续工作的开源模型,也是全球范围内除Claude Opus 4.6外少数具备这一能力的模型。
此前智谱提到,GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。
在最接近真实软件开发的SWE-bench Pro基准测试中,GLM-5.1刷新全球最佳成绩,超过GPT-5.4、Claude Opus 4.6。SWE-Bench Pro要求模型在真实GitHub仓库中定位并修复高难度工程Bug,是衡量模型能否胜任专业软件开发的最硬指标。
声明:文章不代表轻松科技观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!
相关阅读
-
OPPOFindX8s:2785元享旗舰配置,小屏性价比之选实至名归深度解读 2026-04-11 11:00:55
-
让咱们祝贺那些洗袜子不翻面的人科技前沿 2026-04-11 10:59:14
-
曝三星多款Galaxy手机在印度涨价,首要触及A、F系列资讯百科 2026-04-11 10:56:16
-
洛阳绽放AI新篇:第二届“牡丹花都”大赛邀您共绘智能创意画卷深度解读 2026-04-11 10:55:09
-
华为Pura90系列官宣定档,怪异设计配色退场,机能爆料引等待资讯百科 2026-04-11 10:50:25
-
又一家IC独角兽冲刺IPO,国产制造类EDA龙头全芯智造指点验收过关科技前沿 2026-04-11 10:47:00
-
张雪冠军复刻赛车拍卖44秒触顶500万,李亚鹏连麦感慨:竞拍速度远超预期资讯百科 2026-04-11 10:44:21
-
别克至境E7配置揭晓:16万起售 235km纯电续航 打造家庭出行新抉择深度解读 2026-04-11 10:41:56
-
特斯拉推出2026款改款Model Y 新增风暴轮毂和浅灰色初级内饰选装科技前沿 2026-04-11 10:41:14
-
Omdia陈述:2026年Q1全球手机市场三星领跑,本钱压力或致需要下行资讯百科 2026-04-11 10:38:34