蚂蚁团体发布开源万亿参数模子Ring-2.5-1T 生成效率与思虑深度双提拔
2026-02-13 18:18:16
蚂蚁集团近日宣布,正式推出并开源其首个采用混合线性架构的万亿参数思考模型——Ring-2.5-1T。该模型的权重文件与推理代码已同步上线至Hugging Face、ModelScope等国际主流开源平台,官方交互体验页面及API服务接口预计于近期开放。
研发团队通过创新架构设计,在预训练与强化学习阶段实现双重突破。核心突破在于构建了1:7比例的MLA(混合线性注意力)与Lightning Linear Attention协同机制,既保持了传统注意力机制对复杂关系的捕捉能力,又通过线性化改造将显存占用降低一个数量级。配合异步强化学习框架的规模化部署,模型在复杂任务的长程推理能力上取得显著进展。
性能测试数据显示,在超过32K tokens的生成任务中,新模型展现出三倍以上的吞吐量提升,同时将内存访问规模压缩至原有水平的十分之一。这种特性使其在需要深度推理的场景中表现尤为突出,例如在数学竞赛基准测试中,模型通过引入密集奖励机制(dense reward),在自测环节同时达到国际数学奥林匹克(IMO)2025与国际数学奥林匹克中国国家队选拔赛(CMO)2025的金牌标准。
针对实际应用场景,研发团队重点优化了模型的自主执行能力。通过大规模异步智能体强化学习训练,Ring-2.5-1T可无缝对接Claude Code等智能编程框架,并能高效驱动OpenClaw等个人AI助理完成复杂任务流程。在代码生成、逻辑推理等长程任务中,模型展现出超越前代版本(Ring-1T)的持续执行稳定性。
此次开源包含完整的模型权重与推理代码,开发者可基于现有框架进行二次开发。蚂蚁集团表示,此举旨在推动大模型技术向通用智能体方向演进,通过开放核心架构促进产业生态共建。行业分析认为,该模型在长文本处理与复杂推理领域的突破,或将重新定义AI在专业领域的应用边界。
相关阅读
-
不会写代码也能用,OpenClaw若何帮通俗人脱节反复任务,提拔效率?深度解读 2026-03-09 14:22:05
-
比特币价格预测:2025 年底 15 万美元还是跌至 8.5 万?关键支撑位分析科技前沿 2026-03-09 14:11:28
-
小米2026届春季校园雇用启动:触及芯片、算法等20职类,需多轮测试科技前沿 2026-03-09 14:08:45
-
AI设计新神器来袭:无需专业技能,一句话解锁巨匠级海报创作资讯百科 2026-03-09 14:05:50
-
又一爆款预定,吉祥银河M7将于3月13日表态:1730km超长续航科技前沿 2026-03-09 14:03:26
-
2026百度Apollo Park参访:解锁智能驾驶手艺落地密码,赋能企业转型资讯百科 2026-03-09 14:00:39
-
国内油价本日将迎年内最大涨幅,网友实拍多地加油站排长队科技前沿 2026-03-09 13:57:03
-
智能办公本怎样选?科大讯飞X5等四款抢手产物功能特点大比拼,帮你找到心头好资讯百科 2026-03-09 13:55:27
-
谁动了稳定币的锚?复盘历年重大脱锚事件,一文汇总科技前沿 2026-03-09 13:54:08
-
交通运输部:本年启动效劳区机制晋级举动 增添马桶位、完美充电设备科技前沿 2026-03-09 13:51:19