上海万卡GPU集群:以高效算力与手艺创新赋能AI大模子开展
2026-04-06 15:31:10
在上海松江的仪电智算中心内,一个由上万张GPU设备组成的庞大算力网络正在高效运转。每张芯片每秒可完成数十万亿次运算,其两天内的总算力输出,足以媲美三峡水电站单机组一小时的发电量。这一惊人的算力规模,为人工智能模型的训练提供了强大的底层支撑。
为确保这一万卡集群的稳定运行,上海仪电智算科技团队攻克了高故障率芯片协同的技术难题。通过算法优化与并行调度策略,团队将系统可用性提升至99.99%,全年故障时间被严格控制在1小时以内。这一突破不仅保障了多模态大模型在全球范围内的领先训练进度,更避免了因算力中断可能导致的重大损失。
该集群在国产化适配方面同样取得显著进展。团队成功将多种国产算力卡融入系统,实现了异构算力的深度融合与优化调度,设备使用率接近100%。更值得关注的是,团队首创的“动态感知调度方案”使训练效率大幅提升91%,年节省的算力成本相当于新建3个数据中心。目前,该集群已具备快速部署万卡规模的能力,为大规模AI应用落地奠定了基础。
据智算科技董事长孙跃介绍,公司正在推进“算电协同”战略,通过扩大绿色电力应用、采用液冷技术降低能耗(PUE值),并探索利用海上风电为数据中心供电。同时,公司打造的YI CLOUD平台正与产业生态深度协同,推动国产算力在“AI+”场景中的全面赋能,助力各行业智能化转型。
声明:文章不代表轻松科技观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!
相关阅读
-
自立研制,我国兆瓦级氢燃料航空涡桨发起机首飞成功科技前沿 2026-04-06 15:30:06
-
Intel倏忽发布游戏本新U:第一次18个中心科技前沿 2026-04-06 15:24:36
-
AI正在反向教人类说话,最新研讨:人类说话越来越平淡化科技前沿 2026-04-06 15:18:53
-
创建16周年,小米发布值得被记住的16件事科技前沿 2026-04-06 15:12:08
-
电力根底设备卡脖子:美国折半数据中间建立项目被迫延期科技前沿 2026-04-06 15:00:22
-
AI浪潮下版权之困:从《桃花簪》到易烊千玺,短剧行业面临新应战资讯百科 2026-04-06 14:56:07
-
AI致使赋闲是假的 大佬拿出证据:软件工程岗位三年来新高科技前沿 2026-04-06 14:55:10
-
雷军庆小米十六周年:工程师慨叹过程,深信美好将来行将发作资讯百科 2026-04-06 14:50:05
-
不能上牌也疯抢,布加迪威航跑车拍出1305万 机构:只能保藏展现科技前沿 2026-04-06 14:49:06
-
明天是小米16周岁生日,雷军等人一锅小米粥开启创业路科技前沿 2026-04-06 14:32:46