SRAM架构助力AI推理提速 英伟达OpenAI结构引行业关注
2026-02-27 16:45:51
广发证券最新发布的行业研究报告指出,在人工智能大模型应用领域,基于SRAM(静态随机存取存储器)的芯片架构正成为技术突破的关键方向。相较于传统依赖外置HBM(高带宽存储器)的方案,SRAM通过缩短数据访问路径,有效降低了权重与激活数据的传输延迟和波动性,显著提升了模型推理的响应速度和稳定性。
作为片上存储的核心组件,SRAM直接集成于CPU或GPU计算单元附近,具备纳秒级访问时延和确定性带宽优势。尽管其容量和成本相对受限,但在AI推理场景中,这种"近计算存储"架构展现出独特价值。报告特别提到,Groq和Cerebras两家创新企业已率先推出基于SRAM的专用AI芯片,并在性能测试中取得突破性成果。
Groq的LPU芯片单芯片集成230MB SRAM,实现80TB/s的片上存储带宽。在Llama3.3 70B模型测试中,该芯片以275-276token/s的稳定推理速度领先行业,较传统平台提升显著。Cerebras的晶圆级引擎WSE-3则更进一步,集成44GB SRAM和21PB/s带宽,在GPT-OSS 120B推理任务中达到每秒超3000token的输出速度,是主流GPU方案的15倍。今年2月,OpenAI推出的GPT-5.3-Codex-Spark预览版便运行于Cerebras加速平台,实现每秒千token级的代码生成响应。
行业动态显示,SRAM架构正获得头部企业重点布局。去年12月,英伟达以200亿美元获取Groq知识产权的非独家授权,涵盖其语言处理单元及配套软件库,并引入核心工程团队。今年2月,Cerebras完成10亿美元F轮融资后估值达230亿美元,同时与OpenAI签署价值百亿美元的芯片部署协议,计划建设750兆瓦规模的定制AI算力中心。
研究报告强调,AI模型参数规模持续扩张背景下,存储架构创新成为突破算力瓶颈的关键。SRAM通过将存储单元与计算核心深度融合,有效解决了数据搬运带来的能耗和延迟问题,这种技术路径正在重塑AI基础设施竞争格局。报告建议关注产业链中掌握核心存储技术的企业,但同时提示需警惕AI产业需求波动、服务器出货量不及预期以及国产技术迭代风险等潜在挑战。
相关阅读
-
不会写代码也能用,OpenClaw若何帮通俗人脱节反复任务,提拔效率?深度解读 2026-03-09 14:22:05
-
比特币价格预测:2025 年底 15 万美元还是跌至 8.5 万?关键支撑位分析科技前沿 2026-03-09 14:11:28
-
小米2026届春季校园雇用启动:触及芯片、算法等20职类,需多轮测试科技前沿 2026-03-09 14:08:45
-
AI设计新神器来袭:无需专业技能,一句话解锁巨匠级海报创作资讯百科 2026-03-09 14:05:50
-
又一爆款预定,吉祥银河M7将于3月13日表态:1730km超长续航科技前沿 2026-03-09 14:03:26
-
2026百度Apollo Park参访:解锁智能驾驶手艺落地密码,赋能企业转型资讯百科 2026-03-09 14:00:39
-
国内油价本日将迎年内最大涨幅,网友实拍多地加油站排长队科技前沿 2026-03-09 13:57:03
-
智能办公本怎样选?科大讯飞X5等四款抢手产物功能特点大比拼,帮你找到心头好资讯百科 2026-03-09 13:55:27
-
谁动了稳定币的锚?复盘历年重大脱锚事件,一文汇总科技前沿 2026-03-09 13:54:08
-
交通运输部:本年启动效劳区机制晋级举动 增添马桶位、完美充电设备科技前沿 2026-03-09 13:51:19