首页 > 深度解读 > 智谱GLM-5“身份”揭晓：复用DeepSeek架构参数翻倍,市值飙升坐实国产AI领跑者

智谱GLM-5“身份”揭晓：复用DeepSeek架构参数翻倍,市值飙升坐实国产AI领跑者

2026-02-11 14:27:33

资本市场近日因国产大模型领域的重大突破掀起波澜。智谱AI推出的新一代模型GLM-5不仅引发行业震动，更推动其股价在短期内暴涨200%，总市值突破1500亿港币，达到IPO时的三倍水平。这一成绩的取得，源于该模型在技术架构与性能上的双重突破。

全球模型服务平台OpenRouter上曾出现一款代号"Pony Alpha"的匿名模型，其代码生成能力一度被认为接近国际顶尖水平。经过技术社区的深入分析，该模型通过系统提示词暴露了GLM家族的身份特征，更有开发者通过验证GLM系列特有的逻辑处理模式——例如输入特定烹饪指令时产生的异常响应——最终确认其真实身份。这一发现过程展现了开源社区在模型识别领域的独特作用。

技术架构层面，GLM-5延续了DeepSeek-V3的稀疏注意力机制（DSA），通过参数规模翻倍实现性能跃升。模型总参数量达7450亿，是前代GLM-4.7的两倍，但通过256个专家模块的动态激活机制，每次推理仅需调用约440亿参数，稀疏度控制在5.9%以内。这种设计既保证了模型容量，又显著提升了计算效率。

在功能扩展方面，新模型支持长达202K token的上下文窗口，较前代提升近4倍。针对多媒体内容处理需求，研发团队强化了视频理解能力，弥补了纯文本架构的局限性。测试数据显示，GLM-5在多模态任务中的表现已达到行业领先水平，特别是在动态场景解析方面展现出独特优势。

企业部署层面，DSA架构的兼容性优势得到充分体现。该模型可无缝接入vLLM、SGLang等主流推理框架的优化方案，使企业用户无需重构技术栈即可完成模型部署。据测算，这种技术路线可使算力成本降低40%以上，显著降低了大模型的应用门槛。业内人士指出，这种工程化能力的突破，标志着国产模型在商业化落地方面已形成完整体系。

随着GLM-5的正式亮相，国产大模型在国际竞争中的地位进一步提升。该模型在保持文本处理优势的同时，通过多模态能力的补强，形成了更完整的技术矩阵。技术社区普遍认为，这种"架构复用+参数扩展"的演进策略，为行业提供了性价比更高的升级路径，或将引发新一轮的技术竞赛。

智谱GLM-5“身份”揭晓