DeepSeek或春节发布新模子?新论文直指大模子短板,V3.2显露亮眼
2026-02-14 21:19:33
近日,科技领域传来新动态,DeepSeek正对其网页端和APP进行新功能测试,此次测试聚焦于全新的长文本模型结构,该结构可支持高达1M的上下文。不过,其API服务目前依旧保持为V3.2版本,仅支持128K上下文。
这一动作引发外界诸多猜测,不少人认为DeepSeek或许会在今年春节期间再次带来惊喜,发布新模型,有望重现去年春节时引发行业轰动的盛况。此前,DeepSeek在模型研发方面就动作不断,展现出强大的技术实力与创新能力。
今年1月12日,DeepSeek联合北京大学共同完成了一篇颇具影响力的论文《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》(基于可扩展查找的条件记忆:大语言模型稀疏性的新维度),梁文锋位列作者名单。论文聚焦于当前大语言模型存在的记忆力不足问题,创新性地提出了“条件记忆”这一概念,为解决该问题提供了新的思路与方向。基于此,行业普遍推测DeepSeek的下一代模型V4极有可能在今年春节前后正式亮相。
回顾去年12月1日,DeepSeek曾一次性发布两个正式版模型,分别是DeepSeek-V3.2和DeepSeek-V3.2-Speciale。目前,官方网页端、App以及API均已更新为正式版DeepSeek-V3.2,而Speciale版本则以临时API服务的形式开放,主要用于社区评测与研究工作。
据了解,DeepSeek-V3.2在研发过程中有着明确的目标,即平衡推理能力与输出长度,使其更贴合日常使用场景,例如问答场景以及通用Agent(智能体)任务场景。在公开的推理类Benchmark测试中,DeepSeek-V3.2展现出不俗的实力,达到了GPT-5的水平,仅稍逊于Gemini-3.0-Pro。与Kimi-K2-Thinking相比,V3.2的输出长度大幅降低,有效减少了计算开销,同时也显著缩短了用户的等待时间。
相关阅读
-
不会写代码也能用,OpenClaw若何帮通俗人脱节反复任务,提拔效率?深度解读 2026-03-09 14:22:05
-
比特币价格预测:2025 年底 15 万美元还是跌至 8.5 万?关键支撑位分析科技前沿 2026-03-09 14:11:28
-
小米2026届春季校园雇用启动:触及芯片、算法等20职类,需多轮测试科技前沿 2026-03-09 14:08:45
-
AI设计新神器来袭:无需专业技能,一句话解锁巨匠级海报创作资讯百科 2026-03-09 14:05:50
-
又一爆款预定,吉祥银河M7将于3月13日表态:1730km超长续航科技前沿 2026-03-09 14:03:26
-
2026百度Apollo Park参访:解锁智能驾驶手艺落地密码,赋能企业转型资讯百科 2026-03-09 14:00:39
-
国内油价本日将迎年内最大涨幅,网友实拍多地加油站排长队科技前沿 2026-03-09 13:57:03
-
智能办公本怎样选?科大讯飞X5等四款抢手产物功能特点大比拼,帮你找到心头好资讯百科 2026-03-09 13:55:27
-
谁动了稳定币的锚?复盘历年重大脱锚事件,一文汇总科技前沿 2026-03-09 13:54:08
-
交通运输部:本年启动效劳区机制晋级举动 增添马桶位、完美充电设备科技前沿 2026-03-09 13:51:19