Claude Mythos破绽神话幻灭?华尔街惊愕背地是AI“泡沫”争议
2026-04-12 23:59:09
华尔街的会议室里气氛凝重,金融监管机构连夜召集各大银行高层。这场紧急会议的焦点,是尚未正式亮相的AI模型Claude Mythos——据称其具备自主挖掘海量0day漏洞的能力,足以引发系统性网络攻击风暴。然而随着更多细节浮出水面,这场被渲染成"AI奥本海默时刻"的危机,正逐渐显露出人为夸大的痕迹。
技术团队对Mythos宣称的"重大突破"进行复核时发现,其报告的数千个漏洞中,超过七成存在于早已停止维护的旧版软件。更令人质疑的是,所谓"高危0day漏洞"的判定依据,仅来自198次人工复核样本。安全研究员指出,这种基于极小样本的数据外推法,在学术界和安全领域都缺乏可信度。
开源社区的测试结果进一步动摇了Mythos的神话。AISLE实验室使用参数仅36亿的GPT-OSS-20b模型,成功识别出FreeBSD系统中的旗舰级漏洞。而具备51亿参数的模型,则复现了潜伏27年的OpenBSD漏洞分析逻辑。这些开源模型的调用成本低至每百万Token 0.11美元,与闭源大模型形成鲜明对比。
在虚假漏洞识别测试中,小模型展现出惊人优势。面对伪装成SQL注入的Java代码,DeepSeek R1等开源模型精准追踪数据流并识破伪装,而GPT-5.4和Claude Sonnet 4.5等顶尖闭源模型却集体误判。这种反转现象印证了网络安全领域的核心结论:不存在永远领先的单体模型,能力分布呈现明显的锯齿状特征。
传奇黑客George Hotz公开质疑这场安全恐慌的合理性。这位破解过iPhone和PlayStation 3的安全专家指出,当前零日漏洞稀缺的根本原因是法律限制,而非技术难度。"如果每天发布一个漏洞直到新模型问世,就能让这些公司停止渲染末日论调。"他在社交媒体上的尖锐批评引发广泛共鸣。
性能评估数据同样充满争议。虽然Claude Mythos在Epoch能力指数上超越前代Opus 4.6,但与GPT-5.4的差距不足5%。气候投资人Ramez Naam分析指出,Mythos的进步属于线性迭代范畴,并未出现预期中的能力跃迁。更蹊跷的是,Anthropic内部报告与公开ECI数据存在显著差异,暗示其评分体系存在不确定性。
用户端的反馈则暴露出另一个维度的问题。大量使用者抱怨最新版Opus 4.6出现"降智"现象,在洗车方案等基础任务中表现不如前代。AMD主管的日志分析显示,Claude的中位思考长度从2200字符骤降至600字符,深度推理能力被明显压缩。为应对80倍增长的API请求,用户不得不重复调用,导致使用成本飙升。
资深订阅用户的长文控诉揭开了更多内幕。Anthropic被指在核心模型尚未稳定时,将算力资源倾斜至开发"/buddy"等娱乐功能。收紧的Token使用限制与强制降级策略,暴露出其深陷算力困局的现实。这种"舍本逐末"的产品路线,与渲染超级AI威胁的营销策略形成荒诞对照。
当实验室里的末日预言遭遇开源社区的实证检验,当用户抱怨模型变笨与渲染的超级智能形成反差,这场由AI公司主导的安全恐慌正演变为行业信任危机。技术真相与营销话术的激烈碰撞,折射出人工智能领域亟待规范的竞争乱象。
相关阅读
-
宇树科技人形机械人H1奔驰速度达10米每秒,科创板IPO拟融资42.02亿深度解读 2026-04-12 23:53:40
-
长盈细密:以“快”与“精”包围人形机械人赛道 驶向将来增进新蓝海深度解读 2026-04-12 23:46:52
-
元戎启行迎新气力:前DeepSeek多模态中心阮翀加盟,助力基座模子新打破深度解读 2026-04-12 23:40:46
-
MiniMax开源M2.7模子:AI完成自我进化,复杂使命处置与交互体验双晋级深度解读 2026-04-12 23:34:19
-
元戎启行以基座模子赋能智驾,北京车展将展手艺新效果与人材新气力深度解读 2026-04-12 22:50:25
-
智能电动汽车论坛启幕:天马“天轩”携“五星好屏”重塑车载显示新规范深度解读 2026-04-12 22:45:11
-
2026世界互联网大会亚太峰会4月启幕 聚焦数智创新共绘数字将来新图景深度解读 2026-04-12 22:38:41
-
麦肯锡调研:九成企业开启AI转型之路 仅一成完成范围化落地应用深度解读 2026-04-12 22:32:15
-
光谷智能传感手艺创新研讨院揭牌 政校企联袂共绘传感器工业新蓝图深度解读 2026-04-12 22:26:30
-
宇树科技H1表态机械人马拉松测试赛 续航脚掌晋级应战长跑新打破深度解读 2026-04-12 22:19:53