首页 > 深度解读 > Claude Mythos破绽神话幻灭？华尔街惊愕背地是AI“泡沫”争议

Claude Mythos破绽神话幻灭？华尔街惊愕背地是AI“泡沫”争议

2026-04-12 23:59:09

华尔街的会议室里气氛凝重，金融监管机构连夜召集各大银行高层。这场紧急会议的焦点，是尚未正式亮相的AI模型Claude Mythos——据称其具备自主挖掘海量0day漏洞的能力，足以引发系统性网络攻击风暴。然而随着更多细节浮出水面，这场被渲染成"AI奥本海默时刻"的危机，正逐渐显露出人为夸大的痕迹。

技术团队对Mythos宣称的"重大突破"进行复核时发现，其报告的数千个漏洞中，超过七成存在于早已停止维护的旧版软件。更令人质疑的是，所谓"高危0day漏洞"的判定依据，仅来自198次人工复核样本。安全研究员指出，这种基于极小样本的数据外推法，在学术界和安全领域都缺乏可信度。

开源社区的测试结果进一步动摇了Mythos的神话。AISLE实验室使用参数仅36亿的GPT-OSS-20b模型，成功识别出FreeBSD系统中的旗舰级漏洞。而具备51亿参数的模型，则复现了潜伏27年的OpenBSD漏洞分析逻辑。这些开源模型的调用成本低至每百万Token 0.11美元，与闭源大模型形成鲜明对比。

在虚假漏洞识别测试中，小模型展现出惊人优势。面对伪装成SQL注入的Java代码，DeepSeek R1等开源模型精准追踪数据流并识破伪装，而GPT-5.4和Claude Sonnet 4.5等顶尖闭源模型却集体误判。这种反转现象印证了网络安全领域的核心结论：不存在永远领先的单体模型，能力分布呈现明显的锯齿状特征。

传奇黑客George Hotz公开质疑这场安全恐慌的合理性。这位破解过iPhone和PlayStation 3的安全专家指出，当前零日漏洞稀缺的根本原因是法律限制，而非技术难度。"如果每天发布一个漏洞直到新模型问世，就能让这些公司停止渲染末日论调。"他在社交媒体上的尖锐批评引发广泛共鸣。

性能评估数据同样充满争议。虽然Claude Mythos在Epoch能力指数上超越前代Opus 4.6，但与GPT-5.4的差距不足5%。气候投资人Ramez Naam分析指出，Mythos的进步属于线性迭代范畴，并未出现预期中的能力跃迁。更蹊跷的是，Anthropic内部报告与公开ECI数据存在显著差异，暗示其评分体系存在不确定性。

用户端的反馈则暴露出另一个维度的问题。大量使用者抱怨最新版Opus 4.6出现"降智"现象，在洗车方案等基础任务中表现不如前代。AMD主管的日志分析显示，Claude的中位思考长度从2200字符骤降至600字符，深度推理能力被明显压缩。为应对80倍增长的API请求，用户不得不重复调用，导致使用成本飙升。

资深订阅用户的长文控诉揭开了更多内幕。Anthropic被指在核心模型尚未稳定时，将算力资源倾斜至开发"/buddy"等娱乐功能。收紧的Token使用限制与强制降级策略，暴露出其深陷算力困局的现实。这种"舍本逐末"的产品路线，与渲染超级AI威胁的营销策略形成荒诞对照。

当实验室里的末日预言遭遇开源社区的实证检验，当用户抱怨模型变笨与渲染的超级智能形成反差，这场由AI公司主导的安全恐慌正演变为行业信任危机。技术真相与营销话术的激烈碰撞，折射出人工智能领域亟待规范的竞争乱象。

Claude

声明：文章不代表轻松科技观点及立场，不构成本平台任何投资建议。投资决策需建立在独立思考之上，本文内容仅供参考，风险自担！

资讯新闻

Claude Mythos破绽神话幻灭？华尔街惊愕背地是AI“泡沫”争议

相关阅读

热门资讯