首页 > 科技前沿 > 走路洗车、红绿色盲等问题都答舛错了网友吐槽最强编程AI降智严重

走路洗车、红绿色盲等问题都答舛错了网友吐槽最强编程AI降智严重

2026-04-11 15:20:49

4月11日消息，虽然Anthropic前几天发布的Mythos刷新了最强AI大模型记录，但并没有开放使用，当前最强的AI编程大模型还是Claude Opus 4.6，也是目前最贵的。

然而近期Claude的降智问题已经引发了大批高价付费的开发者不满，之前连AMD的AI部门高管都出来表示降智问题已经影响了开发，而且影响范围挺大。

在国内的Linux.do社区中，也有多位网友谈到了Opus 4.6降智的问题，还用两个很出名的AI大模型测试问题做了验证。

这两个题一个是50米距离去洗车到底是要开车还是走路过去，一个是父亲因女儿红绿色盲而崩溃的，本质上都是逻辑陷阱，但很能考验AI的能力。

之前大把国内外AI在洗车问题上翻车，Claude的大模型是少有的能回答对的大模型之一，智商优势明显。

然而现在的实测下来，哪怕是最强大的Opus 4.6大模型，在这两个问题上也开始回答不对了，没有了之前的高智商能力。

也有网友贴图自己的测试，表示能答对，因此这个问题也不是完全一边倒的。

结合之前AMD的吐槽来看，近期Cluade的降智显然是存在的，只是降智的原因不好说，Anthropic公司的高管之前是不承认存在问题的。

比较合理的猜测还是跟算力有关，前几天马斯克的问题中无意中泄露了Claude的Sonnet 4.6是1万亿参数量的大模型，Opus 4.6则是5万亿参数量的，而且还不是MoE类型的，稠密模型对算力的要求很高，成本高昂，所以收费价格也是最贵的。

现在的AI公司卖订阅还是亏钱的，这也能部分解释Anthropic为何要封杀小龙虾这种超高Token消耗的应用的动机。

对国内开发者来说，还有一种降智的原因，那就是Anthropic会根据IP来定向降智，本质上也是分配算力的问题，但是以搞针对性IP/国家的方式，这种事也不止他们一家这么做，OpenAI等其他美国公司也被发现过用这种手段限制国内的开发者和用户。

走路洗车、红绿色盲等问题都答舛错了网友吐槽最强编程AI降智严重

声明：文章不代表轻松科技观点及立场，不构成本平台任何投资建议。投资决策需建立在独立思考之上，本文内容仅供参考，风险自担！

走路洗车、红绿色盲等问题都答舛错了 网友吐槽最强编程AI降智严重