走路洗车、红绿色盲等问题都答舛错了 网友吐槽最强编程AI降智严重
2026-04-11 15:20:49
4月11日消息,虽然Anthropic前几天发布的Mythos刷新了最强AI大模型记录,但并没有开放使用,当前最强的AI编程大模型还是Claude Opus 4.6,也是目前最贵的。
然而近期Claude的降智问题已经引发了大批高价付费的开发者不满,之前连AMD的AI部门高管都出来表示降智问题已经影响了开发,而且影响范围挺大。

在国内的Linux.do社区中,也有多位网友谈到了Opus 4.6降智的问题,还用两个很出名的AI大模型测试问题做了验证。
这两个题一个是50米距离去洗车到底是要开车还是走路过去,一个是父亲因女儿红绿色盲而崩溃的,本质上都是逻辑陷阱,但很能考验AI的能力。
之前大把国内外AI在洗车问题上翻车,Claude的大模型是少有的能回答对的大模型之一,智商优势明显。
然而现在的实测下来,哪怕是最强大的Opus 4.6大模型,在这两个问题上也开始回答不对了,没有了之前的高智商能力。
也有网友贴图自己的测试,表示能答对,因此这个问题也不是完全一边倒的。
结合之前AMD的吐槽来看,近期Cluade的降智显然是存在的,只是降智的原因不好说,Anthropic公司的高管之前是不承认存在问题的。
比较合理的猜测还是跟算力有关,前几天马斯克的问题中无意中泄露了Claude的Sonnet 4.6是1万亿参数量的大模型,Opus 4.6则是5万亿参数量的,而且还不是MoE类型的,稠密模型对算力的要求很高,成本高昂,所以收费价格也是最贵的。
现在的AI公司卖订阅还是亏钱的,这也能部分解释Anthropic为何要封杀小龙虾这种超高Token消耗的应用的动机。
对国内开发者来说,还有一种降智的原因,那就是Anthropic会根据IP来定向降智,本质上也是分配算力的问题,但是以搞针对性IP/国家的方式,这种事也不止他们一家这么做,OpenAI等其他美国公司也被发现过用这种手段限制国内的开发者和用户。


相关阅读
-
谷歌Gemini新晋级:用户输入问题就能轻松获得交互式3D模子资讯百科 2026-04-11 15:15:03
-
专门发稿黑小米、华为、抱负的水军被一锅端,清华传授婉言是坏事:比来舆论环境在改良科技前沿 2026-04-11 15:14:05
-
绿皮车爆改挪动五星酒店 武铁奢华专列价钱暴光科技前沿 2026-04-11 15:08:45
-
京东否认涉足网约车范畴 结合长安推“Open动身”新项目13日上线资讯百科 2026-04-11 15:08:17
-
马斯克发文庆祝“阿尔忒弥斯二号”出航:欢送猎户座飞船回家资讯百科 2026-04-11 15:02:45
-
快充好仍是换电好?岚图卢放:目前手机都没有备用电池了科技前沿 2026-04-11 15:01:56
-
大疆新品来袭,Osmo Pocket 4定档2026年4月16日 邀您共赴光影之约资讯百科 2026-04-11 14:56:18
-
供电更稳了 成都建成西南首个500千伏双环网 承载才能超2500万千瓦科技前沿 2026-04-11 14:55:58
-
谷歌安卓新功能“主动备份”:绕过云盘,手机文件直传PC更放心资讯百科 2026-04-11 14:50:10
-
仅1秒便可盗声 太乙真人配音演员接连被AI 抢单 生活窘境空前科技前沿 2026-04-11 14:49:19