大模型集体失智！9.11和9.9哪个大，几乎全翻车了（模型大厂有几家）

原标题：大模型

集体失智！9.11和9.9哪个大，几乎全翻车了

关键字：报告,腾讯,模型,提示,问题

文章来源：量子位

内容字数：0字

梦晨一水发自凹非寺量子位 | 公众号 QbitAI没眼看……“9.11和9.9哪个大”这样简单的问题，居然把主流大模型都难倒了？？

强如GPT-4

o，都坚定地认为9.11更大。

谷歌Gemini Advanced付费版，同样的口径。

新王Claude 3.5 Sonnet，还一本正经的给出离谱的计算方法。

9.11 = 9 + 1/10 + 1/1009.9 = 9 + 9/10

到这一步还是对的，但下一步突然就不讲道理了

如上所示，9.11比9.90大0.01。你想让我进一步详细解释小数的比较吗？

这你还解释啥啊解释，简直要怀疑是全世界AI联合起来欺骗人类了。

艾伦AI研究所成员林禹臣换了个数字测试，GPT-4o依旧翻车，他表示：

一方面AI越来越擅长做数学奥赛题，但另一方面常识依旧很难。

也有网友发现了华点，如果是说软件版本号，那么9.11版本确实比9.9版本更大（更新）。

而AI都是软件工程师开发的，所以……

那么，究竟是怎么回事？

先进大模型集体翻车‍‍‍‍‍‍‍一觉醒来，一众响当当的大模型开始认为“9.11>9.9”了？

发现这个问题的是Riley Goodside，有

文章来源：量子位

作者微信：QbitAI

作者简介：追踪人工智能新趋势，关注科技行业新突破