大模型集体失智!9.11和9.9哪个大,几乎全翻车了(模型大厂有几家)

AIGC动态欢迎阅读

原标题:大模型

集体失智!9.11和9.9哪个大,几乎全翻车了

关键字:报告,腾讯,模型,提示,问题

文章来源:量子位

内容字数:0字

内容摘要:

梦晨 一水 发自 凹非寺量子位 | 公众号 QbitAI没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??

强如GPT-4

o,都坚定地认为9.11更大。

谷歌Gemini Advanced付费版,同样的口径。

新王Claude 3.5 Sonnet,还一本正经的给出离谱的计算方法。

9.11 = 9 + 1/10 + 1/1009.9 = 9 + 9/10

到这一步还是对的,但下一步突然就不讲道理了

如上所示,9.11比9.90大0.01。你想让我进一步详细解释小数的比较吗?

这你还解释啥啊解释,简直要怀疑是全世界AI联合起来欺骗人类了。

艾伦AI研究所成员林禹臣换了个数字测试,GPT-4o依旧翻车,他表示:

一方面AI越来越擅长做数学奥赛题,但另一方面常识依旧很难。

也有网友发现了华点,如果是说软件版本号,那么9.11版本确实比9.9版本更大(更新)。

而AI都是软件工程师开发的,所以……

那么,究竟是怎么回事?

先进大模型集体翻车‍‍‍‍‍‍‍一觉醒来,一众响当当的大模型开始认为“9.11>9.9”了?

发现这个问题的是Riley Goodside,有

原文链接:大模型集体失智!9.11和9.9哪个大,几乎全翻车了

联系作者

文章来源:量子位

作者微信:QbitAI

作者简介:追踪人工智能新趋势,关注科技行业新突破

0
分享到:
没有账号? 忘记密码?