新王Claude 3.5实测：阿里数学竞赛题不给选项直接做对（阿里巴巴数学竞赛出题人）

原标题：新王Claude 3.5实测：阿里数学竞赛题不给选项直接做对

文章来源：量子位

内容字数：0字

衡宇一水发自凹非寺量子位 | 公众号 QbitAI新鲜出炉的Claude 3.5 Sonnet，更快、更便宜，还是全球最强。

在多个关键指标中，GPT-4

o几乎被吊打！

网友对Claude 3.5 Sonnet和GPT-4o的横向实测似乎也印证了官方出炉的数据。

任务是同一个：一句话，让它们帮忙复制网站的UI。

测试者本人表示，GPT-4o这边，给了代码，但没有附加任何细节。

但Claude 3.5 Sonnet刷刷刷就出色完成了任务，甚至给了与这个网站设计相匹配的细节。

训练数据知识截止日期也更新到了2024年4月，网友实测知道今年2月的橄榄球超级碗比赛结果。

不过，这样的大模型新王，谁能忍住不第一时间试玩一波？反正好多网友坐不住了。不到12小时过去，全网对Claude 3.5 Sonnet的测评铺天盖地。

玩法也越来越刁钻，甚至有人用它重现1995年《黑客》中3D数据流的模型。

玩儿得太上头，又怕很快达到Claude的消息容量，只能紧张地继续玩。

Okk，好吧，所以网友的“百般刁难”下，Claude 3.5 Sonnet真的如Anthropic官方说得那么强吗？

目前最受认可

文章来源：量子位

作者微信：QbitAI

作者简介：追踪人工智能新趋势，关注科技行业新突破