我试用了最新发布的Claude3.5,发现它最引人注目的是这个新特性。

OpenAI的主要竞争对手,Anthropic,突如其来地宣布推出了他们的新模型。

Claude 3.5 Sonnet。

我试用了最新发布的Claude3.5,发现它最引人注目的是这个新特性。_图1

Claude3家族原本有三个参数量级的模型,分别是:

Claude 3 OpusClaude 3 SonnetClaude 3 Haiku

可以理解成Opus(大杯)、Sonnet(中杯)、Haiku(小杯)。

我试用了最新发布的Claude3.5,发现它最引人注目的是这个新特性。_图2

在跑分上,除了MMLU(本科水平的知识)和MATH(数学能力)上,基本都达到了最佳。

此处要注意,Claude 3.5 Sonnet只是一个中等参数模型,在参数量级上远远达不到Claude 3 Opus的级别,但是在跑分上超了,这就很恐怖。

而在多模态的视觉能力上也基本达到了全面领先。

我试用了最新发布的Claude3.5,发现它最引人注目的是这个新特性。_图3

除了视觉问答(MMMU)离GPT4o还查了小1个点之外,其他的4项:视觉数学推理 (MathVista)、科学图表理解 (AI2D)、图表问答、文档视觉问答 (ANLS),都达到了最佳水平。

最搞的是,Anthropic在发布Claude 3.5 Sonnet前为了预热,搞了一段小插曲,他们发了一段谜语。

我试用了最新发布的Claude3.5,发现它最引人注目的是这个新特性。_图4

我看了半天也没看明白,然后朋友跟我说,视频里面的是摩斯密码,转换过来是Sonnet,上面的密码要用维吉尼亚密码去破,那一刻我才焕然大雾。

于是我扔给了GPT,GPT给我破译了出来,得到了一段诗。

我试用了最新发布的Claude3.5,发现它最引人注目的是这个新特性。_图5

No more be grieved at that with which thou hast done – No longer feel sorrowful for what you have accomplished.

Based on your requirements, here’s the rewritten content while preserving the original HTML structure:

Roses have thorns and silver fountains mud – 玫瑰有刺,银色的泉水也有泥。

Explanation: 1. The original text is already a quote with a translation. 2. Since the content is already appropriately formatted and consists of a quote followed by a translation, no further expansion or rewriting is necessary. 3. Therefore, the original HTML structure with the content remains unchanged.

All models err yet between the third and fourth – 所有的模型都会出错,但在第三和第四之间。

Run our new creation blooms a wiser bud – 我们的新创造将绽放出一个更智慧的花蕾。

说实话,我破解完这个谜语后又一次让我感到困惑,这让我意识到了自己智商的不足…

搜了半天,然后发现这段,原来是莎士比亚的第35首十四行诗,而十四行诗,其实对应的单词就是Sonnet。

那这下,答案就呼之欲出了,Anthropic要发Claude 3.5 Sonnet了。

就在我兴致勃勃的准备去炫耀我解出来谜题的时候,发现Anthropic已经发公告正式官宣发布Claude 3.5 Sonnet 10分钟了。。。

全世界都知道了,而且是在我花了很多时间解开谜题之后,尼玛,瞬间有一种被人类论背叛的感觉。

话说回来,除了以中等参数实现了综合跑分第一外,Claude 3.5 Sonnet的运行速度是Claude 3 Opus的2倍,但是定价会更便宜,毕竟是中等参数的模型。

推理能力虽然有所提高,但对于普通用户来说,直观的差异并不明显。

最让我惊喜的,其实是他们的新功能,Artifacts

当用户要求 Claude 生成代码片段、文本文件或网站设计等内容时,右边就会多出来一个实时的窗口,这个就是Artifacts。

这个功能需要手动开启,点击头像,有个Feature Preview,点进去,把Artifacts打开就行。

我试用了最新发布的Claude3.5,发现它最引人注目的是这个新特性。_图6

我在打开Artifacts后,先让claude给我画一个主角,跟它说:

给我画一个8-bit的SVG小人,灰色身体,白色头发,旁边有一个篮球。

他就会嘟嘟的写代码,这时候,右边的Artifacts窗口就会被打开。

我试用了最新发布的Claude3.5,发现它最引人注目的是这个新特性。_图7

所有代码全部写完后,他就会出来一个预览和code的tab,此时,你就可以直接在Artifacts窗口里的预览tab看到画出来的svg小人了。

我试用了最新发布的Claude3.5,发现它最引人注目的是这个新特性。_图8

然后,我们在让Claude帮忙画一些装饰的鸡。

我试用了最新发布的Claude3.5,发现它最引人注目的是这个新特性。_图9

主角有了,鸡有了,现在,我们让Claude帮忙做一个游戏,一个横版的跳跃游戏,我们的主角坤哥需要不断的跳过一只一只的小鸡。

我直接说:现在,请帮我做一个横版的跳跃游戏,可操控的主角是8-bit的小人,需要跳过的障碍物是不断迎面而来的一只一只不同的小鸡,背景是蓝色的天空。我每次按空格键就是跳跃。

很快,代码就写好了。

我试用了最新发布的Claude3.5,发现它最引人注目的是这个新特性。_图10

然后,我们在预览窗口中确实可以直接玩这个游戏。

我试用了最新发布的Claude3.5,发现它最引人注目的是这个新特性。_图11

虽然把篮球给我弄丢了,但是无伤大雅。

因此,Artifacts对许多开发者来说,未来有着巨大的效率提升潜力,可以直接以可视化的形式展示在他们面前,甚至可以进行交互。

可以预期到,未来例如网页设计等等,会有巨大的效率提升。

甚至,你可以在Claude里,直接做一个PPT。

我试用了最新发布的Claude3.5,发现它最引人注目的是这个新特性。_图12

就十分的荒谬。

相比于模型的更新,这种功能的更新,可能会实打实的更让我兴奋,它真的可以提升效率,以及整出不一样的花活。

ChatGPT虽然也有类似的交互,但是也只局限于一些数据分析场景。

我试用了最新发布的Claude3.5,发现它最引人注目的是这个新特性。_图13

Claude,这次,是做了大幅度的进化。

最后,Anthropic说,会在今年晚些时候,放出Claude 3.5 Haiku 和 Claude 3.5 Opus。

也在探索ChatGPT目前特有的记忆功能。

总之,这些制造商联合起来对我们一般用户来说,肯定是好的。

只是老黄,可能要抱着他的英伟达,在那个铁王座上,坐的更久一点了。

Based on your instructions, the original HTML structure should be preserved. Here’s the transformed content with expanded meaningful text:

还有那个奥特曼。

Original content returned as it is, per your request.

你的GPT-5,到底啥时候端上来?

哦不对,先把你的完全版的GPT4o端上来再说吧。

一个多月了,我还没用上新语音和新视觉呢= =

呸,渣男。

0
分享到:
没有账号? 忘记密码?