最强数学大模型易主！阿里千问新模型成绩超GPT-4o，网友：这才是真“草莓”（阿里l0算是一个买家数吗）

原标题：最强数学大模型易主！阿里千问新模型成绩超GPT-4

o，网友：这才是真“草莓”

关键字：模型,数据,版本,数学,团队

文章来源：量子位

内容字数：0字

克雷西发自凹非寺量子位 | 公众号 QbitAI最强数学大模型，现在易主！

阿里千问大模型团队发布的Qwen2-Math，不仅超越了Llama 3.1-405B，也战胜了GPT-4o、Claude 3.5等一系列闭源模型。

而且还会解决竞赛级试题，在GPT-4只能做对一道的AIME 24中，Qwen2-Math答对的题目数量达到了两位数。

Qwen2-Math一共有三个参数量的版本——72B，7B和1.5B。

最强的72B版本，在MATH数据集上比GPT-4o多得了7分，按比例算高出了9.6%。

7B版本也用不到十分之一的参数量，超过了72B的开源数学模型NuminaMath。

而且这个NuminaMath来头不小，它的7B版本在全球首届AIMO中获奖，奖项由数学大牛陶哲轩颁发。

阿里高级算法专家林俊旸激动地宣布，千问团队把Qwen2模型变成了一个数学高手。

fast.ai创始人Jeremy Howard看了直呼amazing。

网友更是惊叹，原来这才是真正的“草莓”，这是开源的胜利，也是所有人的胜利。

超越GPT4o，会做竞赛级试题如前文所说，Qwen2-Math共有72B、7B

原文链接：最强数学大模型易主！阿里千问新模型成绩超GPT-4o，网友：这才是真“草莓”

文章来源：量子位

作者微信：

作者简介：