最强数学大模型易主!阿里千问新模型成绩超GPT-4o,网友:这才是真“草莓”(阿里l0算是一个买家数吗)

AIGC动态欢迎阅读

原标题:最强数学模型易主!阿里千问新模型成绩超GPT-4

o,网友:这才是真“草莓”

关键字:模型,数据,版本,数学,团队

文章来源:量子位

内容字数:0字

内容摘要:

克雷西 发自 凹非寺量子位 | 公众号 QbitAI最强数学大模型,现在易主!

阿里千问大模型团队发布的Qwen2-Math,不仅超越了Llama 3.1-405B,也战胜了GPT-4o、Claude 3.5等一系列闭源模型。

而且还会解决竞赛级试题,在GPT-4只能做对一道的AIME 24中,Qwen2-Math答对的题目数量达到了两位数。

Qwen2-Math一共有三个参数量的版本——72B,7B和1.5B。

最强的72B版本,在MATH数据集上比GPT-4o多得了7分,按比例算高出了9.6%。

7B版本也用不到十分之一的参数量,超过了72B的开源数学模型NuminaMath。

而且这个NuminaMath来头不小,它的7B版本在全球首届AIMO中获奖,奖项由数学大牛陶哲轩颁发。

阿里高级算法专家林俊旸激动地宣布,千问团队把Qwen2模型变成了一个数学高手。

fast.ai创始人Jeremy Howard看了直呼amazing。

网友更是惊叹,原来这才是真正的“草莓”,这是开源的胜利,也是所有人的胜利。

超越GPT4o,会做竞赛级试题如前文所说,Qwen2-Math共有72B、7B

原文链接:最强数学大模型易主!阿里千问新模型成绩超GPT-4o,网友:这才是真“草莓”

联系作者

文章来源:量子位

作者微信:

作者简介:

0
分享到:
没有账号? 忘记密码?