最强开源编程大模型一夜易主:精通80+语言,仅22B(程序开源社区)

AIGC动态欢迎阅读

原标题:最强开源编程大模型

一夜易主:精通80+语言,仅22B

关键字:模型,代码,成绩,参数,开发者

文章来源:量子位

内容字数:0字

内容摘要:

克雷西 发自 凹非寺量子位 | 公众号 QbitAI开源代码大模型的王座,再次易主!

来自素有“欧洲OpenAI

”之称的Mistral,用22B参数量表现超越了70B的Code Llama。

模型名为Codestral,将代码的英文Code与公司名结合而成。

在80多种编程语言上进行过训练后,Codestral用更少的参数实现了更高的性能,窗口长度也达到了32k,相比之前一众4k、8k的模型大幅增加。

而且已经有人表示,GPT-4

o和Claude3-Opus都失败的代码编辑任务,被Codestral成功解决了。

于是有网友直言,Codestral的推出,直接改写了多语言代码模型的游戏规则。

另一方面,还有网友直接@了知名本地大模型框架Ollama,希望能够支持Codestral,结果Ollama这边也迅速响应,在请求发出后1个小时就增加了对Codestral的支持。

那么,Codestral在测试中都取得了哪些成绩呢?

开源编程模型的新王者Codestral的参数量为22B,支持32k的上下文窗口。

在开发过程中,研究人员使用了80多种编程语言的代码数据对Codestral进行了训练。

原文链接:最强开源编程大模型一夜易主:精通80+语言,仅22B

联系作者

文章来源:量子位

作者微信:QbitAI

作者简介:追踪人工智能新趋势,关注科技行业新突破

0
分享到:
没有账号? 忘记密码?