苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果(ios开发源码)

AIGC动态欢迎阅读

原标题:苹果开源7B大模型,训练过程数据

集一口气全给了,网友:开放得不像苹果

关键字:模型,数据,基准,团队

,苹果

文章来源:量子位

内容字数:0字

内容摘要:

一水 发自 凹非寺量子位 | 公众号 QbitAI苹果最新杀入开源大模型战场,而且比其他公司更开放。

推出7B模型,不仅效果与Llama 3 8B相当,而且一次性开源了全部训练过程和资源。

要知道,不久前Nature杂志编辑Elizabeth Gibney还撰文批评:

许多声称开源的AI模型,实际上在数据和训练方法上并不透明,无法满足真正的科学研究需求。

而苹果这次竟然来真的!!

就连NLP科学家、AutoAWQ创建者也发出惊叹:

Apple发布了一个击败Mistral 7B的模型,但更棒的是他们完全开源了所有内容,包括预训练数据集!

也引来网友在线调侃:

至于这次开源的意义,有热心网友也帮忙总结了:

对于任何想要从头开始训练模型或微调现有模型的人来说,数据管理过程是必须研究的。

当然,除了OpenAI

和苹果,上周Mistral AI联合英伟达也发布了一个12B参数小模型。

HuggingFace创始人表示,「小模型周」来了!

卷!继续卷!所以苹果这次发布的小模型究竟有多能打?

效果直逼Llama 3 8B有多能打先不说,先来看Hugging Face技术主管刚“拆箱”的模型基础配置。

原文链接:苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果

联系作者

文章来源:量子位

作者微信:

作者简介:

0
分享到:
没有账号? 忘记密码?