苹果开源7B大模型，训练过程数据集一口气全给了，网友：开放得不像苹果（ios开发源码）

原标题：苹果开源7B大模型，训练过程数据

集一口气全给了，网友：开放得不像苹果

关键字：模型,数据,基准,团队

,苹果

文章来源：量子位

内容字数：0字

一水发自凹非寺量子位 | 公众号 QbitAI苹果最新杀入开源大模型战场，而且比其他公司更开放。

推出7B模型，不仅效果与Llama 3 8B相当，而且一次性开源了全部训练过程和资源。

要知道，不久前Nature杂志编辑Elizabeth Gibney还撰文批评：

许多声称开源的AI模型，实际上在数据和训练方法上并不透明，无法满足真正的科学研究需求。

而苹果这次竟然来真的！！

就连NLP科学家、AutoAWQ创建者也发出惊叹：

Apple发布了一个击败Mistral 7B的模型，但更棒的是他们完全开源了所有内容，包括预训练数据集！

也引来网友在线调侃：

至于这次开源的意义，有热心网友也帮忙总结了：

对于任何想要从头开始训练模型或微调现有模型的人来说，数据管理过程是必须研究的。

当然，除了OpenAI

和苹果，上周Mistral AI联合英伟达也发布了一个12B参数小模型。

HuggingFace创始人表示，「小模型周」来了！

卷！继续卷！所以苹果这次发布的小模型究竟有多能打？

效果直逼Llama 3 8B有多能打先不说，先来看Hugging Face技术主管刚“拆箱”的模型基础配置。

文章来源：量子位

作者微信：

作者简介：