解析开源与闭源之争，十大模型厂商的商业策略。（开源和闭源的优缺点）

解析开源与闭源之争，十大模型厂商的商业策略。_图1

大模型市场已经形成了两个主要派别，即“开源派”和“闭源派”。而目前，在大模型竞争进入市场争夺的白热化阶段后，企业在开源和闭源方面的竞争也变得更加激烈。

实际上，大型模型的开源和传统软件的开源是不同的。在开源的定义、治理、社区性质、贡献路径和企业的开源策略上，都在发生巨大变化。

大型企业开闭源策略各不相同

今年大型软件的开源和闭源的讨论更加激烈，一些原本闭源的企业也有开源的呼声；而一些原本开源的企业也有闭源的动作。

百度内部对是否将大模型开源或闭源进行了激烈的讨论。大家都在思考，采取哪种方式能够获得更多的竞争优势。

在BATH几家大厂中，百度和华为选择了闭源的发展路线，即他们不公开他们的源代码和技术细节。而阿里巴巴和腾讯则采取了开源的策略，他们推出了开源的大型模型，使得其他人可以自由地使用和修改这些模型。

百度对于开闭源大模型的争论，部分也来自阿里云等企业今年在开源上的声势和市场动作。

百度对于开闭源大模型的争论，部分也来自阿里云等企业今年在开源领域的声势和市场动作。

到目前为止，虽然百度文心一言仍坚持闭源路线，但百度智能云部门，在其平台上提供了许多功能强大的第三方开源大模型。百度通过闭源文心一言，也通过开源大模型使用的算力、工具和服务，来实现商业上的收益。

在开源领域，今年阿里云的行动非常频繁。5月份在北京举办的AI峰会上，阿里云的首席技术官周靖人表示，开源是阿里云的战略，阿里云已经形成了一个包含开源和闭源的整体体系。阿里云已经开源了从5亿到千亿级别的多个模型，并且采取了更加专业的策略。

业界普遍认为，阿里云积极推广开源的原因有两个：一方面是为了加快争夺市场份额的步伐；另一方面，作为一家云计算企业，阿里云可以采用“以羊毛出在猪身上”的商业模式，从算力、工具和服务中获得收益。周靖人在策略会上特别强调了“百炼”平台的服务。此外，开源还可以为阿里云吸引更多用户，其中一些用户可能会升级为闭源用户。

与其他大型企业相比，腾讯在开源大型模型方面相对较晚。然而，今年5月，他们终于对外开源了一款名为混元文生图大模型的项目。据混元相关人士告诉数智前线，由于市场上已经有很多开源的大型语言模型，因此腾讯这次选择开源文生图，可以说是第一个原生中文开源DiT模型。未来，腾讯还计划尝试更大规模的模型。虽然刚刚开源几周，但商业化影响仍需要进一步观察。

华为云2023年在推出盘古大模型3.0时，表示将采用闭源路线。过去一年，它的重心是在各行业进行联创，落地大模型，并将技术回馈盘古，不断迭代，未参与业界开闭源讨论。华为云在上周也刚刚官宣盘古5.0多模态大模型，发布期间也未涉及开源问题。同时，华为云于去年上线“百模千态”专区，提供第三方开源大模型。

最近在项目订单上活跃的智谱，是国内最早开源大模型的企业。因为智谱由清华技术成果转化而来，2022年，它就将开发的双语千亿模型GLM-130B开源，“当时全国懂大模型的研究员加起来也不过百来人”。智谱CEO张鹏称，开源让大家知道智谱在做什么，同时可以让更多人参与推动大模型的研究和应用。此后在2023年3月，智谱将GLM6b开源，该模型在Hugging Face上的下载量超过1600万次。

虽然张鹏认为开源的初心并不是要去赢得市场或追求商业利益，但ChatGPT爆火后，智谱的GLM开源大模型获得大量关注，也让这家2019年才成立的公司，在融资和商业化上受益颇多。张鹏也称，开源和商业化是整个生态版图里很重要的两块，这两块是有连接的，可以说开源充当着商业化的桥梁。

王小川的百川公司，去年作为创业的明星公司，发布了Baichuan-7B、13B开源可商用大模型，在业界引发了广泛的关注。当时有一些应用开发商告诉数智前线，经过测试后，他们决定从Meta的Llmma转向使用百川，因为百川在中文效果方面表现更出色。

百川开源时，国内大规模模型开源的还很少。此后，越来越多的大规模模型公司，包括大厂，开始开源。百川联合创始人谢剑告诉数智前线，未来还会继续开源，但不会开源特别复杂的模型参数，因为很多人无法应用。

最近快手的文生视频大模型“可灵”非常受欢迎，许多应用企业都希望能够获得可灵的开源版本。然而，快手方面表示，暂时不考虑开源，而是会逐步向业界开放一些相关内容，以供讨论。

而昆仑万维最近开源了一个稀疏大型语言模型Skywork-MoE，以应对大规模密集型大语言模型带来的挑战。昆仑万维兼天工智能首席科学家颜水成告诉数智前线，开源大模型有助于学界进行探索性工作，而公司也推出音乐、游戏等垂类模型，并将采用闭源商业模式。

李开复的创业公司零一万物，是这波大模型独角兽中最后一家开源的企业。公司开源负责人林旅强非常坦率，认为开源和闭源是商业设计问题。零一万物也采取了开源、闭源并进的模式。开源在一定程度上扮演了商业拓展角色，为公司的业务拓展提供了支持和推动。同时，今年零一万物发布千亿参数模型Yi-Large，一些使用了开源模型的客户有望转化到该闭源模型上。

开源大模型与开源软件有三大区别

虽然大模型开源如火如荼，但业界一直在诟病它的透明度，质疑为什么好多信息，企业不公开。实际上，大模型开源和传统软件开源不是一回事。

虽然大模型开源如火如荼，但业界一直在诟病它的透明度，质疑为什么好多信息，企业不公开。实际上，大模型开源和传统软件开源不是一回事。大模型开源是指将训练好的深度学习模型公开分享，供其他人使用和研究。而传统软件开源是指将软件的源代码公开，供其他人查看、修改和分发。因此，大模型开源并不意味着企业需要公开所有相关信息，而是将模型本身开放给社区，以促进创新和合作。

红帽中国首席架构师张家驹告诉数智前线，软件开源是指将软件的源代码公开，这样我们可以获得源代码，从而更好地理解软件的工作原理和设计思路，同时也可以在源代码的基础上进行修改或添加新功能。

但大模型是一个黑盒子，里面有很多至今无法解释的现象，所以对大模型的开源，业界提出了更多维度，有的说需要四部分——权重、数据集、代码和训练过程；也有的说需要五部分，还包括了框架。即使是这些定义，业界也有不同意见：为什么会有这样的定义？这更像是从传统开源软件的思路来考虑的。

然而，对于大模型的开源，有人认为需要四个主要组成部分，包括权重、数据集、代码和训练过程。还有一些人认为需要五个部分，其中还包括了框架。这些定义的出现可能是受到传统开源软件的思路的影响。

有趣的是，只有极少数公司或机构的大模型，同时开源了上述四部分或五部分，比如IBM刚刚开源出来的Granite大语言模型；也有像智源研究院、马斯克旗下大模型公司xAI ，开源了权重和数据集。比如，根据智源人工智能研究院副院长兼总工程师林咏华的介绍，今年6月，智源最新开源数据集分为两类，一类是通用开源指令微调数据集，一类是行业垂类数据集，涵盖18个行业。

“现在业界的共识是，至少将权重再加上一些推理代码开源。”零一万物林旅强说，只有这两部分开源，其他人才可以将开源大模型使用起来。由此，开源大模型现在的定义，有点像微软提过的“免费软件”。所以，谷歌等公司在其官网上称是开源权重（open weight），而不是开源大模型。

“现在业界的共识是，至少将权重再加上一些推理代码开源。”零一万物林旅强表示，只有这两部分开源，其他人才能够开始使用开源大模型。因此，开源大模型的定义现在有点类似于微软提到的“免费软件”。因此，谷歌等公司在其官网上称其为开源权重（open weight），而不是开源大模型。

为什么在开源大模型中，权重如此重要？有业界人士将权重打比方为“一大堆数字”，一个13B的模型，就有130亿个数。这些数字与模型如何处理输入的数据、如何做出预测和生成文本等相关，代表了一个大模型的智慧。

在开源大模型中，权重的重要性不言而喻。权重可以被视为模型的核心，它们是模型在训练过程中学习到的参数。这些权重是由大量的数字组成的，对于一个13B的模型来说，就有130亿个数。这些数字代表了模型对输入数据的理解和处理能力，以及在生成文本和做出预测等任务中的智慧。因此，权重的准确性和合理性对于模型的性能和效果至关重要。

而在大模型中，代码分为预训练代码、微调代码和推理代码。预训练代码是大模型公司的核心技术；对于微调代码，市场上已有很多公开方法，而大模型要被用起来，需要推理代码。至于训练过程和数据集，往往也是大模型厂商的核心竞争力。

与传统软件不同，在大规模开源方面，企业的态度发生了微妙的变化。现在大规模模型的成本非常高，训练一个拥有千亿级参数的模型需要几千万甚至上亿的投入，因此，很多公司在开源问题上变得保守。这是一个现实问题，每家公司的开源策略都必然与其商业战略相一致。而且，即便将这些核心技术开源，大多数工程师和企业也没有足够的资源来复现。

业内人士认为，开源大模型和开源软件存在三个核心区别：

首先，开源软件和大模型在透明度方面存在明显的差异。开源软件的代码是公开的，任何人都可以查看和分析，这使得开源软件的运行原理和内部机制变得透明可见。相反，大模型往往是一个黑盒子，其内部机理和运行方式并不为人所知。

二是大模型社区的性质发生了变化。之前开源社区强调全球工程师的贡献；然而，由于算力等资源的限制，在大模型社区中，可能有超过90%的工程师无法直接为大模型做出贡献，因此许多社区变成了单向模式，工程师们只是使用大模型。在HuggingFace上，Meta的Llmma开源大模型已经有几千个变种，但彼此之间缺乏交互，也很难将创新合并。

其三是大模型企业开源策略发生变化。中国信通院知识产权与创新发展中心产业发展研究部主任张俊霞说，因为大模型的训练投入特别大，这导致企业在开源策略的选择上，特别是在一些许可或信息披露上，都有很大不同。“这个问题现在不管是国内还是国际社区，都在非常激烈地讨论。”

解析开源与闭源之争，十大模型厂商的商业策略。_图2

不过，近期，一些动态正在发生。比如，红帽在社区贡献上有了尝试动作。一方面IBM开源了Granite模型；另一方面，“训练过程”在另外一个开源项目InstructLab中。由IBM出资建设了一个平台。每过一段时间，就把大家“集”来的数据放在上面“训”，形成模型的迭代。同时，用户也可以选择保留自己的数据，训练分叉的模型。“客户不用‘躺平’，可以用他们的场景、经验参与到调试当中，不断在变化之中调优。”红帽大中华区资深市场总监赵文斌告诉数智前线。

然而，最近一些令人振奋的变化正在发生。例如，红帽公司开始积极参与社区贡献。一方面，IBM开源了Granite模型；另一方面，在另一个开源项目InstructLab中进行了“训练过程”。IBM投资建立了一个平台，定期将大家收集到的数据放在上面进行训练，形成模型的迭代。同时，用户也可以选择保留自己的数据，训练出不同的模型。“客户不需要被动接受，可以根据自己的场景和经验参与到调试过程中，不断进行优化。”红帽大中华区资深市场总监赵文斌告诉数智前线。

而张俊霞认为，大模型时代，对开源的定义以及未来的治理，不管是从项目层面、企业层面还是从国家层面，也都会发生一些巨大的变革。

“开源的目的不是一定要超越闭源，而是为了促进合作和共享。”

除了讨论如何定义开源大模型，开源派和闭源派在开闭源大模型的优劣和安全性方面也存在争议。

如果在当前这个时间点，OpenAI等的闭源模型比较强。”但不意味着闭源会持续遥遥领先。”零一万物林旅强说，未来当算力平民化，再加上互联网协作精神，可能在5年、10年的时间内，开源大模型就会变得更强大。

不过，智源研究院智能评测组负责人杨熙从评测角度看，仅仅将开源模型和闭源模型进行对比可能会导致不公平的结果。因为闭源大模型可能是一个完整的系统，例如包含了检索增强等多种技术，而开源模型只是一个单一的模型，将它们进行“多对一”的比较显然是不合理的。

而红帽张家驹认为，开源的目标不是说一定要超过闭源。“即便之前全球工程师合力做Linux，目标也不是要超过闭源。”开源的价值是更加公开透明，技术上更加平权，不会让其成为少数人牟利的手段。“更为关键的是，对于人工智能来说，如果未来走向AGI，开源让AI的发展走向，更符合全人类的利益，这一点的价值要远高于在某一方面去超越闭源。”

而开源和闭源大模型谁更安全，业界也有着争议。开源派认为，在闭源环境当中，大家不知道有没有人监督它。开源的好处是一旦出现一些安全问题，整个社区会来共同检查。

但也有人士认为“开源也会带来各种意想不到的问题”。比如，开源可能将大模型交到了“恐怖分子”手里。“举个例子，开源大模型的数据集，如果别人加了一些数据，训练出大模型去干了违法的事。”一家大模型企业开源负责人对数智前线说，虽然他们也有开源大模型。另外，现在各国都强调数据主权，数据开源后怎么追踪也是问题。“所以国家鼓励开源，但不是无限制的开源。”

但也有人士认为“开源也会带来各种意想不到的问题”。比如，开源可能会导致大模型落入“恐怖分子”的手中。“举个例子，如果别人在开源大模型的数据集中添加了一些数据，然后使用这个大模型进行违法活动。”一家大模型企业的开源负责人告诉数智前线，尽管他们也在进行大模型的开源。此外，各国现在都非常重视数据主权，一旦数据开源，如何进行追踪也成为一个问题。“因此，国家鼓励开源，但并不是无限制的开源。”

对于这些观点交锋，智源研究院杨熙表示，开源和闭源软件都存在一些问题，包括透明性、合规性和安全性问题，同时也涉及到治理问题。

信通院张俊霞提出，关于治理，其实大模型是一个技术性非常强的领域，因此“技术的问题，一定要依赖技术”。她看到，谷歌发布了一款开源工具Model Explorer，帮助人们理解大模型技术的内部工作机制；IBM、微软也发布了关于开源大模型或人工智能的伦理和解决手段，非常值得学习参考；今年1月，腾讯发布了安全治理框架，涉及一个模型整个生命周期里每个阶段的安全技术、问题和管理等。

杨熙则强调，开源其实对模型内在机理的刻画和理解，非常有帮助。“在我看来，开源和闭源是一个硬币的两面。”智谱杨熙称，开源可能促进我们更多的探索性和基础性工作；闭源更多促进产品化和商业化，推动大模型走进每个人的生活。这两件事其实不应该是之争，而是和谐共存。

“现在，什么样的框架最适合从行业监管角度，既不太过于增加企业的负担，又能够实现行业事前、事中、事后的一个完整的监管，其实全球还没有一个统一的答案，仍然在探索过程中。”张俊霞表示。

开源和闭源软件，如何选择适合商业化应用

在开闭源的选择上，智谱张鹏认为，如果只是想做一些实验和尝试，可以选择开源模型，但如果想要在上面做商业化应用，大部分人还是会选择商业化版本，因为有保障，能够提供更好的服务。

这代表了业界、尤其是ToB行业很多人士的观点和看法。

红帽张家驹则认为，无论是开源、闭源，需要优先考虑客户是否需要本地部署大模型。无论国内外，不少客户都有自主可控的需求。如果采用公有云上的模型，比如OpenAI，客户要考虑数据暴露信息的问题。“这是个很重要的问题。”

值得注意的是，闭源大模型是否能够在本地进行部署，需要获得相应的授权和许可。开源大模型同样需要遵守一些协议和合规性要求。从技术角度来看，许多开源模型可以被成功地部署到本地环境中。而开源模型的一个优势在于可以方便地进行微调，以打造适用于不同行业的大型模型。

除了本地化部署之外，也有企业需要调用公有云上的大规模模型。“大规模模型的需求一定是开放混合的。”张家驹说。

大模型应用开发商北京可为是最早在市场监督管理领域，打造、落地行政执法垂直大模型的企业。公司联合创始人曾明告诉数智前线，他们在开闭源大模型中，最终选择了开源大模型。一方面，行政执法是比较知识化的应用，去年他们在测试验证中就发现，当时的开源模型在解决主要场景上，已经符合要求；另一方面，成本是重要的因素之一。同时，这类垂直大模型属于政务应用，客户对数据安全要求极高，不能触碰红线，需要私有化部署，而开源模型在这方面更为灵活方便。

“在选择开源大模型的过程中，我们经历了很多验证，其中最辛苦也最有趣的是这个过程。”曾明说，他们不断对不同模型进行验证，同时也验证了自己的训练策略。“要教会大模型，就要还原人类推理和思考的过程。所谓的足够与不足够，就要看推理的结果是否能够满足要求。”

此外，不少业界人士认为，目前企业开源的大模型通常是中低版本的，而闭源的模型性能更强，更适合比较高要求的应用，如当下大模型企业与标杆客户联合共创的类型。而大多数普通应用场景，开源已能满足要求。

此外，不少业界人士认为，目前企业开源的大模型通常是中低版本的，而闭源的模型性能更强，更适合对性能要求较高的应用，如当下大模型企业与标杆客户联合共创的类型。而大多数普通应用场景，开源已能满足要求。

在大模型时代，对于开源的定义、治理、社区运营和商业化等方面都正在快速发展和变化。上述问题仍然在激烈的碰撞和演进中。

猜你喜欢