作为一个普通消费者,硅基君最喜欢看各个商家之间的价格竞争。
谁不喜欢一块钱打车,九毛九的黄焖鸡外卖?哪像现在薅点平台羊毛,还得到各个微信群里拉下老脸跪求兄弟姐妹们点一下。
这会,虽然和我们日常生活有点远,大型模型的价格战这两天算正式开始了。
自从上周字节跳动在发布会上宣称“豆包主力模型的定价比行业平均价格便宜了99.3%”。这一消息犹如莱克星顿的枪声,引发了一系列不可收拾的反应,各大知名AI公司纷纷站出来高声呼喊——
我也是一样的!
截至发稿,喊出降价的大模型包括智谱、腾讯、阿里巴巴、百度和科大讯飞。
唯独有位清流,零一万物的李开复博士说:“目前不打算降低YI系列模型的API价格。”并认为目前零一万物带给的性能、性价比都很高了。
这话要咱说多少有点不厚道,总不能那么多降价的模型都是因为性能不够而通过降价来吸引消费者吧?
对于大规模的价格战,开复博士还提到了一个例子:“就像特斯拉一样,即使其他品牌的车辆价格比他便宜,他也不会退缩,仍然会降低价格。”
且不提特斯拉这些年调了多少次价格,维权的车主组织了多少群体,就零一万物行业地位对标特斯拉这件事情,咱们要不还是再考虑一下?
咱们先简单说说大模型的价格到底是多少。
通常来说,人工智能(AI)公司会训练出自己的闭源大模型(开源当然不用花钱购买),然后将其出售给其他有需求的个人或公司。
相较于过去的出售软件,比如wps或者office这种一次买断制付费,大模型则是在使用过程中,按使用量收费。
相较于过去的出售软件,比如wps或者office这种一次买断制付费,大模型则是在使用过程中,根据实际使用的量进行收费。这种收费方式和移动联通的“流量包”类似,计费单位则从流量的兆字节和千兆字节,变成了代币。
流量分为上传和下载两部分,而大模型也包括输入和输出两个环节。不同于流量上传和下载价格相同,大模型由于输出过程中存在一个“推理”的环节,因此通常输出的价格会比输入更高。
同样也是由于推理这一过程,性能更强的模型处理每个单词的成本也就越高,因此模型越大,通常定价越贵。
1Token到底等于多少个汉字会根据模型处理文字方式不同有所改变,有兴趣测试一下的可以到OpenAI这个页面试试。
https://platform.openai.com/tokenizer
了解这些基本信息后,我们再来看看各方是如何在市场竞争中降低价格的。
智谱AI最早加入战局,早在5月11日宣布大幅降价,新注册用户获得的额度从500万tokens提升至2500万tokens,GLM-3 Turbo模型中,用户1元可以购买100万tokens。
字节跳动在15号举行的发布会上宣布了一个令人兴奋的消息,他们决定降低价格。现在,只需支付1元,就可以购买到价值125万的豆包pro32k模型tokens。
5月21日,阿里巧妙地降低了大型模型的价格。他们推出了通义千问GPT-4级主力模型Qwen-Long,现在只需支付1元就可以购买200万个tokens。
而百度随后采取行动,直接宣布文心大模型和两大主力模型将全面免费提供,立即生效。
看看这两家的标题,火药味非常浓烈了。
你怕不是忘了5月15号自己说的话了:
今天下午,讯飞宣布星火Lite API将永久免费开放,而星火Pro/Max API的价格也降低到每万个tokens仅需0.21元。
今天傍晚,腾讯混元大模型也宣布全面降价,同时宣布lite版将免费提供。
这些降价公告小数点实在太多,咱们统一换算一下,看看各家一元能买多少万tokens。
讯飞宣布星火Lite API将永久免费开放,而星火Pro/Max API的价格也降低到每万个tokens仅需0.21元。
无论如何,价格便宜的大型模型对于用户和开发者来说肯定是一件好事。对于那些平时只是普通使用大型模型的人来说,具体的价格可能并不重要。
但对于人工智能应用开发者来说,Tokens的价格就是他们最大的成本负担。
几个月前有一个名为哄哄模拟器的应用突然走红,用户数量超出了开发者的预期,据网上流传的截图显示,该应用在一天早上就赚了两千美元。
个人财力有限,很难承担这样的高额花费。
关于各家公司会因此投入多少资金…
在市场竞争激烈的阶段,大家对于抢占市场的重要性并不太关注。
不过我们可以探讨一下从技术角度来降低模型调用价格的方法。
其实最早大幅度降价的,是著名量化私募,幻方旗下的AI公司Deepseek,他们在5月初就宣布降价,1元能够购买1百万个输入Tokens。
并且在一篇论文中详述了自己是如何降低大模型训练成本的,感兴趣的读者可以阅读一下:
链接:https://github.com/deepseek-ai/DeepSeek-V2/blob/main/deepseek-v2-tech-report.pdf
还有一种观点,就是大模型之所以会进行价格战,是因为陷入了同质化竞争。
诚然,外卖、快递、网约车、社区团购甚至如今的新能源车等价格战火热的行业,或多或少都是由于同质化竞争而导致的,大模型也可能是当前卷性能带来的收益越来越低。
在《LLMs正达到收益递减的证据——及其可能意味着什么》一文中,作者提到“大模型在性能提升方面可能已经达到收益递减的临界点。”
作者以OpenAI为例,认为:“从GPT-2到GPT-3的巨大飞跃。从GPT-3到GPT-4的巨大飞跃……但是从GPT-4到GPT-4Turbo的进步就没有那么显著了。”
假设大模型的性能发展真的要迎来一面墙,对于大模型公司来说,如何吸引更多用户是现阶段最重要的一步。
这个行业大家都非常熟悉,阿里巴巴、百度、字节跳动和腾讯,这些公司都是通过竞争激烈的市场争夺用户而崛起的。
正如彭博分析师所指出的,中国在人工智能领域的盈利道路将是一个漫长的过程。行业洗牌可能会成为推动该行业盈利的因素。
表面上是在说中国人工智能价格战会推动行业洗牌,是个好事,但他后面还补了一句——
“尽管在一个资本过剩的行业中,这种情况似乎不太可能很快发生。”
这种情况在当前资本过剩的行业中似乎不太可能很快发生。