2024年已过半,AI技术发展到何种程度了?(ai技术现在成熟吗)

2024年已过半,AI技术发展到何种程度了?_图1

很多客户向他反馈,自己很困惑。一方面,大模型更新速度太快,搞不清楚到底哪个好用;同时,自己也不知道大模型怎么跟业务结合;另外,自己的数据集究竟能不能精调出一个好用的大模型,心里也没谱。

最后的结果就是,虽然愿意投入大型模型,但是不知道如何开始,即使下定决心了,也无法拿出太多的预算。

这进而导致,大型公司开始降低价格,展开了价格战。“拼到最后就是,不断投入资金、价格持续下降、却没有用户使用的状态。”

陈冉是人工智能社区和生态公司开放传神(OpenCSG)的创始人、首席执行官(CEO),他认为大模型行业的无效内卷是一种资源浪费。去年一些追逐大模型的公司们,最终没能避免陷入当年ofo等公司曾经遇到的困境。

这逼得行业大佬、零一万物创始人李开复放话,“如果中国市场就是这么卷,大家宁可赔光、通输也不让你赢,那我们就走外国市场”。

做了多年技术开发,很早就开始AI创业的李友峰,同样对今天的现象感到不解。“以前我们讨论一个项目,会关注它有什么价值,但到了AI大模型,大家很少讨论价值,都在讨论领先技术。”

无处不在的榜单,各种各样的排名,自夸自卖的营销手段,使得这个行业显得热闹喧嚣。厂商们最终投入了大量资金,但产品并未真正推广开来,技术实际上也没有取得太大的领先优势。

据报道,衔远科技,一家清华系大模型公司,将在5月下旬迎来一次高层人事变动。创始人周伯文将离开公司,这一消息引起了创业者们的关注。有人认为,过度聚焦于算法可能是一种错误的发展方向。

在中国,大规模创业是一条非常具有挑战性的道路,对于某些团队来说,甚至可能是一条不可逆转的道路。

如今,已经过去了2024年的一半,”百模大战”也已经过去了一年多。那么,行业发展到了什么程度?接下来又会朝着什么方向发展呢?

2024年已过半,AI技术发展到何种程度了?_图2

卷技术:

有太多人追求高分,而实际能够真正付诸行动的人却很少

国内大模型行业,今年明显比去年“安静”。去年是“各行各业”都来参与,几百个大模型面世,今年除了几个科技大厂和头部的创业公司,其他大部分都消停了。

因为大家发现,无论吆喝声多么大,即使声音再响亮,也无法产生任何实际效果。

国内的大型项目并不是太少,而是数量过多,尤其是存在夸大宣传的情况较多。

“厂商总是宣传大模型的功能,却很少提及其限制,这让客户有些误导,以为大模型可以应对所有任务,希望能够完全改变原有的业务模式,但这是不现实的。”陈冉对「定焦」说。

回顾过去一年大模型行业的发展,我们会发现,最先打起来的不是价格战,甚至也不是技术战,而是营销战。

营销是为了增加曝光度和知名度。举办发布会、提升排名、投放广告甚至挑战对手,可以吸引更多关注,让大家“感觉”自己处于领先地位。至于产品的实际效果和技术实力如何,可以在后期进行进一步的补充和提升。

李友峰告诉「定焦」,目前国内所有的所谓自主研发的大型模型,基本上都是在开源架构的基础上进行了改进,没有真正意义上的原创和完全自主研发。这意味着,各大模型公司之间的技术差距并不是很大。

2024年已过半,AI技术发展到何种程度了?_图3

这也是为什么一家创业公司,能在两三个月内从零到一推出一款全新大模型。最好的例证是,去年李开复的零一万物发布“Yi”系列模型,被指使用了LLaMA的架构,只对两个张量进行了重命名。

陈冉认为,国内大规模创业生态系统尚未完全形成,许多人纷纷加入其中,发布几个模型并不能证明什么。他以智能汽车行业的早期阶段进行了类比:许多人都想要制造汽车,有人制造轮胎,有人制造发动机,甚至有人制造雨刷,但最基本的电池、电控甚至轮子座椅都还没有准备好。

从技术角度来看,截至目前,国内没有任何一个团队处于绝对领先的地位。

AI大模型有三大要素:算法、数据、算力,国内厂商们过去一直在研究和优化算法,大家发布模型,本质上是发布一套经过精心设计和改进的算法和系统。大家比拼谁的算法更先进,谁的模型参数更大,推理效率更高。但现在越来越多从业者发现,算法其实没有明显的技术壁垒。陈冉更是直言“大模型的价值有限”。

“我认为在企业级别上使用大规模模型是没有意义的,开源的企业级解决方案就足够了,因为最关键的是数据。”他说。

数据是比算法更稀缺的资源。算法可以通过修改开源模型和人海战术迭代,算力可以通过投资购买硬件获得,但优质的数据没有渠道售卖,金钱不一定能够获取。

训练模型类似于培养学生,数据可以看作是教材或教育资源,而预训练则是指这个过程。与一线城市的孩子相比,偏远山区的孩子从小接触到的教育资源有所不同,因此他们的训练过程也会有所差异,最终考上重点大学的概率也会有所不同。可以说,拥有高质量的数据是预训练成功的关键之一。

过去一年,行业里评估一个大模型好坏的标准,是通过测评,相当于考试。既然是考试,就有作弊的空间,或者可以通过刷题得高分。这就导致,很多大模型其实是“应试教育”的产物——参数庞大、得分高、性能强,但缺乏实际应用能力。

李友峰认为,算法的应用受到很大的限制,如果没有具体的应用场景,算法就没有意义。“举个例子,如果一个模型的参数很多,计算能力很强,它在解决数学问题上可能表现得很好,但这并不意味着它能够在实际业务中产生价值。”

今年以来,大模型拼参数的风气有所改观,各种各样的“排行榜”也有所收敛,说明公众不容易被欺骗了。问题是,如果不比参数,大家还能比什么呢?

2024年已过半,AI技术发展到何种程度了?_图4

卷价格:

C端消费者不敢购买,B端商家无法承担成本

一个模型或一个项目要证明自己有价值,最直接的方法是通过实现盈利来证明。今年以来,越来越多AI创业者和投资人,开始将商业模式作为重要的考量因素。

大模型行业的商业化有两大类——To C(面向个人用户)和To B(面向企业、政府、开发者等)收费模式。

去年行业达成共识,由于To C收费困难,因此决定先从B端入手。

B端企业是百度千帆大模型平台的主要客户。一家专注于系统集成的公司的员工告诉「定焦」,他们很早就开始使用百度的千帆大模型平台,并且非常积极地拥抱这一大模型技术。然而,他们并不是因为模型效果好才选择使用,而是出于对AI技术发展的担忧,他们担心如果不使用大模型,就会被其他企业超越。不过,一旦大模型开始收费,他们就需要再次考虑是否继续使用。

这代表了很多企业的心态:如果能免费获取到资源就会选择免费获取,但如果需要付费,就必须确保能够看到实际的效果。 用陈冉的话说:“让客户花钱,就必须给他们展示出成倍的效果,不见兔子不撒鹰。”

李友峰认为,真正使用大型模型的企业,都注重业务数据而不是算法指标。“例如转化率、点击率和其他关键指标,分别提高了几个百分点,如果不能实现这些,即使算法具有1万亿参数,价格低至1毛钱,客户也不会购买。”

5月的这一轮价格战中,大型模型API的调用价格大幅下降,降幅超过90%。以字节跳动、阿里和百度为例,每百万token推理输入量的价格分别降到了0.8元、0.5元和免费。

然而这更多被市场解读为营销行为,有点清仓大甩卖的意味。

2024年已过半,AI技术发展到何种程度了?_图5

Lepton AI创始人、阿里原副总裁贾扬清表示:“今天并不是说API价格高就没有人使用,而是因为企业首先需要明确如何利用API产生业务价值,否则即使价格便宜也是浪费。”

出门问问创始人李志飞更是直言:“将API价格降到极低,说明OpenAI认为在中国竞争环境下,对消费者收费和对企业收费的两种商业模式都难以持续。”

百度是同时面向个人用户和商业用户的两手抓策略。其中,面向个人用户的文心一言4.0是付费版本,用户可以选择连续包月的方式,每月支付49.9元。百度一直没有公布文心一言的付费率数据。根据AI产品榜的数据,后起之秀月之暗面的Kimi在4月份的网页访问量超过了文心一言。Kimi并没有选择收取会员费的方式,而是采取了非常独特的打赏功能,这是一种非强制性的方式,用户可以在高峰期算力不足时获得优先使用的权益。

这还是C端大模型的头部选手,由此可见收费之难。归根到底,当前的大模型产品还不够好用,不是那么刚需,需要给人们一个充分的付费的理由。

AI初创公司语核获得了奇绩创坛的投资,最初他们的产品主要面向普通用户,解决各种实际需求。创始人池光耀告诉「定焦」,其中一款主打产品CopyAsk,可以免费使用,也可以通过付费解锁更多功能。然而,超过99%的用户选择免费使用,这导致公司很难通过收入维持运营。

今年初,语核进行转型,开始开发面向企业客户的Agent产品,目前已经成功签下两个订单,“客户对付费的意愿还不错,现在有机会赚钱了,非常不错。”不过,要完全开展某个特定行业的企业客户业务,还需要一段时间的探索和实践。

有极少部分公司,抓住了市场需求,并通过创新的业务模式和有效的市场推广,率先赚到了丰厚的利润。

陈冉想将他的OpenCSG打造成一个生态系统。他在线上建立了一个社区,同时线下销售软件CSGHub和Starship。主要的客户群体是B端企业和D端开发者。他已经探索出了应用分佣和用户订阅两种变现模式,并计划在未来增加算力分佣模式。他告诉「定焦」,公司预计今年的营收将达到几千万,盈利将达到几百万。

2024年已过半,AI技术发展到何种程度了?_图6

卷应用:

热门应用未出现, 产品和工程实施困难

大模型发展到今天,从业者一方面努力寻找盈利机会,同时也在期待出现热门应用。之前我们见证了妙鸭相机、Kimi、Suno等应用的走红,但这些应用还没有达到爆款的级别。只有出现真正的爆款应用,才能证明AI不仅仅是纸上谈兵。

在大型模型厂商展开API价格战的时候,有些人对此持怀疑态度,有些人则不屑一顾,还有些人则格外兴奋。

作为一个独立应用开发者,池光耀认为API价格下降是非常有利的。在API价格下降之前,他每个月需要花费大约200元的预算来进行模型调试,而现在他使用降价后的深度搜索DeepSeek-V2模型,只花费了1.11元的费用,而且只用了半个多月的时间。

他去年开发了多款应用,但由于高频调用带来的昂贵推理成本以及用户不愿付费,这些产品至今未能推出。现在他迫切希望让这些应用开始运行,“如果不是手上有无法推销的B端订单,我就直接去开发C端产品了。”与此同时,之前因为无法承担API调用费而无法完成的B端订单,现在也可以顺利完成了。

他认为,接下来几个月,预计会有大量关于大模型应用场景的探索,这可能会导致应用场景数量的大幅增加。一些过去需要依靠人工或工程化手段判断的高频、低逻辑需求,且延时不敏感的应用场景,或许可以通过免费的大模型API来替代。

在实施大型模型的过程中,首先需要从具体的应用场景入手。无论大型模型的API是否降价,寻找适合的应用场景将成为下半年的共识。

李友峰认为,下半年出圈的应用会越来越多,找到合适的场景,在规模产出的基础上覆盖更大范围的成本。“大家应该努力寻找价值,而不是只关注价格。”

2024年已过半,AI技术发展到何种程度了?_图7

目前的人工智能(AI)应用中,有两类已经显现出了价值,并获得了不错的反馈。

一类是提高工作效率,Kimi帮助职场打工人搜索资料、整理文献;造物云利用AI为品牌进行产品设计和营销物料制作,创始人邱懿武告诉「定焦」,他们利用AI为某咖啡品牌设计了2000个杯子的方案,仅需10元的算力成本,不计算模型投入。

另一类是娱乐 ,比如Suno这种人工智能写歌软件,以及很多创业公司在开发的人工智能陪伴、角色扮演。

目前行业里普遍认为,Agent AI(智能代理)是下半年行业的重点,国内外从业者都在往这方面卷。

随着对产业的深入研究,李友峰发现,人工智能在产品和工程方面面临着真正的挑战(指构建、开发和部署大型机器学习模型的一系列技术和实践)。”将大型模型应用于产品、工程、商业和产业,是中国创业公司成长的唯一道路。”

一旦工程问题解决了,模型的重要性反而降低了。用户在使用产品时,并不关心底层所使用的具体模型是哪个,以及自研模型所占比重的大小。用户更关注的是产品的实际效果,无论使用何种模型,只要效果好就足够了。

现在的情况是,大模型在具体应用时,还不能完全保证效果。以大语言模型为例,“胡说八道”的问题一直没有解决。“这种不可控的状态,很难让它在生产中发挥很大作用,还需要时间进行改进。对于大部分B端客户,应该关注如何跟上社区和大模型生态的发展和进化。” 陈冉说。

他认为,之前行业对大模型过于乐观,总有“训练一个大模型改变世界”这种不切实际的幻想,事实上大模型还没有真正形成生产力。在AI 1.0到AI 2.0之间,还有一个过渡的过程。“就是如何通过AI先赋能已有体系,而不是全盘否认。”

在向上攀升的过程中,必然会有一些公司因为缺乏造血能力而摔下去被淘汰。斯坦福大学以人为本人工智能研究院在一份报告中指出,2023年全球对人工智能的投资连续第二年下降。

在国内,以阿里巴巴、百度为代表的科技巨头仍在不断进行投资。例如,阿里巴巴投资了Kimi的母公司月之暗面,投资金额高达8亿美元,占股36%。市场传闻腾讯也正在洽谈跟进。

然而,对于推动原始创新和产品落地,这些大型科技公司究竟发挥了多大作用、扮演着什么角色,我们越来越难以评估。大型科技公司一方面自己开发了庞大的模型,同时又投资了市面上几乎所有的知名创业公司,通过股权绑定对手。甚至这一波被开发者称赞的API降价,也不是由大型科技公司发起,而是一个叫幻方量化的私募巨头,以及创业公司智谱AI带头,随后的大型科技公司跟进,充满了被动和营销的味道。

下半年,行业依然会非常繁忙,毕竟国内大型项目一直以来都是竞争激烈的。也许,我们能够在这个竞争中脱颖而出,推出一些非常受欢迎的应用程序。

0
分享到:
没有账号? 忘记密码?