人工智能(AI)在过去的一年中风靡全球,带来了许多市场机会。然而,最大的市场机会并不在于大型模型本身。
2023年,投身人工智能领域的参与者众多,“群雄争霸”的情况下,玩家可以大致分为几类。
在大模型时代,单纯制作模型是一种不明智的选择。这种做法的目的是通过技术实力来打开市场的大门,过于关注模型的能力和参数,强行与技术前沿进行对比,追求最强大的模型。
这类现象在去年上半年最为热门,ChatGPT掀起的热潮也引起了很多人的关注,但实际实施下来,我们发现要实现技术突破,还是离不开大型模型的 Scaling Law,需要不断投入大量资源,而且技术差距也不是一时可以弥补的;产品缺乏创新,很难满足市场需求,因此也难以维持高昂的算力和人员支出。
而随着资本市场逐渐降温,去年,这一群人已经有相当一部分人,倒在了理想主义的门槛前,失败于不断重复创造轮子所带来的生产力浪费。
而中策,是同时注重模型和产品的发展,通过强大的模型能力来推动AI产品的开发,以实现人工智能在实际应用中的落地和创造价值。
曾有人说,大模型当下的市场思路,就像是把一颗上好的松露放进油纸袋子里包好,然后摆在顾客面前——无论松露的品质再好,如果顾客不知道如何品尝,也不知道如何搭配食材,那么就无法真正体验到松露的美味。
而有经验的厨师,会将松露与牛排、鳕鱼、鹿肉等本就鲜美的食材搭配在一起,充分展现松露的独特优点,将那些“传统”的菜式进行重新创作。
要制造出人工智能的杀手级应用,也是一个道理:让人工智能发挥长处,用智能重新为原有的场景赋能。如果能找到这样一个恰到好处的结合点,很容易就能打造出下一个字节跳动和拼多多这样规模的公司。
而归根结底以上两点,终归不是上策。更大的格局,是利用一个更庞大的体系,将无数的“杀手级应用”纳入自己的下游,以技术推动产业和世界的变革,在时代齿轮的扭矩中挖掘一个数十年难得的机会——
一个用人工智能操作系统改变世界的绝佳机遇。
一、人机交互每变革一次,就诞生一个万亿美元规模的机会在过去一年间,与许多人工智能行业的专家进行交流的过程中,AI 科技评论总能听到一个共同的观点:
人机交互,才是让一家超级科技公司诞生的“金钥匙”。4月16号在深圳举办的百度 2024 Create AI 大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖,分享了一个有趣的故事:
从最早期,人类与计算机的交互靠的还是布线板,工人手动插拔电缆、转动旋钮,人机交互甚至是一项需要体力的工作;
而随着汇编语言的发展和汇编器、高级编程语言以及编译器的出现,人类才能够通过一种类似于交流的方式与计算机进行沟通和交流。
时间轴再次推进,很快,单机算力再难面对正急速增长的市场需求,云计算应运而生,人类也不再满足同时与一台机器“对话”,而是要按需与多台机器形成的“集群”协作,把人机交互又推上了一个更高的等级;
而到了今天,人工智能(AI)大模型的出现,再次给人机交互带来了新的机会——以编程为例,程序员不必再从语言学起,直接使用自然语言,在人工智能的帮助下,就能实现自己想要的功能;
也是如此,编程也就不再是人类与计算机“斗智斗勇”,而变成了人对人工智能“许愿”。
在人工智能慷慨的帮助下,“每个人都有机会成为开发者”的愿景已经不远。
回顾这个过程,就像是农民在春季翻开土壤一样,无数的生命力因此涌现出来。每一次人机交互方式的新革命,都带来了科技行业万亿美元规模的机遇。
抓住了这个机会,苹果公司成功推出了第一台个人电脑,随后又在移动互联网时代引领了潮流;微软公司创造了第一个可视化的操作系统,并通过办公软件奠定了现代办公流程的基础;而在云业务的推动下,亚马逊公司在过去的20年里股价狂涨近300倍,从一家电商平台起家,成为了当今头部科技公司之一……
仔细观察,人们会发现:这些市值达到万亿美元的科技公司的出现,都离不开他们在技术革新的浪潮中,抓住了一个能够改变人与机器交互方式的机会。
开头提到,当前大规模模型的发展势头非常强劲。如果仅仅将人工智能视为一种技术或产品,那么人工智能的真正潜力仍然没有完全被发掘。
相反,只有将人工智能的能力和矩阵集成为一个操作系统,用于管理硬件资源和软件服务的运行池,提供对外的服务接口,并通过这种方式为人机交互带来新的变化,才有可能利用这个价值万亿美元的机会。
而要做这样一个操作系统,在人机交互的竞争中获得胜利,又谈何容易?
二、做 AI 操作系统,高性能异构计算是“硬门槛”“大模型不是免费的午餐。”在大会上,沈抖如此讲道。想要让人工智能操作系统能够正常运行,算力是一个永远无法忽视的问题。
去年年初,在一众分析师的论断中,算力并不是一个关键因素:毕竟算力是一个“金钱游戏”,只要资金充足,能够购买足够多的显卡,这个问题也就自然迎刃而解。
然而一年过去,越来越多的人这才发现,当模型参数数量不断增加,超过了以往的规模,”金钱游戏”所需的资金也在不断增加,超出了大多数公司的负担能力。
如此,算力问题,单靠“投入大量资金”也就再难得出一个令人信服的答案。
连人工智能领域的顶尖公司OpenAI的首席执行官山姆·奥特曼都多次公开表达了对手头算力不足的不满。可以说,目前来看,算力问题正在严重限制着人工智能的发展速度。
大规模计算模型也需要降低成本并提高效率,减少计算资源的浪费是一个重要的方法。
如何让万卡集群实现像一张卡一样的“协同合作”,使性能能够按比例扩展,任务之间没有间断,这对于AI操作系统的算力集群的设计、调度和容错提出了巨大的挑战。
而新近推出了 AI 操作系统“万源”的百度,正通过万卡集群上的有效训练时长占比超过了98.8%,线性加速比和带宽有效性都达到了95%的“尖子生”成绩,让业界看到了新希望。
而最近推出了AI操作系统“万源”的百度,通过在万卡集群上进行有效训练的时间比例超过了98.8%,线性加速比和带宽有效性都达到了95%的“尖子生”水平,这让业界看到了新的希望。(百度智能云发布了一款名为万源的全新智能计算操作系统)
而仅解决算力浪费问题,似乎还并不足以一劳永逸地完成大模型的“降本增效”——在国内,“禁运”带来的影响还在持续,要凑齐运载大模型所需的万卡算力,使用多种性能不同的芯片异构计算,几乎成了一个必选项。
而仅解决算力浪费问题,似乎还并不足以永久地完成大模型的“降低成本、提高效率”的目标——在国内,“禁运”带来的影响仍在持续,为了满足运行大模型所需的万卡算力,几乎必须采用多种性能不同的芯片异构计算。异构计算,让来自不同厂家、不同代际、不同性能的芯片能够相互连接和通信,是一个极具挑战性的问题。
过去的通识是,异构计算只能用不同的芯片解决不同的任务;要把不同型号的芯片,放进同一个任务里——尤其是训练任务——几乎是不可想象的。
要迎难而上,解决异构计算的效率问题,就不得不需要一点“黑科技”。
而要做 AI 操作系统,百度在算力层的底气,就是他们已经解决了这个“不可能”的难题,屏蔽掉了不同芯片之间的差异,更是给了用户选择芯片组合的自由权。
在百度的异构计算平台“百舸”上,多家厂商的上万张芯片相互协作,以完成单一训练任务。在这个平台上,百卡的性能损失仅为3%,而千卡的性能损失不超过5%。通过采用先进的技术,成功提高了异构算力协作的效率。
也正是如此,百度成功解决了芯片的“卡脖子”难题:不仅可以摆脱对单一芯片的依赖,创建一条更具弹性的供应链,从而将风险降到最低;同时还可以实现更加可控的成本。
百度的解决方案,一是将底层通信和上层算子的优化和实现拆分开,让专业的人做专业的事,自己专门负责底层加速库 AIAK 的开发,给异构计算搭好一个“大舞台”,让各家芯片来到百度的集合通讯库都可以顺利运行;
二是在加速库里做好并行框架的实现,优化并行策略,通过自适应算法自动实现张量模型并行(TP)、模型并行(MP)、流水线并行(PP)不同的并行策略的参数设定,迅速拿准并行化策略,处置训练任务的底层设置。
三是在卡间通信上,整合网络协议,GPU层面上主要通过 NVLink,而当算力走出机器,百度主要使用的还是 RDMA,对于一些特殊的芯片,百度也有一些相当具体的实现策略。
三是在卡间通信上,百度通过整合网络协议,采用了GPU层面上的主要通信方式NVLink。当算力走出机器时,百度主要使用RDMA进行通信。对于一些特殊的芯片,百度也有一些具体的实现策略。既然短期内多款芯片并存是现实局面,那么与其抱怨不如积极接受。百度通过推出“百舸”计划,旨在积极拥抱多样化的芯片生态,力求在异构计算领域取得最佳效果。
脱离了“云”的硬件,人工智能操作系统的实现也就成了“空中楼阁”——而将云计算与人工智能相结合,通过协同优化软硬件,已经逐渐成为许多实力强大的公司的共识。
而要让一万张卡同时运行在同一个任务中,就像是组成了一个由多家芯片组成的“多国部队”,对于任何公司来说,都是一个难以逾越的巨大挑战。
今天的百度,已经在技术发展上取得了重大突破,实现了一条路一云多芯、单任务多芯片的异构架构。
(业界领先的单一任务一云多芯大模型训练解决方案)
而其他玩家想要完全掌握这一套体系,进而在这一套体系上构建全新的 AI 操作系统,在 AI 和云计算领域多年的经验和实践则必不可少。
三、工具链,“低成本”有“高难度”如果将计算能力视为AI操作系统的“核心”,那么工具链就是连接开发者和AI的“中间层”。
总的来说,无论算力和大模型有多强大,如果使用者无法熟练地操作,就无法充分利用大模型的优势,这样就无法将人工智能的能力发挥到极致。因此,人工智能的操作系统只是空洞的口号。
到了这一层,AI 操作系统面临的挑战不仅仅是技术上的难题。需要解决的问题还包括如何深入理解广阔的市场需求和复杂多样的应用场景。
一方面,面对不同预算和需求的用户,人工智能操作系统必须具备足够的灵活性,以提供多种能够最高效解决问题的方案。
尽管去年以来,市场对大型模型原生应用的需求正不断地提升,但在使用中,“性能、速度、价格”的“不可能三角”,也让不少人望而却步——
如果只使用一个模型,当参数规模较小时,无法解决问题,而当参数规模较大时,很难在成本和满足高并发需求之间取得平衡。
这也就要求 AI 操作系统的提供方,不能一味抱持着一以贯之的思路,面对不同的场景,要提供不同规格的基座模型选择,不让用户在操作系统里花冤枉钱。
以百度为例,在已经获得了广泛认可的文心 4.0 基础上,千帆团队又开发出了ERNIE Speed、Lite、Tiny三个不同规模的轻量化模型,以满足不同用户对大型模型的不同需求。
而在 ModelBuilder 提供的模型路由服务之下,针对不同难度的任务,AI 操作系统万源也可以自主选择最合适的模型完成调用,实现效价比的最优,在效果基本持平的情况下,将推理成本下降了30%。
AI 操作系统万源可以根据不同任务的难度自主选择最适合的模型进行调用,从而实现最优的效价比。在效果基本相当的情况下,这种方法可以将推理成本降低30%。而在自有模型之外,千帆也支持 LLaMA、Baichuan 等等第三方的模型产品,主打一个“客户想要什么,我们就提供什么。”
一方面,大模型让人机交互方式走向更加接近自然语言的方式,背后也需要一整套的人工智能能力和工具的支持。
一个更先进的人工智能操作系统,旨在让用户能够更加轻松和简便地开发应用程序。用户甚至只需输入一小段对应用功能的描述,而无需编写任何代码,就能够获得一个能够实际解决自己需求的应用。
在百度的万源体系下,内置的 AppBuilder、AgentBuilder 两个应用开发平台,不仅已经让上述的想象变成了现实,而且两个平台的软件开发工具包(SDK)也支持二次开发,让开发者能够满足更加细致入微的个性化需求。
此外,使用百度 AppBuilder 开发的应用程序,可以轻松地发布到百度搜索、微信公众号等平台,使应用的分发变得更加简单;还可以通过 API 或 SDK 的方式将应用程序集成到自己的系统中。
另一方面,众多复杂多样的场景,使得模型的精细调整和完善的工具组件体系成为了必要。
在百度万源中,支持开发的工具组件数,已经从上次的11个高速增长到了54个。其中包括大模型的组件、AI能力的组件、插件工具以及数字人的组件等等,种类多样且数量众多。此外,还支持一次鉴权全部接入,省去了许多繁琐的手续。
就像搭积木一样,用户可以选择不同的组件进行组合,将它们拼装在一起,从而创建一个工作流。这个工作流可以根据用户的需求进行定制,形成一个符合自己使用需求的大模型。
一个人如果长年从事企业对企业(To B)生意,大多都会发现,To B 的底层逻辑总是“朴实无华”:如何用最少的资金,实现最大的成果。
“简单是最终的复杂。”沈抖用这句话开始了自己在 Create AI 开发者大会上的演讲,他的意思是要减轻开发者的负担,为用户提供极为简单的开发体验。
目前,百度整个大模型平台的服务客户数量在一个多月内又增加了1万,已经超过了8.5万。通过千帆精调的模型数量也增加到了1.4万,而开发的应用数量现在已经超过了19万。
百度的 AI 操作系统体系已经吸引了大量用户,这得益于便宜易用的工具链。现在,百度需要思考如何进一步发展生态系统,这成为了他们的下一个重要任务。
四、做生态,要“譬如北辰”操作系统的成功,绝不只是在技术层面上取得的成功。
十几年过去了,智能手机刚刚问世,市场上不仅仅有安卓和IOS两大操作系统,还有塞班、黑莓、Windows等等许多操作系统竞相争夺市场份额。然而,在激烈的竞争中,只有安卓脱颖而出,最终取得了胜利。
究其本质,还是开发者占据主导地位。
而得到了开发者,如何将开发者留在操作系统中?如何帮助开发者与用户建立联系?如何实现盈利?这也是对AI操作系统开发者在市场领域能力和资源的考验。
在人工智能时代,从市场的角度来看,对于“客户”和“伙伴”的概念,由于开发门槛的进一步降低,变得更加模糊。对于人工智能操作系统的开发者生态,有两个关键点,一个是吸引他们加入,另一个是让他们留下来。
引进来,靠的是直接的激励,以及加入平台的便捷程度。这就要求 AI 操作系统足够开放,也能投入足够的成本用于激励,开办开发者大赛,吸引更多人加入进 AI 原生应用开发的行伍。
在争夺开发者的大战中,人工智能(AI)操作系统的先发优势显然更加明显——一方面是能够首先获得一个更大的开发者群体,并且让他们更早在平台上完成产品,获得收益;另一方面是触达人工智能原生应用的B、C端用户更早,也能更早让开发者形成粘性,留在人工智能操作系统上。
而提到先发优势,就又不得不提到百度。无论在大规模模型技术、大规模模型生态,还是 AI 操作系统上,百度都是国内一众跟进者的领头羊。
在千帆的应用商店上,已经有300个人工智能原生应用上架,而第一批上线的应用已经开始获得分润。
而要让人留下来,就得让开发者能够在平台上持续地获得商业收入和正反馈,最终实现用人工智能操作系统的“发家致富”——这才是人工智能操作系统能够提供给开发者的核心价值。
比如,在千帆平台上卖的最好的产品是一个名为ChatPPT的演示文档助手。这款助手以其亲民的价格和出色的功能而备受欢迎,售价大约在百元左右。迄今为止,已经成功售出了上千份。
而有一家公司,仅仅在一个月的时间内,就在千帆发表了超过20款应用程序,涵盖了背诵古诗、写作文、市场营销、绘图等多个领域。这家公司在短短一个月内的净利润达到了数百万。
如果简单的工作就能带来可观的收入,开发者为什么会不愿意继续留在这个平台上呢?
尽管已经取得了令人满意的成绩,但要改变用户的使用习惯,毕竟仍然是一项具有挑战性的任务。
一方面让开发者看到人工智能的价值,另一方面也要实际地给开发者带来生产力的提升和经济上的收益。
而万源的生态体系还不仅如此:
对上,万源链接开发者,通过不断更新的能力和接口,让人工智能原生应用蓬勃发展;
对下,万源链接芯片厂商,致力于扩大芯片适配的队伍,以便为开发者提供更简便易用的异构算力;
向左,万源可以链接企业用户,让他们可以基于万源个性打造自己的人工智能操作系统;
向右,万源则链接智算中心,将更高效的计算方案推广给更多的用户。
这条路,就像《论语》中所说的“就像北辰一样,它在自己的位置上,而其他众多的星星围绕着它。”我们要以更好的生态方式,将产业链中的每个环节都围绕在AI操作系统的周围,从而创造一个以AI为核心的更广阔的生态系统。
结语:1+1>2在AI时代,要打造一个完整的操作系统,需要有技术、产品和市场三者的完美结合。
作为中国第一个提出人工智能操作系统概念的大厂,百度的万源看起来似乎并不是一个全新的技术、新产品,而更像是当下百度智能云技术产品体系的又一次整合。
有人或许会问:这只不过又是一个新概念,拼拼凑凑算什么操作系统?要说 AI OS,集成了 New Bing 和Copilot 的 Windows 才算是真正的人工智能操作系统。
而事实上,万源的提出,很可能是百度在2024年最令人激动的新动向:将诸多技术产品在操作系统上融合一起,正很好地向外界展现了百度作为一家人工智能大厂,在人工智能领域上“舍我其谁”的野心。
而之所以没有选择Windows操作系统的形态,而选择了面向企业市场(To B),百度万源的竞争对手反而是微软的Azure云服务,这样可以专注于自己擅长的领域,寻找更接近盈利的领域。
去年,许多人热议人工通用智能(AGI),憧憬着未来人工智能将如同科幻小说中所描绘的那样,彻底改变世界。
而仍有许多人,以一种“枯燥”的方式,不断提升技术和产品的质量,深入研究各个行业和场景,专注于解决最实际的问题——他们渴望改变世界,而且他们希望能够在当下逐渐实现这个目标。
操作系统,是科技界在人机交互上的又一次重大机遇。而要抓住这个机遇,就必须建立一个完整的体系,以实现规模效应,使得整体效果超过各个部分的简单相加。
在未来,利用人工智能操作系统为企业提供全方位的面向企业的服务,以解决用户的各种问题,将成为优秀人工智能公司的主要发展方向,也是云计算巨头转型的必然趋势。
其他云服务提供商要加入这场竞争,不仅需要拥有高质量的大型模型来提供支持,还需要具备丰富的云技术和场景积累,能够提供完整的“模型-开发-市场”支持链路。就像一个水桶一样,不能有任何短板。
将万源 AI 操作系统视为一片富饶的土地,在其上孕育出的应用程序,无论是由百度开发还是其他开发者开发,都能以各种形式进入B端和C端的多个场景,从而推动公司在云领域的收入增长。
从这个角度来看,可以说万源是百度智能云最重要的支持者。
“我们最终的成功,”百度集团副总裁侯震宇在接受采访时说道,“就是希望我们的 ModelBulider 能够构建更多的模型,我们的 AppBulider 能够生成更多的应用,这就是我们最大的理想。”