百度,一家在个人电脑时代崭露头角的科技巨头,面临了在移动互联网时代的挑战和竞争,似乎未能完全抓住时代的机遇,相比于其他科技公司在这一阶段的快速发展,百度显得有些落后。
随着时间的推移,随着人工智能(AI)时代的到来,百度希望能够借此机会弥补过去在移动互联网时代失去的市场份额,重新确立自己在技术领域的领导地位。
在刚刚结束的百度最新财报会上,公司透露了人工智能(AI)业务的最新进展:
·AI云服务的营收同比增长了12%;
·百度搜索11%的内容是由人工智能生成的;
·大模型API调用量激增:近五个月,从5000万次增长至2亿次;
·AI模型性能大幅优化:训练效率提高到5.1倍,推理成本降低到百分之一;
百度董事长兼首席执行官李彦宏在电话会中表示,公司正在从以互联网为中心转向以人工智能为核心,加快推进用文心大模型重构面向消费者和企业的业务。目前,文心大模型每天处理的文本数量约为2500亿个Tokens,每天的调用量达到2亿次。
李彦宏特别强调:搜索引擎在人工智能时代有着巨大的潜力,有可能成为最具影响力的应用程序(killer app)。而百度搜索在人工智能重构方面的工作目前还处于早期阶段。
此外,百度首席财务官(CFO)罗戎表示,在接下来的几个季度,百度将继续积极支持人工智能(AI)业务的高质量增长。公司认为,随着中国生成式人工智能进入新的时代,将为百度带来更多的机遇。
01
“All in AI”——百度的新机遇?
为了实现李彦宏“以互联网为中心转向人工智能优先”这一目标,百度正大力投资于人工智能技术的研发和应用,特别是在自动驾驶、深度学习、自然语言处理等领域。
百度正在努力夺回在移动互联网时代失去的市场份额。
·在PC时代,凭借着独特的搜索引擎技术,百度成为了国内最主要的搜索引擎。
·在移动互联网时代,随着用户流量从PC端转移到移动端,公司虽然在多个方面进行布局,但相对于腾讯和阿里巴巴仍然显得不够强势;
·在推荐算法时代,又大幅落后于字节信息去中心化模式;
在推荐算法的时代,它的发展速度明显落后于字节信息去中心化模式。·随着进入人工智能时代,百度凭借其在人工智能领域的丰富经验和技术积累,希望能够在这个浪潮中取得突破;
人工智能(AI)的表现在财务报告中逐渐显著,今年第一季度智能云业务的收入达到47亿元,同比增长12%,其中来自生成式人工智能和基础模型的收入占智能云业务收入的6.9%。
02
AI云服务,从芯片到平台
2016年,百度首席执行官李彦宏提出了“人工智能+云计算+大数据”的云服务战略。
此后,百度智能云构建了“芯片—框架—模型—MaaS平台”的全栈式人工智能基础设施,这一基础设施支持从数据存储到模型训练、部署、运行的全链路人工智能服务。
值得一提的是,百度飞桨平台已经兼容了50多种不同芯片,其中许多是由国内设计的芯片,开发者社区的规模已经增长至1300万人。
这种人工智能基础设施布局模式,也让百度在受制于外部环境情况下,更好地满足国内人工智能云的需求。李彦宏认为,这种模式使得百度能够将不太先进的芯片用于高效的模型训练和推理。
李彦宏在电话会中称,百度将来自不同供应商的图形处理器(GPU)整合到一个统一的计算集群中,用于训练大型语言模型。他表示:“我们的平台在GPU集群上展示了非常高的效率,该集群由成百上千的GPU组成,这是在进口GPU受到限制的背景下取得的重要突破。”
1)自主研发芯片,即公司通过自己的技术力量和研发团队,独立完成芯片的设计、开发和生产。
公司自主研发了人工智能芯片(昆仑)和语音交互芯片(鸿鹄),用于改进语音识别、自然语言处理、图像处理等人工智能技术,并支持公司的深度学习框架。
芯片最新进展:暂无信息
·AI芯片:经过迭代升级,昆仑2相较于昆仑1代性能提升了2-3倍,提供了128TFLOPS的算力和512GB/s的内存带宽;
·语音交互芯片:经过升级,最新一代的鸿鹄900芯片在CPU性能上提升了200%,在GPU性能上提升了160%,该芯片被应用于华为智慧屏V5 Pro。
2)深度学习框架 —— Paddle Paddle
Paddle Paddle是一种深度学习框架,它提供了丰富的工具和库,用于开发和训练深度神经网络模型。Paddle Paddle具有高度灵活性和可扩展性,可以应用于各种不同的深度学习任务,包括图像识别、自然语言处理和推荐系统等。它的设计目标是使深度学习的开发过程更加简单和高效,同时提供高性能的计算能力,以加速模型的训练和推理过程。Paddle Paddle还支持分布式训练和部署,可以在多个计算节点上进行并行计算,以提高训练速度和模型的性能。总之,Paddle Paddle是一种功能强大的深度学习框架,可以帮助开发者快速构建和训练复杂的深度神经网络模型。Paddle Paddle是百度基于BERT自研的深度学习框架,它是一个全面的深度学习平台,包括了深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件。
该框架服务企业遍布能源、金融、工业、医疗、农业等多个行业。例如,连心医疗基于PaddlePaddle平台开发的“基于CT影像的肺炎筛查与病情预评估AI系统”已在湖南郴州湘南学院附属医院投入使用。
Paddle Paddle采用了开源的形式,使得百度能够更好地建立自己的人工智能生态圈。
根据公司公开披露的信息:
·截至 2024 年 4 月中旬,PaddlePaddle 开发者社区已经拥有了一千三百万名成员;
·截至2023年底,PaddlePaddle已经为23.5万家企业提供了服务,帮助他们进行开发和应用。同时,PaddlePaddle的开发社区已经创建了86万个模型,为用户提供了丰富的模型选择。
此外,数据显示,Paddle Paddle 在 Github 上的使用人数、贡献者人数和技术迭代速度方面,仅次于海外一线平台 Pytorch 和TensorFlow。
3)AI大模型 —— 文心系列模型(Ernie)
AI大模型 —— 文心系列模型(Ernie)是一种强大的人工智能模型,它具有广泛的应用领域和能力。它采用了先进的技术和算法,可以处理各种复杂的自然语言任务,如文本分类、情感分析、机器翻译等。Ernie模型在自然语言处理领域具有很高的准确性和效率,被广泛应用于各种人工智能应用中。它的出现极大地推动了人工智能技术的发展和应用。基于强大的基础模型(Paddle Paddle),百度研发了文心系列模型Ernie(有趣小故事:文心一言的英文名为“Ernie”, 源于美国儿童节目《芝麻街》中的角色的名字,而节目中Ernie的好朋友正是Bert,Bert是谷歌2018年发布的AI模型)。
目前迭代至文心 4.0,参数规模可能超过1万亿,大约是文心 3.5 的4-5倍。
根据公司披露,截至今年4月,百度文心模型每天处理的API调用量约为2亿次,较去年12月的约5000万次调用大幅增加,显示出越来越多的人正在采用百度文心模型,并预示着未来模型推理具备强劲的收入潜力。
此外,为了让模型更具性价比,公司通过独有的四层人工智能架构和强大的端到端优化能力,不断提高模型的效率。与 3 月 23 日的版本相比,文心模型的训练效率提高到 5.1 倍,推理成本降低到百分之一。
4)MaaS(人工智能开发云平台)
为了让开发者更简单的开发AI模型,百度在云平台上提供了三套工具:
·AppBuilder 和 ModelBuilder:提供给企业和个人开发者用于开发应用程序和构建模型的工具;
·AgentBuilder:可以轻松创建一个人工智能代理;
在盈利方面,百度从2022年开始将业务重点放在提升AI智能云业务的利润率上。百度废除了低质量业务,并且致力于为不同行业的客户提供定制化的标准化AI解决方案。
在24Q1的业绩会上,公司表示,智能云收入的增长主要是由生成式人工智能和模型训练所驱动的。目前,公司的大部分收入来自于模型训练,但是来自于模型推理的收入增长速度非常快。
展望未来,百度认为模型推理技术是最重要的长期机遇之一,也是未来人工智能云收入的主要增长动力。
03
“AI+”业务赋能
AI技术与各行业业务的结合,为企业赋予更强大的能力。人工智能技术在百度内部被广泛应用于搜索引擎、信息流推荐、百度翻译等多个领域。
在电话会议中,百度的创始人李彦宏对未来人工智能赋能搜索支柱业务表达了更加坚定的信心。他认为,在人工智能时代,搜索有可能成为最具杀手级应用潜力的产品。他说:“通过人工智能技术,搜索能够让用户实现以前无法实现的事情,而且百度目前还没有计划对这部分功能收费。”
去年第二季度开始,百度就已经开始使用文心一言来重新构建百度搜索。现在,我们可以看到越来越多的搜索结果是由文心一言以不同的格式,例如文本、图像、第三方链接等组合而成的。
在模型构建上,百度采用了三种轻量级模型和两种专门针对特定任务的模型,并结合专家混合模型,以便为大型模型分配任务,从而在性能和成本之间找到更好的平衡。
从数据上看,人工智能(AI)确实正在提升百度各个业务的效率:
1)AI+百度搜索:截至2024年第一季度,百度搜索中约有11%的内容是由人工智能生成的,同时,人工智能搜索技术也促进了广告收入的增长;
2)AI+百度文库:通过引入生成式AI功能,吸引了18%的新付费用户。这些功能包括内容总结、创作、扩展以及将灵感一键转化为Powerpoint等。24Q1 百度文库付费用户数量实现了两位数的同比增长。
3)AI+百度地图:通过引入了“AI向导”功能,百度地图能够在理解用户需求的基础上,智能地调用众多地图功能及服务,以便快速准确地给出解决方案;
4)AI+百度网盘:推出了基于文心大模型的智能助理“云一朵”,帮助用户实现一句话快速搜索文件和视频、总结知识、翻译文档、甚至进行内容创作的功能。截至2023年第三季度,“云一朵”的用户已达到2000万。
04
终端厂商与人工智能手机/人工智能电脑的合作
人工智能(AI)除了在内部提升效率,百度在本季度还进一步扩大了对外合作。
根据公司披露,上季度,公司已与三星中国、荣耀等手机厂商达成合作。本季度,合作扩展到更多领先智能手机厂商,包括Oppo、VIVO和小米。
百度的业务范围不仅限于智能手机,还扩展到了PC和电动汽车领域,这进一步扩大了百度的AI生态圈。联想正在利用Ernie API为其默认浏览器中的AI助手提供支持,而蔚来汽车则开始使用Ernie API来增强车内体验。
此外,公司吸引了许多新客户,包括携程、高途、招聘、作业帮和新加坡旅游局,通过人工智能(AI)技术,帮助他们重新设计和改进所有面向消费者的产品,以提供更加优质的用户体验。
05
对外投资
除了自主研发,百度还通过对外投资来不断扩展自家的AI生态,涵盖了芯片-模型-模型应用三个重要环节。然而,与阿里巴巴不同,百度的对外投资更加注重覆盖上游和下游两个端口。
这个原因也不难理解,因为百度未来将依靠搜索这类应用端支撑收入,完成商业模式闭环的。
这个原因也不难理解,因为百度未来将依靠搜索这类应用端来支撑收入,从而实现商业模式的闭环。最有代表性的一个证明来自李彦宏对大模型开源还是闭源的判断:“大模型开源意义不大,闭源才能走通商业模式,是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才。”
“闭源在成本上反而是有优势的,只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定更快”,这也是与阿里云不同的商业模式的思考。
“闭源在成本上反而是有优势的,因为闭源模型的推理成本较低,响应速度更快。这也是与阿里云不同的商业模式的思考。”所以,根据百度的思路,可以看出未来的发展方向已经相对明确,但是在人工智能时代,竞争将会比个人电脑时代更加激烈。