01
剧变中的人工智能
目前,几乎所有的科技互联网巨头都无法忽视人工智能(AI)的重要性。
不久前,苹果公司给手机厂商的人工智能应用打了个样。库克一直在强调,相比于那些令人惊叹的人工智能功能,苹果更注重将用户数据和个人情境结合起来,以提升手机等终端用户的体验。
所以外界看到,尽管苹果在通用大模型的研发上被认为进展较慢于竞争对手,但这家公司展现出了出色的工程实施能力。从目前来看,至少资本是支持苹果的。
而在苹果开发者大会之前,微软、英伟达、谷歌的开发者大会无一例外,都将人工智能(AI)和大型模型放在了最重要的位置。正是凭借人工智能的红利,微软重新回到了全球市值最高的宝座,“卖水人”英伟达则已经成为全球市值第二的企业。
在国内,围绕人工智能的创新创业正如火如荼地进行着。到了2023年,人工智能赛道涌现出了10家独角兽企业,其中近一半与大模型相关。大模型已成为科技互联网巨头不可或缺的要素。同时,金融、政企、互联网、工业、娱乐、医药等各行各业的客户也在加速推动大模型在行业中的应用落地,不断探索新的场景需求。
过去两年的大规模模型热潮,推动了国内外进入人工智能领域的蓬勃发展时期。
正是在这种背景下,知名财经作家吴晓波再度与阿里云合作,推出了《云上的中国3:剧变中的AI时代》一书和相应的纪录片,全面展示了大模型的应用和未来发展。
通过对国内百家人工智能企业的实地调研和访谈,《云上的中国3》客观展现了国内人工智能大模型的现状和创新应用的方向。这本书和纪录片也在业内得到了广泛关注和讨论。
《云上的中国3》一书中,从AIGC创新企业、传统产业龙头企业、AI产业链上下游三大细分范畴中着重挑选了40余家知名企业。这些企业既有百川、智谱等大型模型厂商,也有大量正在使用大型模型服务的企业,包括汽车企业、游戏公司、互联网、电商公司以及高校客户。
我们可以看到,从符号主义到联结主义,从机器学习到大模型,人工智能的范式在过去几十年发生了巨大的演进,而大模型的能量比此前几个技术范式都要强大。
而随着技术的不断进步,应用领域也得到了蓬勃的发展。从创新企业如何开发出具有巨大影响力的人工智能应用,到在游戏、汽车、高校、工业等各个细分领域中如何将人工智能应用于真实场景,再到构建支撑这些能力的大型模型生态和工具链,本书中涵盖了大量的典型案例和深入讨论。
“在接下来的十年里,AI将成为最重要的变量,带来全行业的深刻变革。”《云上的中国3》中写道。
02
卷模型,还是卷应用?
如果说2023年是国内基础大模型的元年,那么2024年则是大模型应用的元年。相比于刚开始一窝蜂去购买大量算力卡、调整模型参数,现在大家的关注点都转向了将模型应用于实际场景和商业领域,让用户真正在生产实践中使用。
我们可以观察到越来越多的应用和场景开始将人工智能的能力融入其中,从搜索引擎到办公软件,从手机到电脑等各种终端设备,从电商到文化娱乐产业,所有这些都是因为它们认识到了人工智能的巨大价值。
“中国不需要这么多通用大模型,我们需要的是专注于特定领域的大模型。”吴晓波在《云上的中国3》走访调研期间说。
在这个剧变中的人工智能时代,基础大模型的能力在不断进化。从最初的文本生成模型、文本生成图像模型到后来的Sora文本生成视频模型,GPT-4o等多模态模型全面开花。而大模型技术架构,也从密集的Dense架构演进到稀疏的Moe架构。另外,对于开源还是闭源的技术路线也一直争论不休。
但几乎有一个共识是,未来只有少数几家公司会成为基础大模型,这些公司将是互联网科技巨头之间的竞争对象。
中国工程院外籍院士张亚勤表示,随着时间的推移,“AI大模型将只有少数10家企业扮演重要角色”。百川智能的创始人王小川则认为,“中国大模型的第一梯队将不会超过5家”。创新工场的董事长李开复预测,在经历了行业大洗牌之后,最终只有几个大赢家能够脱颖而出。
这些人工智能领域的专家们都一致认为,未来的机会主要集中在基础大模型赛道上,而这个领域基本上是大型科技公司的天下。这些公司拥有充足的人才、计算能力和数据储备。
但这并不意味着其他公司没有机会,相反,在人工智能原生应用或者特定领域的行业大型模型上有着巨大的发展潜力。
去年,阿里云就启动了“通义千问伙伴计划”,与七家顶尖生态伙伴合作,涵盖了油气、电力、交通、金融、酒旅、企服、通信等多个行业。而这些企业发现,他们对于专属大模型的合作需求非常旺盛。
而后,阿里云也一口气发布并升级了8款行业大模型。比如在专业性和准确性要求很高的金融领域,阿里云采用了多种预训练能力增强技术进行升级,并以多大模型智能体协作的技术框架深度融合实时行情、财研报、新闻政策等多维度信息,推出了智能投研助手“通义点金”,帮助用户更好地进行投资研究和决策。在医疗健康领域,阿里云基于大量医疗健康知识,整合了检索增强、多模态理解、主动问询、长期记忆等能力,推出了健康助手“通义仁心”,为用户提供全方位的健康咨询和指导。
Gartner曾提出过“技术成熟度曲线”:一项新技术诞生伊始,总会先处于不成熟的技术萌芽期,再进入资本疯狂涌入的”泡沫巅峰期”,随后,这项技术暴露出各种问题,进入”泡沫破裂低谷期”。低谷期后,技术进入触底反弹的”稳步爬升期”,最后,技术才进入”规模应用期”。
百度李彦宏和投资人朱啸虎都谈到了同一个观点,现在卷通用大模型没有意义,创业者应该去卷应用和卷场景。“AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。”李彦宏说。猎豹移动傅盛也笃定,2024年一定是AI大模型应用的浪潮年。
所以,相比于之前大家在卷基础大模型中的使用,现在大家都在卷行业大模型中进行使用,这样可以更好地帮助用户快速将模型应用到实际场景中。
而AI的应用和落地基本有两条主线:一是AI原生的应用。像通义千问、豆包、智谱清言、Kimi、腾讯元宝等App,面向C端用户提供通用的AI能力。而更多的创业者在基于细分场景做创新,比如用AIGC生成写真照的鸭妙相机,以及通过提示词来生成绘本的童语故事,都是在大模型时代的产物。
二是对原有业务和场景的AI重塑。在行业侧则是通过训练行业的垂直大模型。而陕煤建新煤矿则推出了由通义大模型支持的新型矿山重大风险识别处置系统,成为大模型在矿山场景的首次规模化落地。国家天文台人工智能组则基于通义千问开发了新一代天文大模型“星语3.0”,这是大模型首次应用于天文观测领域。
二是对原有业务和场景的AI重塑。在行业侧则是通过训练行业的垂直大模型。而陕煤建新煤矿则推出了由通义大模型支持的新型矿山重大风险识别处置系统,成为大模型在矿山场景的首次规模化落地。国家天文台人工智能组则基于通义千问开发了新一代天文大模型“星语3.0”,这是大模型首次应用于天文观测领域。
在产品侧,秉持着“所有产品都值得用大模型重做一次”的理念,大量应用和场景开始融入人工智能的能力。比如钉钉加入了AI Agent,比如智能座舱里的小助手,以前都像Siri一样,只能执行简单的指令,但现在不仅可以一次说多个指令,甚至可以跟日常对话一样,洞察你的需求。比如你说车上有点闷,AI就会问你是否打开空调。《易水寒》游戏中则将人工智能用于NPC的人物和游戏情节创建,替代美术人工。
麦肯锡此前发布过一个《生成式人工智能的经济潜力》报告,根据报告显示,生成式人工智能可以在16个不同的业务部门中的63个具体场景中应用,以解决各种业务挑战,并为企业创造2.6到4.4万亿美元的价值。
03
人工智能创业正迈向全新的大航海时代
中国互联网历史上有几次大的创业潮,第一次发生在2000年前后,以阿里巴巴、网易、新浪、腾讯等互联网公司为代表,商业模式基本属于模仿国外成功案例并在中国市场复制。
第二次是2012年之后移动互联网的兴起,诞生了众多移动互联网企业,如滴滴、美团等。这些企业的出现使得中国的创业公司与美国的创业公司基本处于同一起跑线。
而大规模的机器学习模型和人工智能技术正在推动第三波创业潮的到来。
“大模型创业,基本还是延续了互联网创业的一个基本特点——将人的行为和某些需求进行平行性的迁移。”吴晓波说,“2024年每个人都要去思考人工智能给你带来的变化,以及需要了解它未来的一种可能性,因为它到的比我们想象得快很多。”
这也是《云上的中国3》的雄心所在——走遍100家人工智能公司,用一部纪录片和一本图书作为记录,探索中国人工智能创业的方方面面。
事实上,已经开始有创业者从应用中获得了巨大的利润。妙鸭相机是国内AIGC历史上第一个真正意义上的热门应用,在高峰期一度有超过一万人排队付费,服务器一度被挤爆。
而一位业内人士告诉数智前线,他们的一个伙伴在大模型推出后短短一个月时间,就发布了数十款轻量级应用,一个月赚了几百万元。
而一位业内人士告诉数智前线,他们的一个伙伴在大模型推出后短短一个月时间,就发布了数十款轻量级应用,一个月赚了几百万元。这个数字非常惊人,显示出该伙伴的应用在市场上取得了巨大的成功,并且获得了丰厚的利润。
但现在创业者面临的问题,从来都是与时间的赛跑。当一个新的工具诞生以后,创业者需要思考如何充分利用这个工具,如何迅速行动。
对于许多创业者来说,大型模型的成本一直是应用落地的一个重要障碍。ChatGPT刚刚发布时,每次训练的成本高达数千万美元,而现在的ChatGPT-3.5的API价格为每百万个Token只需2美元。经过多次降价,GPT4的输入价格已经从每百万个Tokens的30美元下降到了5美元;输出价格也从每百万个Tokens的60美元下降到了15美元。
在国内,大型模型的价格下降幅度更加激烈,阿里通义千问、百度文心一言、字节豆包、腾讯混元几乎在同一时间集体大幅降价。其中,与GPT-4相媲美的长文本模型Qwen-long的API价格下降了97%,降至每百万Token仅需0.5元,相当于GPT-4价格的1/100,是全球最低的价格。
每一个新技术的广泛应用都意味着需要实现成本的大幅度降低。如今,大型模型的普及正在显著降低创业的门槛。
阿里云智能集团资深副总裁、公共云事业部总裁刘伟光说:“AI推理成本只有每年有十倍甚至百倍的降低,才能真正推动各行各业的AI应用的爆发。”
有了云计算和弹性资源的支撑,创业者不需要过多关注底层的基础设施,只需要将更多精力放在应用开发和优化上,实现快速迭代和试错。
童语故事创始人张华通过调用大模型,利用先进的技术来快速生成绘本内容,然后使用文本内容调用通义万相或Stable Diffusion生成相应的配图。通常情况下,生成绘本的时间在1-3分钟左右,满足了家长为孩子定制个性化绘本故事的需求。
张华算过一笔账,4个月时间,产品迭代了20多个版本。而童语故事一切的IT消耗和服务都在阿里云上,但平均每个月的IT成本才1万元左右。“有了大模型、云计算这些成熟的技术,才能让我们实现低成本高效创业。”
降价背后得益于公共云的技术红利和规模效应,带来巨大的成本和性能优势。在同样的模型服务中,在公共云上的调用价格也远远低于私有化部署。
除了成本降低,人工智能也带来了创业门槛的降低。
张华本人没有技术背景,不具备编程能力,但在得到大型模型厂商的支持后,他只需要专注于优化前端场景,挖掘用户需求。大厂提供了快速训练行业大型模型和实现应用的工具。
妙鸭相机是国内人工智能图像处理技术历史上第一个真正意义上的爆款应用。短时间内涌入了大量的需求,而阿里云帮助鸭妙在一两周时间调集了成千上万张显卡,没有云这一弹性的基础设施支撑,很难想象如何满足这一需求。
云厂商在尽可能地让这一切都变得简单易用。比如阿里云发布的百炼大模型平台,开发者可通过“拖拉拽”5分钟开发一款大模型应用,几小时“炼”出一个专属模型,把精力专注于应用创新。魔搭社区作为国内最大的AI模型社区,通过开源的方式,已聚集了270万开发者,2300个优质模型,模型下载量超过1亿。
云厂商在尽可能地让这一切都变得简单易用。比如阿里云发布的百炼大模型平台,开发者可以通过“拖拉拽”的方式在5分钟内开发一款大模型应用,只需几小时就能“炼”出一个专属模型,从而将精力集中在应用创新上。魔搭社区作为国内最大的AI模型社区,通过开源的方式,已经聚集了270万开发者和2300个优质模型,模型下载量超过1亿次。
而大规模模型的需求反过来也成了当前云市场最大的增长点,人工智能与云计算的浪潮在此得以交汇。
在中世纪的大航海时代,欧洲人最初的目标是前往亚洲,然而他们却意外地发现了美洲大陆。航海家们在出发前并不能预知前方会发生什么,但正是出于好奇心的驱使,他们勇往直前,一步步地探索未知的领域,最终意外地抵达了新大陆。
AI时代也是如此,尽管AI大潮已经是确定性的时代机遇,但具体到微观层面的实操,也是一个摸着石头过河的过程。人们或许无法预知五年后会怎样,但吴晓波有一句话说得很贴切:躬逢其盛,心怀恐惧。