深耕科技的早期投资机构蓝驰创投近期将AGI投资观迭代至2.0版本。一些比较亮眼的观点有:未来,软件公司或将消失,通用人工智能将催生出一大波价值十亿美元的初创公司。而且,开源模型的优势也将逐渐减弱,模型应用需要综合考虑多方面因素,还有……
去年上半年,蓝驰创投推出《通向人工通用智能之路》栏目,多篇连载推演了通向人工通用智能时代的可能样态,也提出了蓝驰的人工智能投资观——
人工智能+全新的交互界面+机器人技术的三重融合,将引发全新的时代浪潮。
截至目前,蓝驰创投已经在这个方向上进行了全面的布局:
在过去的一年里,蓝驰创投与一些非常优秀的创业者一起努力探索和塑造了GenAI的形象,他们在创业的前线亲身经历了激烈的竞争和挑战。正是通过这些经历,蓝驰创投的AI投资理念也在不断演变和完善。
GenAI仍在不断加速进化中,战事尚未行至中场,蓝驰创投希望在此刻与创业者分享这些思考,激发更多讨论、加速进化。
开源优势不会更大:大模型不会被一统天下,既做模型又做应用有何不同
关于开源/闭源、做模型还是做应用,过去一段时间有许多讨论。蓝驰创投有以下判断:
首先,模型的可行性在于其能够被有效地应用,因此基于开源模型进行小型化和垂直化是不可避免的趋势。
但对于那些人工通用智能(AGI)的关键领域,比如逻辑推理能力、多模态和视频生成模型,未来可能会继续保持闭源的趋势。即便是开源,最关键的「How」——模型如何训练、关键参数的设置等,也不会被公开,后来者无法复制。
从长远来看,能够实现人工通用智能(AGI)的通用模型将非常有限,但是基于不同行业场景的专用模型将会有很多种类。同时,由于文化差异、地缘政治等原因,不同国家可能会开发出各自的大型模型。
如果不及时投入资金或资源,可能在激烈的竞争中会落后于其他竞争对手。
来源:「Open-source LLMs vs closed-source LLMs: An enterprise perspective」
其次,大模型和很多人常用来类比的操作系统,其实在本质上是不同的。
操作系统本质上是一种软件技术,它是计算机系统中的核心组件,负责管理和协调计算机硬件和软件资源的使用。对于大型计算模型而言,操作系统不仅仅是一种技术,更是一种应用。在操作系统的迭代过程中,它会不断积累和处理各种数据,以提供更高效和可靠的计算环境。
因此,既做模型也做应用的做法是合乎逻辑的。
只有不断收集用户的反馈、积累模型的应用实践,创业者才能深刻认知自己对模型的需求、以及如何不断改进模型。
今天的模型数据驱动属性越来越强,如果只是向外部开放API,很难形成用户反馈闭环,远不如同步做kimi chat这样的应用更有效率。
最后,构建基础模型的路径是多种多样的。
就像同样是做云平台,亚马逊是先通过其电商平台Amazon.com形成了一定的市场规模,在此过程中构造了AWS的能力,再对外输出;也有其他科技公司是直接打造云平台,将其能力直接输出给客户。
第一种路径可能对中国市场更为有效,当公司有业务需求、数据反馈时,会更加了解基础设施应该如何进行规划和建设。
此时宜迭代数据认知:关注数据处理和多模态数据
去年,蓝驰创投提出了一个理念,即在赚钱的同时也要赚取数据和知识。
今年,打造数据飞轮已经成为市场的共识,蓝驰对于创业者的建议是,继续升级对数据的认知:更多关注数据处理和多模态数据。
数据方面值得关注的有三个重要问题:
1. 是否获得了大量的公共领域数据/独特的私有领域数据?
2. 能否找到能够支持模型持续快速学习和高质量迭代的数据资源?
3. 是否可以对数据进行适当的增强,以构建更高质量的数据结构?
最具挑战的不是收集数据,而是对数据的处理和分析。
对创业团队而言,能否筛选、处理出真正适配场景的高质量数据,是对技术、模型、以及场景理解的综合考验,这最终可能导致用于训练的数据有数十倍的差别。
在更高的维度上,有三个问题值得创业者仔细思考:智能是通过不断积累数据来提升,还是数据是通过智能算法来不断演化?增量新数据和存量旧数据的特征分别是什么?新数据产生的场景应该如何排序?
在互联网时代,人类主要处理的是二维空间的数据,即文本数据。然而,如果我们将世界看作一个模型,数据的形式不应该仅限于文本。
Sora和Gemini是基于什么数据?理想的自动驾驶、Apple Vision Pro、大疆又是基于什么数据?在空间的维度上看,这个世界的数字化程度可能不足5%,剩余95%的世界应该怎样、用多快的速度进行数字化?
蓝驰认为,在人工智能时代,对三维空间数据的获取和处理将成为各方争夺的焦点,这些多种感知方式的数据将催生出新的强大应用,这些应用可能不再局限于手机,而是结合其他新的交互界面和具身智能的执行终端。
这也是OpenAI投资Figure的原因之一。在具身智能领域,蓝驰创投还在早期投资了智元机器人、银河机器人等项目。
基于过去积累的知识,蓝驰关注人工通用智能(AGI)的底层逻辑是:人工智能+三维交互+机器人技术的三种技术叠加,同时辅助使用Web3。这三种技术实际上是推动力,分别对应不同的空间和执行能力。
Apple Vision Pro带来的空间计算以及此前所说的元宇宙,抽象成第一性原理就是三维交互,新一代的交互界面,Robotics则是具身智能加上执行结构。
传统的软件公司可能会逐渐消失,而一些个人创业者可能会创办出价值数十亿美元的公司。
在移动互联网时代,应用程序是市场的主要组成部分,而计算能力和基础设施的比例相对较小。
因为互联网的能力在于「连接」,需要通过应用来实现其价值:人与人的连接产生了社交应用,信息与信息的连接产生搜索应用。
但在人工智能时代,底层的占比要更高,因为它的能力是「生成」,创造的价值比互联网更大、更直接。
同时,GenAI时代的长尾可能更为丰富多样,因为长尾上的每个小单元都可以独立地创造自己的价值。
比如对于To B市场来说,由于场景高度分化、数据分散各处,导致很多个性化的需求无法得到满足。然而,GenAI可能能够将这些细分的需求聚合在同一个入口。
大家在讨论的AI Agent、AI Native、Copilot,本质上都是基于人工智能技术的应用,这些应用会使每个人在解决问题时拥有更强的自主能力。
蓝驰创投认为,当人工智能广泛应用于个人,创新模式也随之出现,将会有越来越多的公司价值达到十亿美元。
过去20年,由于优质人才的供应不足,导致法律、医疗和教育等高端服务行业的成本一直在不断上升。
但GenAI让我们看到了「Do More with Less」的可能:当公司逐渐减少对人的依赖,创造价值的单位成本也会随之急剧降低,这将会催生新一代公司出现,即不再是赋能于垂直行业的软件公司,而是一家人工智能模型驱动的行业参与者。
比如,现在创业者想做一家服务于零售行业的SaaS公司,首先要雇人开发软件,再把产品卖给零售公司;但未来,产品开发的工作可能由自动化代码生成工具完成,系统维护也可以交给人工智能,这样企业实际上雇佣了一群零售数字员工,这家企业本身就是一家零售公司,而不再是「赋能零售行业的软件公司」。
GenAI应用创业者的核心关注点
首先,选择数据丰富的场景,主要指具有丰富上下文信息或者尚未被数字化的场景。
其次,要同时进行赚钱、积累数据、获取知识,以形成数据飞轮。
对创业者来说第一关是形成产品市场适应性(PMF),但在GenAI时代,PMF的定义与之前有所不同。现阶段的产品定义必须考虑技术的限制条件,如果创业者对技术不了解或者过度定义产品,都很容易被竞争对手迅速击败。
创业者要去思考:在相应技术分类中,是否适用/仍然适用Scaling Law?技术的上限会在哪里?有什么本质是不会随着技术的迭代而改变的?基于这些技术判断,创业者要决策一些关键问题:产品采用什么技术?是追技术的上限还是抓技术的下限?如何迭代?
来源:「Designing Generative AI Products That Users Will Love」
所以对于懂人工智能的产品经理来说,在GenAI产品的产品市场适应性阶段就显得非常重要,他们所构建的反馈机制需要能够让用户在使用过程中提供更多的数据,这是最终能够形成竞争优势的关键所在。
这群人往往经历过几轮人工智能技术的迭代,在GenAI发展过程中经历、参与过模型的训练和对齐,并且尝试过基于人工智能能力从0到1构建产品。
三是要注意降低经营成本。
在创业模型上,创业者需要了解不同模型的核心能力是什么,以及如何高效低成本地将模型的差异化适配到合适的场景。同时,创业者还需要利用通过PMF(产品市场匹配)形成的数据飞轮来提高收入。
要相信大规模模型的Scaling Law(扩展规律),也要相信大规模模型的成本降低速度是非常快的。所以创业者要去思考,根据新的摩尔定律,2-3年后公司的商业模型应该是怎样的?
对于To C和To B产品,在不同阶段应该达成的里程碑目标是不同的,以下是蓝驰创投的思考:
toC的产品
「探索期」是指在产品开发过程中的一个阶段,该阶段会对细分场景和细分功能进行探索,以实现核心用户的留存和付费。
「验证中」指的是在原有的场景和功能基础上进行进一步的验证和测试。这个过程中,会将用户群体扩大,以便更全面地评估模型的性能和效果。同时,也需要确保收入能够覆盖模型调用所需的成本。
「已验证」产品及场景收敛,用户数量呈指数级增长,获客成本显著降低
toB的产品
「探索期」是指在这个阶段,产品已经有了初步的设计和开发,同时也有了一些应用场景,但是还没有大规模推广和使用。在这个阶段,产品团队会不断地进行试用和测试,以便发现问题并进行改进。同时,也会选择一些少量的试用客户,让他们使用产品并提供反馈意见。这个阶段的目标是不断发散,探索产品的潜力和市场需求。
「验证中」表示目前处于验证阶段,正在进行产品开发和市场测试。在这个阶段,已经有了一些产品和应用场景,并且也有了一些愿意付费的客户。目标是通过不断优化和持续的客户成功来实现产品的商业化。
「已验证」产品及场景收敛,已经通过验证的产品和场景逐渐收敛,证明其可行性。公司已经获得了商业化客户,并且实现了规模性收入,其中一部分来自于客户的复购,带来了更大的规模。此外,还有一些客户选择续费使用我们的产品。
05 要认识到自己的优势,并且具备拓展全球视野的能力
虽然地缘政治会是一个不可避免的主要议题,但在AI创业的初期阶段,就需要具备全球视野。
我们需要不断吸取全球的认知,引入世界级的人才和资源,并以公正、中立、务实的视角去观察世界各国——包括美国、中国的优点和缺点,从中思考自身的机会和挑战,以及与这个局势的相处之道。
于是,我们在考虑下一阶段的AI应用时,还要考虑一个重要问题:未来市场的发展方向。
无论是中国境内还是海外的创业者,都需要在全球局势中确定自己的位置,并找到适合自己的资本市场进行融资和发展。
06 模型小型化、垂直化与Scaling Law不矛盾,但想探索人工智能通用智能(AGI)的难度很大
蓝驰认为,Scaling Law所带来的模型能力提升还远没有看到尽头,仍然可以继续不断提升。
虽然有的人担心数据有限,但实际上仍有大量的数据没有被应用到模型训练中,比如私域数据,以及更重要的物理数据,这两类数据都会赋予模型更多可能性。
一些学者、创业者尝试使用更小的、端侧的模型去探索人工通用智能(AGI)。
这个路线和Scaling Law并不矛盾,它希望用更低成本、更快速度实现上升曲线更陡峭的智能提升。就像是我们发现一个炼丹炉已经能产出成果了,现在希望它更高效地运行起来。
不过,这条路线非常考验团队的能力,涉及到上述提到的对数据的处理、选择,以及对超参数的设置等等。
未来这条路线的难度会逐渐加大,正如前文所述,随着时间的推移,关于高阶模型训练的公开信息将越来越稀缺,再想复刻、调优将变得更加困难。
与此同时,作为投资人,蓝驰会始终保持开放心态,对可能的路线保持关注。人类对人工通用智能(AGI)的探索尚处早期,并不是没有新的研究方向出现的可能。