AI入凡尘:从风花雪月到千行百业–AI入凡尘:从追求浪漫的风花雪月到投身各行各业的千行百业(爱入尘埃免费阅读全文)

AI入凡尘:从风花雪月到千行百业_图1

作者:贾乐乐,编辑:赵元

大规模语言模型(LLM)发展起来之后,生成式人工智能开始迅速增长,涵盖了聊天对话、文本生成图像,以及图像扩展等多种形式。

对于技术的进步,大众都喜闻乐见,但渐渐地另一种声音出现了:我们希望人工智能代替我们工作,代替我们打扫卫生,我们去享受生活,可现在方向好像反了。

人们常说,路要一步一步走,饭要一口一口吃。在科幻小说和电影中,出现“和人类无异,且供人类驱使”的机器人是不现实的。然而,让人工智能从仅仅能陪聊、废话大师的角色逐渐转变为有用的工具,这个实现的途径已经不再像以前那样模糊。

一个普遍认可的观点是,AI Agent是推动AI应用实现的关键力量,甚至可以说是最终的形态。

基于LLM(Language Learning Model)的AI Agent是具有独立思考和行动能力的智能体,AI Agent=LLM(语言学习模型)+感知+规划+记忆+工具使用。

今年,红杉资本对2024年人工智能(AI)的发展趋势做出了预测。预计AI的发展将呈现出Copilot向Agent转变的趋势。Copilot是指AI辅助人类工作的一种形态,而Agent则更像是一个真正的同事,可以与人类共同分担工作。未来,Agent还将进一步发展成具备实体形态的智能机器人。

在确定性的趋势下,许多平台和企业都在积极布局Agent。例如,OpenAI推出了GPT store,钉钉最近上线了AI Agent store,智谱AI和昆仑万维也分别推出了自己的Agent平台。

OpenAI的GPT store已经于今年1月份上线,属于Agent的初级阶段,上线后的这三个月,GPT store收到了许多负面评价。

作为当前通用型人工智能技术的领导者,OpenAI具有引领行业发展的重要意义。GPT store的遇冷现象引发了人们对几个问题的重新思考:GPT store的不受欢迎是否意味着Agent技术不可行?人工智能通过Agent形态实现落地应该采取怎样的路径?有哪些实际的应用场景可以考虑?像钉钉这样的平台应该扮演什么样的角色?承担什么样的任务?

一、人工智能应用落地,是面向企业(To B)还是面向消费者(To C)?

GPT store的推出,意味着每个人都有机会参与构建Agent的时代开始了,也被视为AI的APP store时刻。

由于宫斗等一系列事件的影响,GPT store的上线时间被推迟了两个月。然而,在这段时间内,用户却创建了超过300万个ChatGPT自定义版本。

300万是一个相当大的数字,它代表着我国国内市场上的APP数量。这个数字包括了安卓和苹果商店中的应用程序,而实际上的数量只有260多万。

然而,GPT store上线不久后,就出现了一系列问题,包括热门GPTs被抄袭、僵尸号泛滥、刷单、假官方、软色情等多种违规行为。其中最受欢迎的是AI女友,尽管OpenAI已经明确表示,不允许GPT专注于培养浪漫伴侣关系。

GPT store里的产品同质化严重,质量低劣,导致开发者纷纷抱怨。他们认为OpenAI审核不力,用户数量稀少,商业模式完全无法运作,因此对GPT store失去了信心。

To C的GPT产品备受争议,有的To C的企业创始人团队也转向To B(面向企业客户)。

Inflection是一家人工智能独角兽公司,也是融资额仅次于OpenAI的初创公司,拥有自己的类ChatGPT产品——Pi,主要专注于提供陪伴服务,面向个人用户。

有消息称,据传Inflection的核心层被微软挖墙脚,负责组建名为“Microsoft AI”的新团队,整合微软的消费者AI工作以及Copilot、Bing和Edge等产品。

这不好说是面向企业还是面向消费者,但相较于闲聊和娱乐,微软和人工智能相关的产品显然更注重实用性,更致力于提高工作效率。

据华尔街见闻的报道,Inflection也正在调整业务重心,转向为其他企业提供应用程序接口(API)服务,也就是面向企业(B2B)化,因为即使Pi的每日用户数量已达到100万,它也还没有找到有效的商业模式,更别提GPT store里的那些GPT了。

To C的Agent在当前遇到了较大的阻力,To B可能才是更有希望的“生路”。

To C产品的主要逻辑是创造增量需求,创造的方向是让用户感受到有趣的体验。有趣是一个模糊的概念,可以通过提供短视频、AI生成照片、拍摄表情包、游戏中设定AI NPC、编写笑话等方式来实现。

需求分散、使用频率低下,这是To C产品需要突破的关键点。

To B产品的逻辑是为了解决问题,尽管在不同行业有不同的场景,但每个应用场景都有明确而具体的需求。无论以何种形式实施,人工智能都需要以更低的成本、更高的效率来满足这些需求,这是天然的限制。

未来,当Agent成为科幻小说描述的那样成为个人管家、助理时,To C(面向消费者)应用的发展潜力将被彻底掀开,而在当前软件层面,To B(面向企业)才是AI Agent的破局的最佳路径。

二、在To B场景中,Agent目前的进展如何?

从LLM(Language Model)到Agent,AI在To B(To Business)场景已经经历了三个阶段的发展:首先是大模型的涌现,不论是面向To B还是To C(To Consumer),这都是AI发展的基础阶段;其次是应用层的+AI,AI作为辅助工具的角色,例如微软的Copilot和钉钉的AI魔法棒;现在进入了第三个阶段,从Copilot走向Agent,AI具备更强的自主性和执行力,朝着自动化和拟人化的方向发展。

在第三阶段,企业所需要的不一定是一个完整的产品,也可以是一小节智能化的能力。将原子化的能力组合在一起,可能是解决企业个性化需求、不同员工个性化需求更有效的途径,这也正是传统的SaaS所面临的最大的问题。

AI入凡尘:从风花雪月到千行百业_图2

(来源:中金研报)

这些智能化生产力使用场景有哪些?谁来提供这些智能化生产力?

在B端,有许多不同的场景可以应用Agent技术。比如,在电商领域,可以利用语音助手、智能客服和个性化推荐等功能来提升用户体验;在教育行业,可以利用智能辅导和答疑、教育数据分析等功能来提供更好的教育服务;在房地产行业,可以利用虚拟房源展示、合同生成与管理、风险评估等功能来提高房地产交易的效率;在旅游行业,可以利用实时翻译、旅游数据分析等功能来提供更便捷的旅游服务;在物流行业,可以利用园区管理与监控、搬运与装卸等功能来提升物流运营的效率。

To B涉及到的行业范围广泛、应用场景分散,需要具备专家级的能力,因此那些具备丰富行业知识的企业、独立软件开发商(ISV)、个人专家是创造AI Agent的关键角色。

因此,钉钉选择了更加开放的方式来构建AI助理生态系统。这与钉钉一直以来的生态战略一致,即自己开发底层和基础设施,将创造的机会留给所有的企业、用户和服务商。

今年1月,钉钉宣布举办AI助理大赛,不设门槛,鼓励企业、ISV、个人进行AI助理的创造。参赛者有机会获得最高20万奖金。大赛分为企业赛道、办公赛道和高校园生活赛道。截至3月底,共有超过700份作品参与了大赛。

我们可以从这些作品中看见To B的Agent已经可以做哪些事情,能够在多大程度上提升效率。

本次AI助理大赛中,实在智能是办公赛道进入到前十的选手,作品是RPA助理——实在Agent。

人工智能(AI)是一种模拟人类智能的电脑技术,而机器人流程自动化(RPA)则是一种更具执行力的工具。将AI和RPA结合起来可以实现业务流程的超级自动化。例如,在对话中,可以通过AI+RPA的组合来调出某个业务部门当季的收入或其他统计指标,以及项目的进度等信息。这些任务不仅仅是简单的对话,还需要进行查询、拆解、查看项目数据、推送等执行层面的动作,同时还涉及到数据库的读取和API管理等操作。

实在智能与钉钉的合作主要集中在电商这个领域,实在Agent可以协助电商商家进行全方位数据的更新与维护。

现如今,随着电商行业的发展,越来越多的商家选择在多个平台上经营自己的店铺。然而,由于店铺数据分散在不同的平台上,商家在日常的数据取数工作上面临着一些挑战。以往的解决方式是增加员工数量来完成这项工作,但这不仅增加了成本,还容易出现错误。

实在Agent可以通过模拟人工的方式,在不同的平台上获取数据并进行汇总,还可以将数据汇总到宜搭上创建BI看板,从而实现数据的自动更新。

如果是原来的模式,实在智能需要先打响“取数宝”的品牌,而现在多了一种选择:将取数宝的能力,集成在AI助理里。现在钉钉对于AI助理的入口比较重视,客户就可以随时点进去,通过自然对话就可以执行。

用友薪酬创造的薪酬分析助理,可以帮助用户进行日常工作报表的统计,进行人力成本的分析,进行薪酬结构的分析,进行市场薪酬的统计等。

用友薪酬和实在智能都是为企业提供服务的服务商,也有一些企业选择自己上,比如长龙航空创造了航空维修助理,可以提交维修需求、智能推荐维修方案、材料出库入库登记等等。

用友薪酬和实在智能都是专门为企业提供服务的服务商,它们可以帮助企业处理薪酬和智能方面的事务。有些企业选择自己开发这些服务,比如长龙航空就开发了一款名为航空维修助理的软件,该软件可以让用户提交维修需求、智能推荐维修方案以及进行材料出库入库登记等操作。

在2021年4月23日,钉钉极客大会上,钉钉的首席技术官程操红提到,截至目前,钉钉平台上已经拥有数十万个人工智能助理。

三、既然GPT Store不可行,那么是Agent不可行吗?

虽然B端(企业端)相对于C端(消费者端)更容易培育出有用的AI工具,但GPT Store的经历不免让人担忧钉钉的AI Agent store会不会上演相似的剧情。

首先,让我们来比较一下钉钉的AI Agent store和OpenAI的GPT Store的相似之处和不同之处。

相似之处,是两者都降低了Agent的开发门槛。

OpenAI通过提供GPT builder降低了建立一个Agent的门槛,用户无需具备编程知识,也不需要了解代码,通过可视化点击操作就可以构建一个自定义GPT。部分GPTs可以通过插件参与业务流程并使用工具,具备一定的执行能力,但仍然无法达到Agent的执行标准。

在技术普惠方面,钉钉是更加迅速的。例如,钉钉早就利用低代码实现了半人工智能化,使企业能够以低门槛的方式开发更符合实际业务场景的应用。

同时,低代码的普及,也为AI Agent打下了“系统”和“数据”基础设施,比如可以接入钉钉上原有的应用、低代码开发平台、企业自建系统、外部第三方平台。

最大的不同还是在于应用场景,也就是前面提到的,OpeAI的GPTs主要是给C端用户使用的,低门槛所带来的是同质化与低质量的内容,而钉钉上产生的AI Agent更受到需求的约束。

以解决问题为开发工具的目的,通过使用低劣化问题的方法,可以在很大程度上解决这些问题。在同质化方面,参考了GPT Store的经验教训,钉钉表示,钉钉未来的AI助理市场不会进行全量推荐,而是只会推荐经过精选的AI助理。

AI入凡尘:从风花雪月到千行百业_图3

(钉钉AI助理市场)

除了审核之外,在优秀AI Agent的涌现上,钉钉具有哪些优势?

前面我们提到,AI Agent=LLM(Language Model)+感知+规划+记忆+工具使用,也就是说在大模型之外的更多的框架、组件,以及产生框架和组件的业务场景和数据,也是关键的要素。

就像观众不能期望没有经历过一天工作的编剧写出底层打工人真实生活的场景,我们也不能期望只学习了风花雪月知识、没有在真实业务流程中工作过的LLM具备解决实际问题的能力。

钉钉的最大优势是,它不仅仅是一个面向企业的协同办公平台,还是一个开放的生态系统,一个人工智能应用创作平台,拥有众多的用户、组织和独立软件开发商(ISV),同时也积累了丰富而复杂的真实业务场景。

企业、ISV和个人开发者可以在钉钉上连接、开发和加工各种应用。此外,由于钉钉拥有众多用户和企业,它成为了Agent天然的试验场。就像毕业的大学生有了工作机会一样,AI Agent store也会成为AI Agent高频的分发通道,为未来的商业变现提供了更大的可能性。这样一来,就避免了GPTs活跃用户少的困境。

钉钉所做的,是将不同场景和数据进行连接,实现自动化和批量处理各种工作。具体来说,钉钉的职责是确保外部记忆存储部分的完善,包括处理短期和长期记忆,同时进行任务规划,然后将大模型生成的内容与本地业务数据进行整合,并将形成的行动在各个系统中实施。

同时,钉钉也在增强To B的场景。

在To B服务中,钉钉需要与用户和企业频繁互动,甚至需要线下了解实际工作流程。尽管每个企业的需求各不相同,但钉钉可以逐渐积累经验,并保留产品的抽象层和公共层,以满足广泛的行业需求。

再举一个例子,像用友这样有着丰富经验的财税专家在薪酬领域的理解一定比大模型更加深入,因此AI薪酬分析助理的作用就是增强大模型在垂直领域的能力。

总的来说,和OpenAI相比,钉钉在语言模型(LLM)方面没有优势,但在感知、记忆和提供工具等方面都做得更好,这是AI Agent store不会成为下一个GPT store最重要的原因,也是钉钉能够发展AI Agent生态的重要原因。

四、总结

历史总是在不断重复循环。

蒸汽机问世后,除了在工业和纺织业中得到应用,人们还尝试将蒸汽机直接安装在马车上。然而,后来人们才发现蒸汽机在交通运输领域才真正发挥了作用,特别是在船舶和汽车上。

随着大模型的出现,To B行业开始朝着增强原有产品的方向发展,逐渐过渡到更具自主性和执行力的AI+技术。

就像人们需要的是更快速的交通工具,而不一定非是马车,实现目标的途径是可以改变的,人工智能也在改变解决问题的方式。

过去,普通用户要解决问题,需要打开一个个的应用程序,企业需要解决问题,需要使用一个个专门的软件即服务(SaaS)解决特定领域的问题。现在,人工智能代理将能力分离出来,并将它们组合、重组,形成特定事件和场景的解决方案。

在简单的情况下,我们需要的是足够多、足够智能的人工智能代理,在相对复杂的情况下,我们还需要这些人工智能代理可以进行合作。

钉钉目前的目标是通过大量的需求来推动有用的AI Agent的出现。当有足够多的有用的AI Agent出现时,它们将能够覆盖各种工作场景和生活场景,使我们离想象中的未来世界更近一步。

0
分享到:
没有账号? 忘记密码?