大模型先克服七难,方能致富(dae模型导入犀牛)

大模型先克服七难,方能致富。_图1

中关村科金CTO李智伟博士最近发现,大模型商业闭环,正在被提到很重要的位置。

不同于过去20年间中国IT行业的发展,无法通过烧钱来快速积累用户,依赖估值和广告来实现商业变现;在大模型时代,投资市场变得更加理性,正在推动业界加速实现商业闭环。

前不久的华为HDC开发者大会上,华为主机上云军团CEO、混合云总裁尚海峰强调,“加速商业闭环,是使用大模型最关键的一点”,市场终归要回归理性,只有真正的为用户创造价值,实现商业闭环,才有更长远的未来。

而经过数个月的摸索,业界对于如何促使客户从试点探索,走向规模化购买,加速商业闭环这件事,也有了一些方法论。

01

价值共识,1000位客户眼中有1000个哈姆雷特如何解决?

“以前买个软件,有些什么功能,给个清单,客户一看就知道了;但大模型时代不一样,客户对这件事的认知并不统一,1000个人可能就有1000个哈姆雷特。”中关村科金李智伟告诉数智前线,这就需要和客户沟通时,有一套方法论,对客户进行正确的价值导向

毕竟,在大规模模型落地这一过程中,期望值过高或过低,都会极大地影响企业应用闭环的形成。“大规模模型基于Transformer,我们本身也成为了一个Transformer,是把大规模模型转化为一个可见、可触及的应用的推动者。”快递100总经理陈登坤说。

“为了降低沟通成本,我们现在所有产品都在公有云上有试用版。”李智伟介绍,这样的一个个小的原型系统,有助于客户快速了解大模型能实现什么效果,边界在哪,进而加速从前期讨论到PoC,再到落地部署的推进。

另外,帮助企业计算投资回报率(ROI),也是促进实施的通用做法。中工互联董事长智振介绍,这不仅包括短期ROI,比如上了大模型后,能提高多少效率,节省多少人力资源,以及在多大程度上降低对关键人员的依赖,减少人为犯错的可能性等,也包括长期ROI。

这也导致,他们在与客户沟通时,最核心的一项工作,就是引导客户找到整个价值链上最痛、最有价值的点。比如在设备运维场景中,往往与知识管理密切相关,一个设计文档出现问题,可能会导致数百万元的损失。原先依靠人工排查,如果需要两小时且千分之一的概率漏检,现在可以通过大模型配合人工,在十分钟内完成,且漏检率降低90%。

“我们就先给他做那样的场景。”智振说,这对于企业建立对大模型的信心,包括向更多、更深的场景推行,都是非常有帮助的。

02

实施周期,要限定在3到6个月?

过去一年,客户与业界探索了大量场景,但真正从Proof of Concept(概念验证)走向商业闭环,却并非每个场景都可以。

面对大模型掀起的这波新变革,也很少有企业愿意一开始就花上几千万、几年的时间来做。

“一年能回本,客户很容易接受;三五年回本,客户就要考虑考虑;7年回本,肯定得政策强制要求了。”智振说,“大家现在普遍能接受的价格区间是50万到200万,这个价格范围反映了市场对投资回报周期的容忍度和期望值。实施周期一般要限定在3~6个月,这样的时间框架可以确保项目的进展能够在合理的时间内完成,同时也方便客户进行评估和调整。”一些大项目虽然会跨年,但一般都会切分到几个月为一期,以作观察。

大模型先克服七难,方能致富。_图2

一些小型项目,上线时间还能更短。“比如我们也在给一些电商客户提供售前、售后的大模型技术服务。这些服务包括帮助客户分析市场需求、优化产品功能、提高用户体验等。由于电商行业的决策周期和试用周期通常较短,有时我们甚至会按照月度计费的方式来进行收费。”智振说。

“我们现在所有项目都是按‘短平快’的方式去做实施,会帮客户把一个大需求,切到一个个比较小的点,逐点试错,逐点突破,而不像以前做软件,一个项目做上一年半载的,客户才能看到效果。”新致软件副总经理曹玺告诉数智前线。

在场景方面,与大语言模型相关的知识类场景,成为企业选择的优先级闭环方向。

泰康科技有限公司人工智能部AI架构师朱兴杰介绍,今年上半年,他们首先在知识再加工方面下了一番功夫,通过知识助手、销售助手等方式赋能代理人,初步效果已初显。未来,他们将进一步提升在理赔等场景中的风险识别能力。

而中国工商银行软件开发中心大数据与人工智能实验室副主任夏知渊,在华为HDC大会有关大模型混合云的论坛上,公布的工行“1+X”的工程化解决方案中,除了1指代的是智能体,X种解决方案也大多与知识类场景相关,如多模态的知识检索、交互式的智能搜索等。而基于这些能力,工行在远程银行场景,形成了大模型的全流程赋能,将通话时间压降了10%,员工坐席效率提高18%。

03

大型模型平台,避免“散兵游勇”式的操作方式

为了加速大模型在各行各业的落地应用,各家主流大模型厂商都在纷纷强调模型的“最优性价比”,轻量化模型、MoE、价格战轮番上阵。再加上开源江湖的持续繁荣,企业在选择模型时正变得更加多元化

“各种开闭源大模型,只要我们能够将推理部署起来,我们都会去尝试,观察效果。”泰康科技朱兴杰告诉数智前线,泰康科技支持整个集团的上千个应用,集团各分部门都能根据各自不同的场景,选择不同的模型,“识别出一条最佳路径”。

原文中的内容是合理且可以扩写的,因此在保留原始HTML结构的同时,对内容进行了合理性的扩写。

不可否认的是,相比闭源,出于成本等考虑,开源是更受欢迎的存在。比如在行政执法领域,北京可为高科信息技术有限责任公司正在通过开源模型,为政府客户提供私有化部署。在金融领域,中关村科金CTO李智伟观察,在闭源、源代码开源,以及“源代码+训练数据”开源三种模式中,银行客户更想要第三种

开闭源之外,业界的一大共识是,大小模型混用正在成为常态。比如中关村科金的混合模型质检平台,让小模型负责声音、画面等基础数据质检,承担高频易检场景,大模型负责低频难检的内容,以及为质检结果提供判定原因,辅助人工快速复审,已经帮助某头部金融机构实现了检测效率提升1千倍,大幅降低人工检测成本。

“这就好比一家公司有分工才能更高效运转。”李智伟说。

而更深一层,一些企业已经开始构建统一的大模型中台,管理多个规模不同的模型,包括安全性、知识注入、工具、服务分发等。“这样可以有效避免零散操作导致资源浪费,也有助于后续的更新迭代。”泰康科技朱兴杰说。

大型模型也正在成为企业发展的基石。智振透露,他们目前向客户提出了“三个平台”的概念,即基于大型模型基础上建立数据平台、业务平台和知识平台。过去,工业互联网平台主要解决数据不通和业务不畅的问题,但知识沉淀困难难以解决。而大型模型可能会显著改善这一情况。

智振看到,目前包含了大模型底座加平台的项目,普遍在数百万元的金额水平。但企业并不会一期全建,或全部将旧系统推翻重来,而是循序渐进,“比如现在知识平台好,我就先上知识平台,跟其他业务系统打通,如果用得好,再逐步把别的系统替换掉。”

04

数据飞轮,是难点也是制胜点

作为大模型三要素中的关键一环,数据无疑是影响大模型商业闭环形成的一个重要因素。

大模型先克服七难,方能致富。_图3

“尤其是在落地过程中,我们遇到的最大障碍是过程数据的缺失。”北京可为联合创始人曾明告诉数智前线,除了金融、电商等数字化进程原本就比较成熟的行业,大量行业企业都存在数据方面的问题。

比如法律领域,有海量的案件公开数据,但大多都只有简单的案件描述。“如果说一个案件中,正常的思考过程是从案件的初步分析a到最终判决结果z,过程中经过了从a到b、b到c……x到y、y到z的一系列步骤,那么当前的大模型只学会了从a到z的结果,而忽略了中间关键步骤的具体过程,是无法全面理解案件处理的全过程的。”曾明说,“现在最缺的就是b到y的过程数据,也就是从案件初期到判决结果的详细步骤和决策过程的数据”

“数据如果只是知识之间的关联性缺失,我们可以通过大模型自带的知识体系来补足。但如果是事实类数据的缺失,就只能通过传统方式去采集回来。“中关村科金李智伟告诉数智前线。

曾明透露,他们目前正通过数据清洗、数据标注等工作,帮助企业进行历史存量数据的完善,同时也正在大模型落地过程中,加速收集增量数据,双管齐下,填补数据空白。

大型模型供应商也在从工具链方面着手,帮助企业加速数据治理,形成自己的数据飞轮。事实上,在不少人士看来,随着时间的推移,不能只专注于模型本身的训练。工具链的建设将在加速大型模型商业闭环中扮演越来越重要的角色。

李智伟告诉数智前线,不仅仅是数据方面,模型的部署、安装、运维和日常的优化调试等,都可以通过工具链来进行提升。为此,他们在今年推出了PowerAgent平台,大模型的部署效率能够提升2~3倍。

05

这里没有可扩写的内容,因此原文保持不变。

算力选择,混合云最经济?

算力是加速大模型落地和商业闭环过程中,另一个备受关注的问题。“基于对数据安全、开发成本和训推效率的综合要求,混合云目前正成为越来越多政企的优先选择。”在HDC期间大模型混合云的论坛上,华为尚海峰强调,这是当前最合规也最经济的一个方式

大模型先克服七难,方能致富。_图4

此前,《深度用云展望2025》白皮书中也曾指出,2025年,75%的企业预计会采用人工智能大模型,而基于混合云的人工智能大模型比例预计将达到38%

比如在政务行业,广州市政务服务与数据管理局副局长梁文谦在华为HDC开发者大会上介绍,为了兼顾数据不出域和大模型的训练需求,他们构建了一个公有云和政务云混合的人工智能公共算力中心,其中100P部署在政务云,提供训练好或还需精调的模型,给人社部门、城市管理部门等应用,另外200P公有云,则作为训练应用。

在金融、汽车等领域,不少企业也采用了公有云和私有云协同的架构。泰康科技有限公司人工智能部AI架构师朱兴杰告诉数智前线,这一方面是出于成本的考虑,“私有算力我们评估都是几千万的投入,才能有不错的效果”。另一方面,业界普遍认为,国产算力仍需在规模、性能、底层生态上完善。

对于核心的商业知识,必须要求私有云,因此我们目前会有少量本地私有化的集群,同时也会调用公有云服务,进行混合部署。”朱兴杰表示,大家的普遍做法是,利用公有云的高弹性和高扩展性,满足在AI场景创新时的算力灵活租用和多方场景尝试,验证场景价值后再通过私有云部署,快速实现本地数据的安全化处理。“下一步的话,一旦我们看到效果,可能会建立一个大规模的私有算力”。

混合云之外,企业也可以选择“公有云的私有化”模式,即在公有云上开一个私有化的环境,达到节省成本的目的。目前,在零售、酒店和文旅等数据管控没那么严格的行业中,有不少企业都选用了这种模式。

中关村科技金融信息技术有限公司(科金)的首席技术官李智伟建议,国家央企可以牵头建立专有云平台,这样可以更经济高效地提升大型模型的计算能力和降低成本。“例如,在某个区域,能源产业链的主要企业可以提供公有云服务,为该地区所有能源企业提供支持。

06

定制化,“老大难”有新解法

在To b市场,个性化服务一直是不可避免的议题,同时也是影响商业闭环形成速度的重要因素之一。

业界观察,过去三十年间,整个信息化和智能化的发展历程,也是个性化需求不断简化的一个过程。以人工智能为例,上一个AI时代,AI技术泛化能力差,甚至存在面向同一场景开发的产品,无法在同一银行的不同部门直接复用的情形,个性化需求成为必然。大模型时代,人们发现它的泛化性,在一定程度上解决了个性化需求问题。

但随着大模型真实的应用逐步增加,业界发现定制化需求仍然大量存在,“甚至在某种意义上增加了。”中关村科金CTO李智伟告诉数智前线,这尤其体现在多样性的客户需求和尚未稳定或收敛的技术阶段。在他看来,与其回避定制化,还不如拥抱这个诉求。

我们在进行大量工具化和配置化的工作,以使大型模型所依赖的这些定制化产品基础设施更高效、实施成本更低。”百度智能云知识管理产品部总经理宋勋超说。

中工互联董事长智振则举例称,给企业做定制化服务,就好比给个人定制一套西服,通过精确的量体裁衣过程可以确保西服更加贴合个人的身形与需求,从而达到更佳的穿着效果。然而,这种量体裁衣的定制化服务往往会伴随着更高的成本和更多的时间投入。因此,如果企业希望降低定制化服务的成本和缩短时间,就需要在服务过程中引入更多的标准化元素,具体来说,就是通过提供标准化的产品和更加规范化的服务流程来实现这一目标。

“今年以来,我们已经将过去一年探索出的能做的方向,全都产品化了。”智振说。而这不仅有利于企业去落地大模型应用的过程中,更快得到能力的交付,也能加快服务商的大模型落地能力推广复制的速度。智振透露,他们目前除了自己面向客户提供产品+服务的整体方案,也将标准产品卖给了伙伴,再由伙伴向客户出方案。

07

运维,让投资不打水漂

好多人往往忽略了大型模型的运维运营,但我认为它和大型模型的建设同样重要,值得我们长期的投入,否则你根本用不起来。”华为主机上云军团CEO、混合云总裁尚海峰表示,这其中,涵盖了体系建设、人工智能培训、技术运营、场景运营、生态运营、市场运营、运营门户等多个环节。

大模型先克服七难,方能致富。_图5

比如,鄂尔多斯市政府与华为联合打造的以行业AI大模型为核心的工业互联网平台,采用‘前店后厂’模式。据鄂尔多斯市创新投资集团有限公司副总经理廉咏梅介绍,在这种模式下,“后厂”不断聚集生态伙伴来拓展新场景,开发新的大模型应用产品的同时,“前店”也能通过线上应用商城,实现商业的变现,实现成果转换和商业闭环。

但与此同时,这也对企业和服务提供商都提出了新的要求。

于企业而言,需要尽快通过服务提供商们提供的人工智能赋能、人工智能培训等模式,建立起实施大型模型的内在能力。

于服务商而言,也更加要求长期服务和陪伴的能力。“to b企业软件领域有一个逻辑是,每年如果不更新,就会损失15%的能力。”智振告诉数智前线。

因为给出的内容是中文,并且无法进行合理的扩写或解释,所以直接返回原文。

显然,在今天的大模型时代,技术的更迭和升级还要更快。而这也同样意味着,不管是企业,还是大模型服务商们,都需要更经常地进行经验总结,更新方法论。

0
分享到:
没有账号? 忘记密码?