华为云发布盘古5.0,大型模型竞赛重回主流。(华为盘古系统密码重置方法)

6月21日,在东莞松山湖举办的华为开发者大会(HDC 2024)上,华为云官方宣布推出盘古大模型5.0,这是继去年7月推出盘古大模型3.0后的一次重大升级。

就在华为开发者大会举办之时,国内大型企业的竞争正进入白热化阶段。5月,一些企业发起价格战,将之前业界已经建立的商业模式彻底“颠覆”。而各家企业也在全力出击,甚至以零成本争取大型项目,导致中标项目名单每个月都在变动。大型企业竞争舞台的机遇难得一见,但竞争却刚刚开始,呈现出异常激烈的局面。

而从这次华为释放的信息看,大模型的竞赛需要回归主航道。毕竟一方面在Scaling Law规律之下,全球前沿企业在技术上持续取得创新和进展,其中有许多隐秘、高价值的部分需要追赶;另一方面,发展新质生产力,产业AI是主战场,但在千行百业中,仍有很多难题亟待解决。

在大会中,华为常务董事、华为云CEO张平安展示了大量盘古大模型在企业核心场景的最新突破成果。张平安称,华为云与开发者一起深入到千行万业,解难题,做难事,为行业和企业带来实际价值,并强调盘古将继续在行业中攻坚克难。

01

盘古5.0的三项重大升级,旨在应对行业面临的难题挑战。

大会上公布了盘古大模型5.0有三个创新升级:全系列、多模态、强思维,尤其突出了模型升级与产业之间的联系,体现“从行业中来,到行业中去”。

华为云发布盘古5.0,大型模型竞赛重回主流。_图1

其中,全系列是大众在会前猜测最多的,人们认为盘古将从B端延伸到C端,但这次盘古推出了四个系列的模型,包含不同参数规格,有端侧也有云侧,体现了端云协同。比如十亿级参数的Pangu E系列可支撑手机、PC等端侧智能应用,百亿级参数的Pangu P系列适用于低时延、低成本的推理场景等。

对于多模态数据,这是今年非常热门的方向。虽然过去几年,业界主要专注于大型语言模型,但除了语言之外,还有图像、视频、音频等多模态数据,其数据量是文本数据的数倍乃至数千倍。业界许多企业正在致力于解决多模态大模型的挑战,希望统一不同模态的数据,实现理解和生成的一体化,从而能更好地理解、感知和决策物理世界。

从张平安的介绍来看,盘古大模型的多模态技术,与解决行业难题相关,也更多利用了华为在行业侧的资源。

它能更好、更精准地理解物理世界,包括文本、图片、视频,以及行业中更会涉及的雷达红外遥感等更多模态。在图片和视频识别方面,可支持10K超高分辨率。这些能力更能解决行业难题,如通过卫星遥感图像,盘古大模型就能准确分析出一个区域农作物的生长状况、收成状况,可用于农作物的产量预估、病虫害的监测等。

在内容生成方面,采用业界首创的STCG(Spatio Temporal Controllable Generation,可控时空生成)技术,聚焦自动驾驶、工业制造、建筑等多个行业场景,可生成更加符合物理规律的多模态内容。

华为云发布盘古5.0,大型模型竞赛重回主流。_图2

再如,对于图片和视频,强调可支持10K超高分辨率,因为这对精准理解和重构物理世界非常关键。

“物理世界就是多种模态的,大模型走进千行万业时,希望这些能力能带着盘古解决更多行业难题。”张平安说。

在强思维提升方面,华为云将思维链技术与一种“策略搜索”技术深度结合。业界对思维链并不陌生,它代表了大模型理解、推理的核心能力,而华为这次提出了“策略搜索”,不同于大热的“增强检索(RAG)”,RAG用于克制大模型的幻觉,而“策略搜索”是智能体用来适应变化并做出决策的过程。华为云称,两者结合,实现数学能力和复杂任务规划能力,是创造有价值行业助手的关键

从盘古5.0升级的信息来看,它紧跟全球大型模型技术的最新趋势,但同时,它重点关注从行业角度出发,技术升级仍然聚焦于“解决行业难题”,充分发挥华为在产业方面的优势。

比如,盘古5.0在演示生成能力时,不像年初Sora发布时放出的极具娱乐性和冲击性的视频,而是演示了如何重塑智能驾驶、工业设计、建筑设计等,行业人士会更体会到其中的意义。

以智能驾驶为例,有汽车制造企业人士告诉数智前线,在训练过程中,汽车制造企业采用大型模型进行数据生成,这是当前的一大趋势,但大多数是静态数据,例如交通流量等动态数据,年初Sora发布时,让他们看到了希望,但当时还不能完全满足要求。而在这次大会上,盘古率先展示了自动驾驶视频的生成。这改变了自动驾驶的训练方式。

华为云发布盘古5.0,大型模型竞赛重回主流。_图3

“盘古大模型同样可以生成风景视频和炫酷的科幻视频。”张平安指出,“但我们的努力方向并非仅限于此,大模型可以应用于各种场景,我们认为更重要的是解决行业内的关键问题。”

大会上,张平安也介绍了华为云在具身智能上的进展。业界有一种说法,当下多模态大模型正在演化成智能体Agent,帮助人们感知、理解和决策。当数字世界的Agent进入到物理世界,与硬件结合,这就是具身智能。令业界兴奋的是,大模型给具身机器人带来了思考能力。

华为云的盘古具身智能大模型,采用了以云助端方式,能让机器人完成10步以上的复杂任务规划。比如,夸父机器人现场演示在几种物品中识别出一瓶水,然后递到现场一名工作人员的手中。而盘古具身智能大模型还可以赋能多种形态的工业机器人和服务机器人。

Explanation: The original HTML content is returned as it is because it cannot be reasonably paraphrased without losing its meaning or structure.

华为云发布盘古5.0,大型模型竞赛重回主流。_图4

02

盘古如何在行业中“解难题”

在盘古5.0发布之际,华为云也介绍了过去近一年,盘古在行业中的落地进展。盘古是首个定位于行业的大模型,有风向标意义。

业界看到,虽然行业是大模型落地的主战场,但相对消费类场景,行业落地很难。IDC中国高级研究经理崔粲总结,过去一年有四类应用是行业的共性方向:一是知识问答,如客服及设备管理;二是视觉模型泛化增强,如安全生产监控;三是数据分析助手;四是专业内容生成。但这些应用在很多行业人士看来,不算颠覆性。因此,目前有两种截然不同的声音,一是积极拥抱,另一是认为业务与大模型之间还较遥远。

而从华为云在大会上公布的案例看,盘古已经深入到行业的核心场景,例如工业和制造领域,解决了核心的痛点,并且进展相对较快。分析多个行业的案例,盘古大模型也展示了一些典型的策略和路径。

在进入一个行业时,华为云首先与该行业的领先企业达成战略合作。比如在钢铁这个传统行业中,宝武钢铁集团是全球规模最大的企业,在国家发展新质生产力以及宝武集团全面推进AI战略转型的方针下,2023年,华为公司董事长梁华率团队拜访了宝武集团董事长胡望明,双方达成合作意向,提出共同研究现场问题的解决方案,形成钢铁冶金或工业领域的大型模型

其次是华为技术专家积极参与一线工作。张平安介绍,过去一年,华为有超过500名专家亲临一线现场,跑工地、进车间。他们与客户专家及一线工人一起梳理需求。在宝武集团,双方决定挑战高炉炼铁和热轧钢带难题

在热轧场景中,每次生产钢板的种类和尺寸不同时,都需要工程师重新调整参数,一次需要耗费约5天时间。客户期望通过大模型,降低热轧生产线调优时间,并提高预测精度和钢板成材率。再如,高炉被认为是“人工智能落地最具挑战性的应用场景”它是5000立方米的密闭系统,内部最高温度达2300摄氏度。如果使用盘古大模型,将密闭系统变得更加透明,甚至可完全理解其运作原理,指导高炉精准控制,每吨铁水就可减少1公斤焦炭消耗,成本可降低3元,有望每年为宝钢降本超过10亿元

再次,大模型是极致的系统工程。在每个行业“解难题”时,一方面离不开通用底座和行业大模型的智慧升级,另一方面要在工程化上做得透彻,包括数据问题,都是非常系统化的工程,只有抠得很细,才能有好的效果。

华为云发布盘古5.0,大型模型竞赛重回主流。_图5

目前盘古大模型已经在宝武钢铁集团1880热轧生产线上线,预测精度提高5%以上,钢板成材率提升0.5%,预计每年可以多产钢板2万余吨,年收益达9000余万元

在高炉场景中,双方一起在算法、数据、工程化多管齐下,解决高炉中上千种参数勾连耦合问题,以及数据误差大、高时滞性等问题,逐步将高炉变得“透明”、可控。

此外,从海内外前沿企业的探索看,大规模模型应用需要建立一站式业务平台,包含高性能框架、大算力、各种大规模模型,以及丰富的工具。华为云也在构建这样的大平台。就在一周前,华为云宣布在芜湖云节点上线,至此构建了三大核心枢纽的算力覆盖网络,一步步解决AI自主算力供应短缺问题。

过去一年,盘古大模型保持了一定的节奏。张平安介绍,盘古已在30多个行业,落地到超过400个应用场景。从进展看,大模型目前主要还在解决核心单点问题。未来,当它从一个环节进入多环节后,将可能成为“中枢”一类的角色,连通企业的数据中台、各种业务系统和知识库,最终彻底重塑产业的流程。

华为云发布盘古5.0,大型模型竞赛重回主流。_图6

03

实现行业价值,才是坚实的基础

最近几个月,大模型项目争夺和落地是市场的热点。一些大模型企业打响价格战。清华大学新闻学院元宇宙文化实验室主任沈阳认为,这说明各个大模型的功能和性能在快速接近,模仿GPT-4的阶段已基本告一段落,AI已从创新试验走向了大众推广阶段。随着规模急速扩张的阶段到来,市场份额成为首要关注点。“如果在这个阶段落伍的话,功能好(也)没有用了。”

一位大模型人士说,大模型价格竞争可能会重演安防市场的情景,“本来是很好的生意,因为价格竞争变得没那么好了”。另一位人士称,大家都是把性能较弱的模型降价了,而性能强的模型依然很贵,这样的降价,意义不大。还有人士认为,这一轮降价基本上是云厂商在打价格战,云厂商的策略是“羊毛出在猪身上”,即使API调用不赚钱,也可以通过其他服务赚钱,这也迫使一些非云端的大模型技术企业选择走向海外。

但更多的行业人士认为,大型模型价格的降低本质不应该只是价格的下降,而是最终能够实现正向ROI。大型模型的价格下调短期内可能会促进更多的尝试和试用,但要发挥积极作用,还需要考虑是否为客户创造了业务价值。

“客户对于最终产出物的核心关注点,就是投资回报率(ROI)。”一位应用开发资深行业人士告诉数智前线,他当下正在实施多个大规模行业项目,“ROI的计算直接反映了效果,甚至可以用一些更为直观的方式来表达。例如,成本节省的具体数额,新客户和客户转化率的量化数据,以及工作效率的提升情况。”毕竟大规模项目与早期互联网的运营方式存在显著差异。大规模项目的边际成本依然相当高,每增加一个用户,基础设施成本的增加是显而易见的。这与早期互联网公司靠“烧钱赢得市场”的策略完全不同。

而作为一种潜力巨大的新兴技术,以大模型为代表的人工智能,已成为发展新质生产力的重要引擎,尤其中国具有全球门类最齐全、体系最完整的工业体系,大模型与产业的结合,潜力更为巨大。今年开年,政府工作报告明确提出开展“人工智能+”行动。“人工智能+”已经成为国策。

从张平安的演讲中看出,华为云坚持AI for industries战略,深入行业,解决行业难题,靠价值打开巨大的产业空间,从而加速形成新质生产力。而“从产业中来,到产业中去”的路径,在当下诸多的挑战和竞争中,也更有可能把握住大模型最为关键的发展大潮。

0
分享到:
没有账号? 忘记密码?