人形机器人的理想与现实（人形机器人未来发展前景是什么）

李开复曾提到过一个人工智能界流传的“骗子又来了曲线”。人们不断地对机器进行“是否具有人类智能”的评估，这个过程通常从人工智能在某些领域惊艳表现开始，逐渐认识到当前人工智能的各种局限性，从而产生巨大的心理落差。

近来，人形具身智能机器人在WAIC世界人工智能大会上密集亮相，我们在现场所感受到的就是“人类前景堪忧”与“骗子又现身了”，两种声音同时存在的复杂现象。

1. 人形机器人的理想与现实
2. 人工智能与真实之理_图1

具体来说，认为“人类将毁灭”的观点，大多来自于不熟悉情况的普通观众，而对人形机器人持冷静态度甚至不看好的大多是人工智能和机器人领域的专业人士。

比如猎豹移动董事长兼CEO、猎户星空董事长傅盛就表示，“机器人在今年的展厅里是爆发了，但在日常生活当中，我们并没有看到它在哪个地方被大规模用起来。机器人行业的产业爆发还远远没有到来……对人形机器人的不看好一定会被时间证明”。

这两种态度，究竟哪一种才能真正反映人形机器人产业的本质呢？

其实并没有什么真相。不同的心态，是由不同的判定标准而产生的。大众、从业者和技术专家，都有一张“我心中的人形机器人”打分表，评价尺度各不相同。

而关于人形机器人的期待，在人形、大模型、具身三个标准上，大众的预期、媒体的宣传、产业的实际进展等都有比较大的分野。这构成了当前，人形机器人的理想与现实。

“变形金刚”的理想与现实

在《变形金刚》系列中，理想化的未来科技世界充满了高科技的机器人，它们拥有超凡的力量与智慧，维护和平、正义，保护无辜的生命。这些机器人能够在汽车、飞机等多种形态之间转换，象征着技术的无限可能和美好未来的愿景。然而，在现实中，我们面对的技术发展虽迅速但仍有限，现实中的机器人技术虽然取得了显著进步，但离这种理想化的未来仍有很大的距离。

“他们为什么不动呢？不表演的话，插电源有什么必要？”

“插电亮着好看。”

本届WAIC最吸睛的，就是中央展厅的“十八金刚”了。18个人形机器人同台而立，展示了最前沿的机器人技术和设计，几乎每个参观者都聚集在展台前打卡拍照，流连忘返。在展台旁边，我听到了这段对话。

大众理想中，人形机器人就是变形金刚、机甲战士那样，走路又稳又快，行动灵活，随意移动，无论是工厂上班、护理老人还是投递包裹，都手拿把掐。

1. 人形机器人的理想与现实
2. 人工智能与真实之理_图2

但在产业实际应用中，WAIC上的人形机器人大部分时间都呆在展台上，在特定时刻执行一些像拿苹果、端杯子之类的手部动作，而特斯拉的机器人甚至一直静止不动地放置在玻璃展柜中。与全场四处走动的机器狗相比，人形机器人显得更加“内向”。

从这里可以看出，是否需要“双足行走”已经成为当前公众和从业者对人形机器人的主要认知差异。

总的来说，双足人形机器人是“机器人的皇冠”，是终极方向，才是大众期待的“变形金刚”。

但至少要走过三步：双足行走、执行复杂任务、规模商用。

而目前，仅仅是第一步“双足行走”，在技术和商业上都并不是最佳状态。

一方面，稳定的行走，需要系统具备极高的稳定性。

当机器人面对各种异常情况和输入时，它能够迅速通过运动控制模块调整姿态，确保正常运行。

要提升系统的鲁棒性（或者说稳健性），需要依赖机器人与人类在真实世界中的实际互动，以获取高质量数据。如果遇到训练环境中未曾出现过的问题，机器人可能会出现异常或“死机”，这会显著降低系统研发的效率。

1. 人形机器人的理想与现实
2. 人工智能与真实之理_图3

此外，商业上“双足行走”也不是必须的。

比如特斯拉、Figure等都宣布要让人形机器人“进厂打工”，从事电池分拣等工作。但实际上，制造环节80%以上生产作业动作，其实很少用到下肢，用到躯干，主要是靠手来完成的。这种上肢为主的简单系统，可以减少控制难度，降低投入成本，并且更容易规模化量产，因为只需要将最重要的一部分功能（手部）进行复制。一旦加上四肢、躯干，控制难度、续航、成本都会大幅提升。

原文中已经涵盖了内容的主要观点和信息，因此无需进行进一步的扩写。

因此，目前能够大规模应用的机器人形态，都是以机器狗、机械手等单一、简约形态。满足公众期待的“变形金刚”，需要经过许多步骤，才能带来巨大的产业效应。

在未来几年的时间里，我们可以预见到人形机器人将会越来越频繁地出现在各种展台和展柜中，取代传统的零距离互动形式。这些机器人可能会被用于展示先进的科技成果、进行现场演示，或者作为展览的一部分来吸引观众的注意力和兴趣。

大模型的理想与现实

“现场机器人数量众多，我感觉主题有点偏离了”，一位计算领域的从业者对我说道。

智能机器人在人工智能大会上遍地开花，根本逻辑是——大模型为具身智能开启了新的解决方案的大门。

传统的人工智能系统，受限于缺乏先验知识，理解力与泛化能力捉襟见肘，导致机器人难以像人类一样拥有基本的常识判断能力，这严重制约了高级别具身智能的发展。机器人执行任务时，往往需要人类工程师将复杂指令拆解为一系列简化的、程序化的步骤，再由机器人（如机械臂）逐一执行。显然，这种“智能水平”并不算很高，还需要人来做大量的代码和开发工作。

1. 人形机器人的理想与现实
2. 人工智能与真实之理_图4

理想中，大型AI模型将会为人形机器人的“智能水平”带来革命性的改变。

大模型相较于传统机器学习方法，具有更强的泛化能力，能够为人形机器人执行各种任务，如复杂任务解析、流畅连续对话、零样本推理等，提供全新的解决方案。

举例来说，当你告诉一个人形机器人“我饿了”，它能够自动分析这句话背后的需求，并将其拆解为可以执行的具体动作。通过观察周围的物理环境，它可以从冰箱里拿出一个苹果给你吃，而无需人类来逐步指导。

但现实中，大型模型对人形机器人带来的变革仍然仅限于基础的“自然语言交互”。

目前绝大多数人形机器人，更多是具备了类似于ChatGPT的“口才”。这种结合，虽然可以提供更自然生动的互动体验，但仅仅是将现有的语音交互提升了一级，并没有实现完全颠覆式的端到端任务执行能力。

1. 人形机器人的理想与现实
2. 人工智能与真实之理_图5

无需人工参与的高度自动化，为何大模型未能快速实现？

究其根本，机器人是一个非常复杂的学科，涉及精密机械、自动控制、电气电子、计算科学，最后呈现出一个非常复杂智能机电一体化系统。

从有监督机器学习到大语言模型，是计算领域的技术突破，可以在交互、规划、决策等环节发挥作用。然而，从机械化到高度自动化，人形机器人的再进化，还需要感知技术、驱动与传动技术、万兆网络等的技术和资源支持。

国产机器人崛起的理想与现实

“美国公司负责扩展概念，中国公司负责将机器人应用于实际场景，推广商业化，降低成本，从而使每个人都能享受机器人技术的自由。”

此次WAIC大会，国产人形机器人的表现确实要比海外公司亮眼很多。无论是特斯拉、谷歌，在机器人的展示上都堪称乏味。而国产人形机器人不仅批量化、大规模出现，而且展现出了在很多具体场景中的商用能力，比如做饭机器人、电信机器人、家政陪伴机器人等。

1. 人形机器人的理想与现实
2. 人工智能与真实之理_图6

那么，这是否意味着国内制造人形机器人的公司将迅速兴起呢？

我们当然希望这一天能尽快实现，但目前来看现实还有不确定性。

数据层面，特斯拉、谷歌等科技巨头，在自动驾驶领域有多年积累，可以将大量空间数据输入模型，解决人形机器人在复杂环境中的学习难题，进而更好地进行迭代学习。而在WAIC现场，我们看到的大多数国产人形机器人厂商的业务仍相对孤立，百度、商汤等积累了丰富数据的AI公司，则更专注于汽车形态的智能机器人。这表明，解决人形机器人的数据挑战需要生态化、产业化和多方共建的解决方案。

算法层面，类GPT-4o能力的国产多模态大模型还比较稀缺，这使得人形机器人通过视觉、音频等多维度数据来识别地图和复杂场景的能力，大大受到限制。目前，海外产学界已经在多模态大模型上系统性发力。比如OpenAI基于GPT-4o为Figure 01构建了一个具身智能AI模型，谷歌推出了多模态具身视觉语言模型PaLM-E。加州大学伯克利分校推出了LM Nav，来实现硬件本体、运动小脑、决策大脑三部分逐渐融合。目前来看，国产基础大模型还有一段路要追赶。

1. 人形机器人的理想与现实
2. 人工智能与真实之理_图7

发展国产人形机器人产业，是一条困难但正确的道路。在这条路上，我们既不希望“骗子又来了”，也不希望“人类被毁灭了”。历史告诉我们，技术发展过程中一定会经历上升、顶峰、陷入低谷、攀升、稳定5个阶段。

人形机器人产业要避免跌入低谷，持续发展，就要在理想与现实中，不断校正自己的坐标，在每一个发展阶段兑现实用价值。

原文已经是中文，并且没有不合理或需要扩写的内容，因此直接返回原文。

猜你喜欢