人形机器人核心技术与零部件拆解:从大脑、小脑到执行器
拆解人形机器人的大脑、小脑、执行器、传动、感知、灵巧手、芯片和数据闭环,梳理短中长期产业链价值。
上一篇笔记主要讨论具身智能与人形机器人的产业定位、行业阶段和主要公司路线。这一篇继续往下拆,重点看一个更底层的问题:人形机器人到底由哪些核心技术和零部件构成,哪些环节短期更容易受益,哪些环节可能形成长期壁垒。
人形机器人不是单一算法,也不是单一硬件,而是高度复杂的系统工程。强大的大模型无法弥补不可靠的执行器,低成本关节也无法弥补任务理解和数据闭环不足;能走路不等于能干活,能展示不等于能在客户场景里长期稳定运行。
因此,研究人形机器人,不能只看整机视频,也不能只看某一个热门零部件。更好的方法,是把机器人拆成“大脑、小脑、肌肉、骨骼、感官、手、芯片和训练系统”,再分别判断技术难点、产业链位置和商业化节奏。
一、系统工程:从单点突破到整机闭环
人形机器人的商业化难点,在于它必须同时满足智能、运动、操作、安全、成本和可靠性。任何一个环节短板过长,都会限制整机进入真实工作场景。
一个较完整的人形机器人系统,可以拆成八个层级:大脑模型、小脑控制、执行器、传动系统、感知系统、灵巧手、芯片层和数据仿真系统。
| 系统模块 | 核心功能 | 关键部件/技术 | 商业化意义 |
|---|---|---|---|
| 大脑 | 任务理解、规划、交互 | 多模态模型、VLA、世界模型 | 决定泛化和人机交互能力 |
| 小脑 | 步态、平衡、全身控制 | MPC、WBC、强化学习、伺服控制 | 决定稳定性和安全性 |
| 执行器 | 输出力和运动 | 电机、伺服、直线/旋转执行器 | 决定力量、速度和成本 |
| 传动 | 力矩放大和运动转换 | 减速器、丝杠、齿轮、轴承 | 决定精度、寿命和成本 |
| 感知 | 环境、自身和接触感知 | 视觉、IMU、力觉、触觉 | 决定能否理解真实世界 |
| 灵巧手 | 抓取和操作 | 空心杯电机、触觉、腱绳 | 决定能否真正干活 |
| 芯片 | 推理、控制、驱动、通信 | AI SoC、MCU、驱动芯片、功率半导体 | 决定实时性和边缘智能 |
| 数据与仿真 | 训练和迭代 | 遥操作、实训场、仿真平台 | 决定能力持续进化 |
这八层之间不是线性关系,而是互相制约。比如灵巧手需要更好的小型执行器和触觉传感器,也需要操作数据和抓取算法;双足运动需要本体结构、执行器响应、传动寿命、IMU、力控和实时控制系统共同配合;大脑模型再强,也必须通过安全、低延迟、可解释的控制链条落到真实动作上。
所以,人形机器人产业链的研究重点,不是寻找一个万能零部件,而是判断哪些模块在当前阶段最先形成订单,哪些模块会随着保有量增加形成长期壁垒。
二、大脑与小脑:理解任务和稳定执行
“大脑”负责任务理解、语言交互、视觉理解、任务规划和常识推理。当前 VLA 模型是具身智能的重要方向,它试图把视觉、语言和动作统一起来,让机器人不再为每个任务单独编程,而是通过多模态理解、示范学习和动作生成完成更多任务。
但 VLA 并不意味着机器人马上具备通用劳动能力。机器人面临的数据比互联网文本更稀缺,也更昂贵。它不仅需要知道“杯子在哪里”,还要知道杯子是否易碎、是否装了水、拿起时需要多大力、移动过程中如何保持稳定、放下时如何避免碰撞。这些都涉及真实物理世界的接触、摩擦、重心、柔性物体和长尾异常。
短期更现实的路线,可能不是让大模型直接控制所有动作,而是分层控制:大模型负责高层任务规划和人机交互,传统控制系统负责底层安全和实时执行,中间通过模仿学习、强化学习和 VLA 技能模型连接。
“小脑”负责步态、平衡、全身协调、轨迹规划、力控和安全控制。双足机器人比轮式机器人和固定机械臂更难,因为它本身就是动态平衡系统。机器人搬运物体、伸手操作、转身避障时,重心和受力都在变化。
工业客户并不关心机器人是否会跳舞,而关心它能否在狭窄工位里稳定移动、搬运时不摔倒、异常时能停机或恢复、长时间运行后是否需要频繁维护。也就是说,小脑能力决定机器人从展示平台走向作业平台的底线。
三、执行器、传动与灵巧手:硬件价值量的核心
执行器是人形机器人的“肌肉”,也是短期硬件价值量最集中的环节之一。人形机器人通常拥有几十个自由度,每个关键关节都需要电机、减速、编码、力矩反馈、驱动器和结构件集成。执行器要在扭矩密度、响应速度、散热、寿命、体积和成本之间做平衡。
不同部位对执行器的要求并不相同。腿部和髋膝踝关节更强调承载、冲击和稳定性;肩肘腕关节更强调灵活性和响应速度;灵巧手则需要小体积、高精度和多自由度。高扭矩关节、直线执行器、一体化关节和微型执行器,分别对应不同的技术路线。
传动系统决定力量、精度、寿命和成本。谐波减速器适合部分精密旋转关节,行星滚柱丝杠适合直线执行器和高负载推拉场景,齿轮、行星减速器、轴承和腱绳传动也各有适用范围。
这里最需要避免的是简单线性外推。某一家公司采用直线执行器,并不代表所有人形机器人都会大量使用行星滚柱丝杠;某一机型采用某种关节方案,也不代表这个方案会成为行业标准。不同公司在成本、负载、速度、可靠性和供应链上的取舍不同,最终会形成多路线并存。
灵巧手是从“会动”到“能干活”的关键。真实商业任务中,大量价值不是来自机器人走过去,而是来自它能不能用手完成操作,比如插拔线束、拧瓶盖、开门、拿取柔性物体、使用工具、上下料、整理物品等。
灵巧手涉及空心杯电机、微型减速器、腱绳材料、触觉传感、柔性电子、抓取算法和操作数据。它既是硬件问题,也是算法和数据问题。未来如果人形机器人真的进入工业柔性任务、康养服务和家庭场景,灵巧手可能成为长期壁垒很高的环节。
四、感知与芯片:从“看见”到“理解接触”
感知系统可以分为环境感知、本体感知和接触感知。视觉、深度相机和激光雷达帮助机器人理解空间、障碍物和目标位置;IMU、编码器和关节传感器帮助机器人知道自身姿态;六维力传感器、触觉传感器和电子皮肤决定机器人能否感知抓取、滑动、接触和外力。
移动阶段主要依赖视觉和空间感知,真实操作阶段力觉和触觉的重要性会快速上升。一个机器人能够走到桌边,只说明它完成了移动;能否拿起柔软物体、插入接口、拧紧零件、处理异常接触,才真正考验感知和控制闭环。
芯片层也需要单独拆解。机器人不是只需要 AI 芯片。它既需要 AI SoC/GPU/NPU 运行视觉、多模态和 VLA 推理,也需要 CPU 或边缘计算模块进行操作系统、调度和数据处理;需要 MCU/DSP/FPGA 做低延迟实时控制;需要电机控制芯片和功率半导体驱动执行器;需要传感器信号链处理力觉、触觉、IMU 和视觉数据;还需要通信与安全芯片支持远程运维和数据保护。
| 芯片类别 | 作用 | 对应系统 |
|---|---|---|
| AI SoC/GPU/NPU | 视觉、多模态、VLA 和任务推理 | 大脑 |
| CPU/边缘计算模块 | 操作系统、调度、数据处理 | 中央计算 |
| MCU/DSP/FPGA | 低延迟实时闭环控制 | 小脑和关节 |
| 电机控制芯片 | FOC、速度/位置/力矩控制 | 执行器 |
| 功率半导体 | 电能转换和电机驱动 | 肌肉和能源 |
| 传感器信号链 | 采样、放大、滤波、模数转换 | 感官 |
| 通信/安全芯片 | 内部总线、远程运维、加密 | 神经系统和安全 |
因此,机器人芯片研究不能只看“谁提供 AI 算力”,还要看实时控制、驱动、传感信号链和安全通信。AI 芯片决定上层智能,小脑控制和肌肉驱动决定机器人能不能稳定、安全、低延迟地把智能转化为动作。
五、数据、仿真与实训场:长期壁垒的来源
具身智能区别于传统机器人的关键,不只在于硬件更像人,而在于它需要通过数据持续进化。语言模型可以从互联网获得海量文本和图像数据,但机器人需要真实动作轨迹、力觉触觉、任务结果、失败样本和人工接管过程。
仿真平台可以降低训练成本,但无法完全替代真实接触、摩擦、柔性物体和长尾异常。未来竞争很可能变成“实训场 + 遥操作 + 真实部署 + 仿真平台”的数据闭环竞争。谁能进入更多真实场景,采集更高质量的数据,并把数据转化为模型、控制和技能库升级,谁就可能建立长期壁垒。
从产业链受益节奏看,短期硬件零部件弹性更明确,尤其是执行器、电机、减速器、丝杠、传感器、灵巧手、芯片和结构件。中期要看整机交付、系统集成和运维服务。长期真正重要的,可能是机器人基础模型、操作系统、技能库、数据平台和仿真实训体系。
| 环节 | 短期确定性 | 长期壁垒 | 主要风险 |
|---|---|---|---|
| 执行器/电机 | 高 | 中高 | 主机厂自研和价格下降 |
| 减速器/丝杠 | 高 | 中 | 路线差异和用量不确定 |
| 力觉/触觉 | 中 | 高 | 短期出货较少,标准未定 |
| 芯片 | 中 | 高 | AI 芯片与控制芯片逻辑不同 |
| 整机厂 | 中 | 高 | 研发和运维成本高 |
| 系统集成 | 中高 | 中 | 项目制和复制难度 |
| 软件/数据 | 低到中 | 很高 | 短期商业模式不清晰 |
这也给后续跟踪提供了一个基本框架:短期看样机和小批量交付带来的硬件需求,中期看真实客户场景和系统集成能力,长期看数据闭环和软件平台化。对于上市公司映射,也不能停留在概念标签,而要核验产品位置、客户验证、量产阶段、收入贡献和毛利率。
人形机器人产业最容易被高估的地方,是把展示能力等同于作业能力;最容易被低估的地方,是从作业能力到规模化部署之间,还有大量工程、供应链、运维、数据和安全认证工作要做。核心技术和零部件的价值,最终都要回到一个问题:它是否能让机器人在真实场景里更稳定、更便宜、更安全、更可复制地完成任务。
上述内容仅为个人学习和研究目的,不构成任何投资建议,也不保证信息完整、准确或及时。 涉及公司、行业、市场和策略的内容,都应被视为阶段性观察,而不是确定性结论。