2026年6月18日

人形机器人核心技术与零部件拆解：从大脑、小脑到执行器

拆解人形机器人的大脑、小脑、执行器、传动、感知、灵巧手、芯片和数据闭环，梳理短中长期产业链价值。

上一篇笔记主要讨论具身智能与人形机器人的产业定位、行业阶段和主要公司路线。这一篇继续往下拆，重点看一个更底层的问题：人形机器人到底由哪些核心技术和零部件构成，哪些环节短期更容易受益，哪些环节可能形成长期壁垒。

人形机器人不是单一算法，也不是单一硬件，而是高度复杂的系统工程。强大的大模型无法弥补不可靠的执行器，低成本关节也无法弥补任务理解和数据闭环不足；能走路不等于能干活，能展示不等于能在客户场景里长期稳定运行。

因此，研究人形机器人，不能只看整机视频，也不能只看某一个热门零部件。更好的方法，是把机器人拆成“大脑、小脑、肌肉、骨骼、感官、手、芯片和训练系统”，再分别判断技术难点、产业链位置和商业化节奏。

一、系统工程：从单点突破到整机闭环

人形机器人的商业化难点，在于它必须同时满足智能、运动、操作、安全、成本和可靠性。任何一个环节短板过长，都会限制整机进入真实工作场景。

一个较完整的人形机器人系统，可以拆成八个层级：大脑模型、小脑控制、执行器、传动系统、感知系统、灵巧手、芯片层和数据仿真系统。

系统模块	核心功能	关键部件/技术	商业化意义
大脑	任务理解、规划、交互	多模态模型、VLA、世界模型	决定泛化和人机交互能力
小脑	步态、平衡、全身控制	MPC、WBC、强化学习、伺服控制	决定稳定性和安全性
执行器	输出力和运动	电机、伺服、直线/旋转执行器	决定力量、速度和成本
传动	力矩放大和运动转换	减速器、丝杠、齿轮、轴承	决定精度、寿命和成本
感知	环境、自身和接触感知	视觉、IMU、力觉、触觉	决定能否理解真实世界
灵巧手	抓取和操作	空心杯电机、触觉、腱绳	决定能否真正干活
芯片	推理、控制、驱动、通信	AI SoC、MCU、驱动芯片、功率半导体	决定实时性和边缘智能
数据与仿真	训练和迭代	遥操作、实训场、仿真平台	决定能力持续进化

这八层之间不是线性关系，而是互相制约。比如灵巧手需要更好的小型执行器和触觉传感器，也需要操作数据和抓取算法；双足运动需要本体结构、执行器响应、传动寿命、IMU、力控和实时控制系统共同配合；大脑模型再强，也必须通过安全、低延迟、可解释的控制链条落到真实动作上。

所以，人形机器人产业链的研究重点，不是寻找一个万能零部件，而是判断哪些模块在当前阶段最先形成订单，哪些模块会随着保有量增加形成长期壁垒。

二、大脑与小脑：理解任务和稳定执行

“大脑”负责任务理解、语言交互、视觉理解、任务规划和常识推理。当前 VLA 模型是具身智能的重要方向，它试图把视觉、语言和动作统一起来，让机器人不再为每个任务单独编程，而是通过多模态理解、示范学习和动作生成完成更多任务。

但 VLA 并不意味着机器人马上具备通用劳动能力。机器人面临的数据比互联网文本更稀缺，也更昂贵。它不仅需要知道“杯子在哪里”，还要知道杯子是否易碎、是否装了水、拿起时需要多大力、移动过程中如何保持稳定、放下时如何避免碰撞。这些都涉及真实物理世界的接触、摩擦、重心、柔性物体和长尾异常。

短期更现实的路线，可能不是让大模型直接控制所有动作，而是分层控制：大模型负责高层任务规划和人机交互，传统控制系统负责底层安全和实时执行，中间通过模仿学习、强化学习和 VLA 技能模型连接。

“小脑”负责步态、平衡、全身协调、轨迹规划、力控和安全控制。双足机器人比轮式机器人和固定机械臂更难，因为它本身就是动态平衡系统。机器人搬运物体、伸手操作、转身避障时，重心和受力都在变化。

工业客户并不关心机器人是否会跳舞，而关心它能否在狭窄工位里稳定移动、搬运时不摔倒、异常时能停机或恢复、长时间运行后是否需要频繁维护。也就是说，小脑能力决定机器人从展示平台走向作业平台的底线。

三、执行器、传动与灵巧手：硬件价值量的核心

执行器是人形机器人的“肌肉”，也是短期硬件价值量最集中的环节之一。人形机器人通常拥有几十个自由度，每个关键关节都需要电机、减速、编码、力矩反馈、驱动器和结构件集成。执行器要在扭矩密度、响应速度、散热、寿命、体积和成本之间做平衡。

不同部位对执行器的要求并不相同。腿部和髋膝踝关节更强调承载、冲击和稳定性；肩肘腕关节更强调灵活性和响应速度；灵巧手则需要小体积、高精度和多自由度。高扭矩关节、直线执行器、一体化关节和微型执行器，分别对应不同的技术路线。

传动系统决定力量、精度、寿命和成本。谐波减速器适合部分精密旋转关节，行星滚柱丝杠适合直线执行器和高负载推拉场景，齿轮、行星减速器、轴承和腱绳传动也各有适用范围。

这里最需要避免的是简单线性外推。某一家公司采用直线执行器，并不代表所有人形机器人都会大量使用行星滚柱丝杠；某一机型采用某种关节方案，也不代表这个方案会成为行业标准。不同公司在成本、负载、速度、可靠性和供应链上的取舍不同，最终会形成多路线并存。

灵巧手是从“会动”到“能干活”的关键。真实商业任务中，大量价值不是来自机器人走过去，而是来自它能不能用手完成操作，比如插拔线束、拧瓶盖、开门、拿取柔性物体、使用工具、上下料、整理物品等。

灵巧手涉及空心杯电机、微型减速器、腱绳材料、触觉传感、柔性电子、抓取算法和操作数据。它既是硬件问题，也是算法和数据问题。未来如果人形机器人真的进入工业柔性任务、康养服务和家庭场景，灵巧手可能成为长期壁垒很高的环节。

四、感知与芯片：从“看见”到“理解接触”

感知系统可以分为环境感知、本体感知和接触感知。视觉、深度相机和激光雷达帮助机器人理解空间、障碍物和目标位置；IMU、编码器和关节传感器帮助机器人知道自身姿态；六维力传感器、触觉传感器和电子皮肤决定机器人能否感知抓取、滑动、接触和外力。

移动阶段主要依赖视觉和空间感知，真实操作阶段力觉和触觉的重要性会快速上升。一个机器人能够走到桌边，只说明它完成了移动；能否拿起柔软物体、插入接口、拧紧零件、处理异常接触，才真正考验感知和控制闭环。

芯片层也需要单独拆解。机器人不是只需要 AI 芯片。它既需要 AI SoC/GPU/NPU 运行视觉、多模态和 VLA 推理，也需要 CPU 或边缘计算模块进行操作系统、调度和数据处理；需要 MCU/DSP/FPGA 做低延迟实时控制；需要电机控制芯片和功率半导体驱动执行器；需要传感器信号链处理力觉、触觉、IMU 和视觉数据；还需要通信与安全芯片支持远程运维和数据保护。

芯片类别	作用	对应系统
AI SoC/GPU/NPU	视觉、多模态、VLA 和任务推理	大脑
CPU/边缘计算模块	操作系统、调度、数据处理	中央计算
MCU/DSP/FPGA	低延迟实时闭环控制	小脑和关节
电机控制芯片	FOC、速度/位置/力矩控制	执行器
功率半导体	电能转换和电机驱动	肌肉和能源
传感器信号链	采样、放大、滤波、模数转换	感官
通信/安全芯片	内部总线、远程运维、加密	神经系统和安全

因此，机器人芯片研究不能只看“谁提供 AI 算力”，还要看实时控制、驱动、传感信号链和安全通信。AI 芯片决定上层智能，小脑控制和肌肉驱动决定机器人能不能稳定、安全、低延迟地把智能转化为动作。

五、数据、仿真与实训场：长期壁垒的来源

具身智能区别于传统机器人的关键，不只在于硬件更像人，而在于它需要通过数据持续进化。语言模型可以从互联网获得海量文本和图像数据，但机器人需要真实动作轨迹、力觉触觉、任务结果、失败样本和人工接管过程。

仿真平台可以降低训练成本，但无法完全替代真实接触、摩擦、柔性物体和长尾异常。未来竞争很可能变成“实训场 + 遥操作 + 真实部署 + 仿真平台”的数据闭环竞争。谁能进入更多真实场景，采集更高质量的数据，并把数据转化为模型、控制和技能库升级，谁就可能建立长期壁垒。

从产业链受益节奏看，短期硬件零部件弹性更明确，尤其是执行器、电机、减速器、丝杠、传感器、灵巧手、芯片和结构件。中期要看整机交付、系统集成和运维服务。长期真正重要的，可能是机器人基础模型、操作系统、技能库、数据平台和仿真实训体系。

环节	短期确定性	长期壁垒	主要风险
执行器/电机	高	中高	主机厂自研和价格下降
减速器/丝杠	高	中	路线差异和用量不确定
力觉/触觉	中	高	短期出货较少，标准未定
芯片	中	高	AI 芯片与控制芯片逻辑不同
整机厂	中	高	研发和运维成本高
系统集成	中高	中	项目制和复制难度
软件/数据	低到中	很高	短期商业模式不清晰

这也给后续跟踪提供了一个基本框架：短期看样机和小批量交付带来的硬件需求，中期看真实客户场景和系统集成能力，长期看数据闭环和软件平台化。对于上市公司映射，也不能停留在概念标签，而要核验产品位置、客户验证、量产阶段、收入贡献和毛利率。

人形机器人产业最容易被高估的地方，是把展示能力等同于作业能力；最容易被低估的地方，是从作业能力到规模化部署之间，还有大量工程、供应链、运维、数据和安全认证工作要做。核心技术和零部件的价值，最终都要回到一个问题：它是否能让机器人在真实场景里更稳定、更便宜、更安全、更可复制地完成任务。

上述内容仅为个人学习和研究目的，不构成任何投资建议，也不保证信息完整、准确或及时。涉及公司、行业、市场和策略的内容，都应被视为阶段性观察，而不是确定性结论。