前言:
近日的[2025小鹏科技日]舞台灯光亮起,一款身形优雅的[女性形态]机器人踩着轻盈的猫步缓缓走出时,全场观众的呼吸似乎都暂停了一瞬。
然而,这份[惊艳]在24小时内迅速发酵成一场全网热议的[真人争议]。
一场关于[机器人是否是真人]的讨论,意外成了观察中国具身智能产业的放大镜。
作者| 方文三
图片来源|网 络
从[猫步惊艳]到[解剖自证]的48小时
这场争议的核心,本质是技术逼真度与大众认知的碰撞。
回溯整个事件的48小时时间线,每一个节点都折射出人形机器人产业的特殊处境。
科技日现场,IRON机器人的出场环节本是小鹏[物理AI]战略的重头戏。
根据现场视频,这款身高178厘米、体重70公斤的机器人,并非机械地[走路],而是真正意义上的[走秀]。
脚尖先着地,脚跟随后跟进,身体重心随步伐左右微调,甚至有轻微的胯部摆动。
这种拟人化细节让在场的科技媒体惊呼[第一次在机器人身上看到了优雅],但也为后续的争议埋下伏笔。
有网友截取视频截图,指出IRON的[耳朵]轮廓若隐若现,疑似真人耳朵的形状;背部的拉链设计[过于刻意],像是为了方便真人穿脱。
面对愈演愈烈的争议,11月6日,何小鹏发布的回应视频中,没有多余的辩解,直接切入拆解开示环节。
工作人员先是让IRON抬起手臂,展示手部16毫米直径的行业最小谐波关节,证明其手部尺寸远小于人类手掌。
随后拉开背部拉链,内部金属骨架与线路清晰可见,何小鹏还特意贴近机器人,让镜头捕捉到散热系统的风扇噪音。
最后,他针对耳朵争议给出特写,所谓的[耳朵]其实是两组高灵敏麦克风阵列,用于听觉交互与环境收音。
在11月6日晚间,小鹏再次放出终极自证视频,在IRON通电运行的状态下,工作人员用剪刀直接剪开其小腿的柔性皮肤与仿生肌肉层,露出内部的机械骨骼与执行器。
令人惊叹的是,即便腿部结构暴露,IRON仍能稳稳走完一段猫步,何小鹏在视频中感慨:[这是最后一次证明它是机器人,希望大家愿意相信,能走出猫步的机器人,是中国企业造出来的。]
这场[自证]最终引来行业大佬的关注,11月7日,特斯拉CEO马斯克在采访中谈及此事,直言[特斯拉和中国公司将主导人形机器人市场,我非常尊重中国的竞争对手,他们有很多聪明且勤奋的人]。
IRON机器人的[拟人化]密码
争议的背后,是IRON机器人在拟人化技术上的突破性进展。
要理解它为何能引发误解,需要从骨骼-肌肉-皮肤的硬件架构,到大脑-神经的软件系统,逐层拆解其技术逻辑。
①硬件:82个自由度的类人躯体
人形机器人的核心挑战,是在有限的重量与空间内,实现接近人类的运动灵活性。
小鹏IRON给出的答案是82个主动自由度+22个手部自由度的配置,这个数据放在全球范围内都处于第一梯队。
所谓自由度,通俗理解就是机器人关节的活动维度。人类全身约有206块骨头,通过关节实现复杂运动。而IRON的82个自由度,重点集中在关键运动部位。
仿人脊柱设计是核心突破之一,传统机器人的躯干多为刚性结构,而IRON的脊柱采用分段式柔性设计,能实现弯腰、扭转、侧倾等细微动作,这也是它走猫步时能有腰部扭动的关键。
肩部采用球窝关节+运输固定器组合,既保证了手臂活动的广度,又能在搬运物品时保持稳定。
手部则是精细化操作的核心,22个自由度意味着它能完成抓握、捏取、旋拧等动作,比如拿起一支笔写字、打开矿泉水瓶盖,甚至整理文件。
这些动作在工业场景中,此前只能由人类或专用机械臂完成。
更关键的是,IRON采用了全固态电池技术,这款电池实现了轻量化、超高能量密度与安全的平衡,使机器人重量控制在70公斤,同时保障了长续航。
全固态电池的应用,不仅解决了安全问题,更让IRON的步态轻盈有了物理基础,重量减轻30%,功率提升30%,才能实现[脚尖着地]的细腻动作。
②软件:VLA 2.0的端到端智能
如果说硬件是IRON的[躯体],那么小鹏第二代VLA大模型就是它的[大脑]。这款被定义为[物理世界大模型]的技术,是IRON实现[自然运动]的核心。
传统的VLA模型需要经过视觉感知→语言转译→动作生成三个步骤。
比如看到杯子,先转译为[这是一个需要拿起的杯子],再生成[伸手-抓握-抬起]的动作指令。
这个过程不仅延迟高,还容易丢失视觉细节,比如杯子的材质、摆放角度。
而小鹏的VLA 2.0模型,直接去掉了语言转译环节,实现[视觉信号→动作指令]的端到端生成。就像人类看到杯子会下意识伸手,无需在脑中默念指令。
这种端到端能力,让IRON的反应速度大幅提升,基于VLA 2.0,小鹏汽车的[小路NGP]功能接管里程提升13倍,而在机器人身上,这种能力转化为动态适应。
比如行走时遇到突然出现的障碍物,IRON能在0.5秒内调整步态绕行,而无需经过复杂的指令计算;
在与人交互时,它能通过视觉捕捉人类的手势,直接生成引导动作,无需语言指令。
此外,IRON还搭载了3颗小鹏自研的图灵AI芯片,总算力达2250TOPS,相当于同时运行50台高性能电脑,能实时处理来自视觉、听觉、触觉的多模态数据。
③设计哲学:极致拟人的必要性
何小鹏在采访中给出了明确答案:[拟人化不是为了好看,而是为了适应人类世界。]
人类的生活与工作场景,都是基于人类形态设计的,门把手的高度、桌子的宽度、楼梯的台阶尺寸,甚至衣服的版型,都是为人类量身定制。
如果机器人采用非人形设计,比如多足、履带式,在这些场景中会处处受限。
而IRON的骨骼-肌肉-皮肤设计,正是为了无缝融入人类环境。
IRON支持不同身材体型定制,未来能根据场景需求,调整身高、体型。
同时,拟人化也是数据收集的需要。何小鹏认为,机器人要学习人类的行为,最好的方式是拥有类人的躯体。
用人类的视角观察世界,用类人的动作模仿行为,这样收集到的数据才具有泛化性。
造车的小鹏,为何押注机器人?
在很多人看来,小鹏作为车企,跨界做机器人是[不务正业]。
但机器人是小鹏[物理AI]战略的关键一环,与汽车、Robotaxi、飞行汽车共同构成了全场景具身智能生态。
小鹏的核心优势在于技术协同,机器人的软件与AI层面,与智能汽车业务的复用率高达70%,这意味着小鹏在自动驾驶领域积累的技术,能直接赋能机器人。
比如VLA大模型,最初是为汽车自动驾驶开发的,用于处理路况、生成驾驶动作。
而在机器人身上,这套模型只需调整参数,就能处理行走路况、生成肢体动作;
再如图灵AI芯片,原本是为汽车的自动驾驶算力需求设计,现在应用到机器人上,无需重新研发芯片架构,只需优化功耗;
甚至汽车的[三电技术],也为机器人的动力系统提供了经验。
这种复用不仅降低了研发成本,还加速了技术迭代。
汽车自动驾驶积累了1亿clips的训练数据,相当于人类驾驶6.5万年的极限场景,这些数据能帮助机器人更快适应复杂环境。
而机器人需要处理82个关节的复杂控制,这种技术反哺到汽车上,能让自动驾驶的精细控制更精准。
小鹏选择了一条更务实的路径,先从商业场景切入,比如导览、导购、巡检。
IRON机器人的首个落地场景是小鹏门店,将承担导览、导购任务。
这类场景的优势在于半结构化,环境相对固定、任务相对简单、与人交互温和,既能验证机器人的交互能力,又能避免复杂场景的风险。
同时,小鹏还与宝钢集团合作,让IRON进入工业场景探索而非量产应用。
宝钢的巡检场景,需要机器人在高温、高粉尘的环境中工作,检测设备故障。
这种先商业、后工业、再家庭的路径,与特斯拉形成了鲜明对比。
小鹏计划在2026年开放IRON的SDK,邀请全球开发者共同开发应用场景。
这意味着,小鹏将成为硬件平台提供商,而开发者则负责开发应用程序,就像苹果的iPhone与App Store的关系。
此外,小鹏还在构建跨场景协同的生态。比如Robotaxi与机器人的联动:当用户乘坐小鹏Robotaxi到达商场,IRON机器人可以在门口迎接,引导用户到目的地。
飞行汽车与机器人的联动:当用户乘坐飞行汽车到达景区,IRON可以作为导游,提供全程讲解。
结尾:
2026年,被业内视为[人形机器人量产元年]。小鹏IRON计划在2026年底实现规模量产,而特斯拉Optimus也将量产时间推迟到2026年底,一场全球范围内的量产竞赛已悄然打响。
除了特斯拉,Figure AI已将Figure 02投入BMW工厂试点,计划2024-2025年进行商业化试验;Apptronik与奔驰合作,目标2026年开始商业化生产。
部分资料参考:知危:《小鹏机器人火了,但看看隔壁特斯拉,也不能太乐观》,极客公园:《小鹏科技日「太魔幻」:机器人走猫步,飞行汽车接近量产》,凤凰网财经:《被质疑真人伪装!何小鹏独家揭秘:做机器人到底难在哪里?》,铅笔道:《小鹏机器人,什么档次?对比全球机器人后,我们得出答案》,像素的呼吸:《深度解析:小鹏IRON人形机器人——技术、争议与[物理AI]战略版图》,头部科技:《小鹏机器人[自证]非真人扮演,解剖仿生构造,更多产品细节曝光》










