前言:
在2026年的具身智能赛道上,人形机器人在跑道上刷新着速度纪录,四足机器狗在街道上学习着如何与世界相处。后者看起来没那么酷炫,却可能离AGI的最终图景更近一些。
作者| 方文三
图片来源 | 网络
竞速在炫技幻觉里越卷越偏
近日,北京亦庄人形机器人半程马拉松终点区,视障大学生王子豪在四足机器人[途途]的引领下,顺利完成300米开放环境行走挑战。
避障、穿窄道、过人潮、自主找补给,这些动作在实验室里不足为奇,可放到瞬息万变的真实城市街道,意义全然不同。
当下具身智能行业正陷在尴尬困局:机器人能完成高难度后空翻、精准操控流水线、跳整齐划一的舞台舞蹈,可一踏上真实街头,瞬间[智商归零]。
遇行人僵住、见障碍物绕圈,稍复杂的路况就只能等待人工接管。
究其根本,这些能力都诞生于封闭可控的实验室:背景干净、变量有限、任务边界清晰,偶发风险被压到了最低。
而城市道路的不可控性,让导盲成了具身智能领域[最难作弊]的考场。
容不得后期剪辑遮掩瑕疵,实验室里勉强过关的demo,一到真实马路就原形毕露。
长久以来,机器人行业困在[炫技焦虑]里,越炫酷的特技越能收割掌声。
可最终,绝大多数产品都卡在了[演示惊艳,落地无力]的尴尬里。
绝大多数竞速中的具身智能,始终没能跨过从虚拟世界到真实物理世界的门槛。
它们能在数字空间无所不知,却难在现实里帮人完成一次安全顺畅的出行。
被忽视的1700万人出行困境
中国残疾人联合会数据显示,我国视障群体人数超过1700万,而全国导盲犬保有量仅约400只,普及率不足万分之三。
另一组来自中国盲人协会的数据显示,我国视障人士约1731万,现役导盲犬仅400只左右,意味着约每4.25万视障者才可能配备1只导盲犬。
背后的原因并不复杂:一只生物导盲犬需历经2年寄养与培训,训练成功率不足30%,单只成本高达20万元。
视障人士申领导盲犬平均需排队2-4年,供需之间横亘着巨大的鸿沟。
杭州市盲协主席赵成直言:智能导盲犬是科技助力无障碍出行的重要途径,有望成为视障群体的[第二双眼睛]。
这段话揭示了一个关键事实:传统导盲犬模式在物理上不可能满足中国市场的需求。
数字时代的便利,很多时候都建立在[能看见、能正常操作]的基础上,而视障群体,就这样被挡在了数字世界的门外。
他们的出行需求、社交需求、日常生活需求,都因为技术的快速发展,反而变得更难满足。
稀缺的背后,是生物导盲犬无法突破的行业瓶颈。
而现有的其他出行辅具,都存在无法弥补的短板。
开放环境下的导盲任务,对智能体的要求几乎达到了民用场景的天花板。
这些能力,恰恰是通用AI最核心的底层能力。
这是一个天然存在的供给缺口,也是技术介入的最佳切入点。
地图公司的空间智能物理化迁移
于高德而言,入局具身智能更是破局的必然。
当AI智能体可一键调用全链路服务,传统地图的流量入口地位正被持续侵蚀:若用户习惯一句话完成打车、导航、消费全流程,高德或将沦为后台运力基础设施。
而具身智能,为它打开了全新的增长叙事空间。
艾瑞咨询数据显示,2025年全球具身智能市场规模约192亿元,2035年将突破万亿,十年复合增长率高达73%。
但行业狂欢背后,难掩落地痛点:实验室里表现惊艳的模型,一入真实物理世界便频频失灵。
核心症结从来不是模型不够强,而是从模型能力到任务落地之间,缺了一层关键的系统架构。
高德的解法,是跳出内卷的模型军备竞赛,转而在场景闭环与数据飞轮上构建核心壁垒。
它用导盲这一极限场景打磨技术,用海量地图数据压低训练成本,用开源生态拓宽能力边界。
这套打法,不求单点参数的极致领先,只求系统效率的全局最优。
它走出了一条反常规的进阶之路:先让机器人[能出门],再让它[变聪明]。
毕竟,物理世界的万千复杂,本就是催生智能最好的催化剂。
AGI的全栈具身ABot技术体系
如果说通义千问的语言大模型,是AI读懂人心、解码数字世界的[智慧大脑]。
那么高德的核心价值,便是为AI构建了认知、预判、驾驭真实物理世界的[空间坐标系]。
二者能力深度互补,共同撑起阿里巴巴AGI战略的完整版图。
2025年8月,高德地图CEO郭宁提出[AMAP-AI Inside]战略,宣告高德从地图工具向空间智能基础设施的全面升级。
正式拉开空间智能向智能汽车、AR眼镜、机器人、低空飞行等全场景赋能的序幕。
2026年开年高德布局全面提速,1月,阿里旗舰应用千问App率先接入高德生态,成为阿里AI生态协同的标志性节点。
同期推出自研世界模型[Fantasy World],依托近10亿月活用户的出行轨迹,构建起业内规模最大的具身导航数据引擎。
3月,全球首个大模型驱动的视觉认知步行导引系统[地标AI领航]落地。
融合千问大模型、亿级POI与千万级街景图像,让导航首次具备视觉认知与人类自然语言理解能力。
4月,高德世界模型ABot-PhysWorld登顶世界模型领域权威评测WorldArena榜首,在物理规律内化与长程动态预测能力上实现行业领跑。
彼时外界多将这些动作,视作地图产品本身的智能化升级。
直到2026年初高德成立具身业务部,快速推出ABot全栈具身技术体系,所有布局瞬间串联成线。
高德ABot全栈体系,以三层架构打通具身智能从训练、决策到执行的全链路。
①数据层・ABot-World 世界模型:作为全体系的训练底座,它依托高德顶级场景资产实现厘米级三维场景重建,覆盖99%的典型生活场景。
通过将物理定律嵌入生成逻辑,搭配海量真实数据训练,打造出无限趋近真实世界的训练环境,摆脱行业对昂贵真机数据采集的重度依赖。
②模型层・双基座并行破局:ABot-N0导航基座与ABot-M0操作基座,分别解决机器人[往哪走]与[怎么做]的核心命题。
ABot-N0是业内首个单模型统一五大核心导航任务的基座,让机器人导航从静态路径规划升级为城市级动态环境持续决策。
在7项国际权威导航评测中全部登顶SOTA,相关成果入选CVPR 2026 Oral。
ABot-M0构建了业内最大的通用机器人开源数据集UniACT,破解行业数据割裂、跨本体泛化能力弱的痛点,实现[一个大脑适配多种机器人形态]。
在四大权威操作基准测试中全面刷新世界纪录,核心任务成功率较业界标杆提升近30%。
③应用层・ABot-Claw执行中枢:它首创[Map as Memory(地图即记忆)]核心理念,构建可动态刷新、持久沉淀的[世界记忆].
新终端接入即可零成本继承环境认知,粉碎具身智能行业长期存在的[一机一图]信息孤岛困局。
同时,它打造了类人[尝试-判断-调整]的闭环纠错机制,让机器人从被动执行器升级为能灵活应对突发状况的主动智能体,更实现了多形态异构机器人的无缝协同作业。
就在上个月,高德全量开源ABot-M0,覆盖数据、算法与模型全维度。
伴随旗下机器人产品途途的发布,更宣布将开源ABot全体系,降低行业重复造轮子的成本,吸引全球开发者共建生态,让ABot真正成为物理世界智能化的通用基础设施。
而这一切的背后,是高德难以复制的核心护城河。
作为国内少数同时拥有导航电子地图、测绘航空摄影、互联网地图服务[三甲]甲级测绘资质的企业,国家严格管制的测绘资质壁垒。
让竞争对手短期内无法积累同等量级的空间数据,也为高德空间智能的持续进化筑牢了最坚实的底座。
当语言智能打通了人与AI的对话边界,空间智能便为AGI走进真实世界,铺就了最核心的通行轨道。
结尾:
在AGI竞速的狂飙中,当所有人都在追逐万亿市场时,愿意为一个被忽视的群体投入重兵,这本身就需要一种战略定力。
毕竟,智能的本质不是跑得多快,而是理解得多深:理解物理规律,理解人类意图,理解这个复杂而真实的世界。
部分资料参考:晚点LatePost:《走向AGI,高德为什么要从机器导盲犬开始?》,新智元:《刚刚,高德ABot-Claw亦庄半马封神!具身智能的Harness来了》,独角兽营:《从地图到四足:高德[途途]破局,[具身智能导盲犬]照亮千万视障者出行路》,机器之心:《高德全自主具身机器人炸场亦庄马拉松,拿下「导盲」这道硬核考题》,星芒:《高德智能导盲犬的一小步,具身智能AGI的一大步》









