前言:
今年以来,科技巨头们在具身智能领域的动作不断——谷歌发布了融合视觉、语言、动作的RT系列机器人模型的新成果RT-H;
英伟达在GTC大会上推出了人形机器人通用基础模型Project GR00T,特斯拉擎天柱Optimus机器人从叠衣服、散步到进厂“打工”,就连OpenAI也宣布时隔四年重新组建机器人团队……
作者| 方文三
图片来源|网 络
根据中国计算机协会的定义,「具身智能(Embodied AI)」是一种基于物理身体进行感知和行动的智能系统,它通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性。
谷歌继去年推出首个控制机器人的视觉-语言-动作模型RT-2之后,于今年3月又推出RT系列的最新模型RT-H,在多个任务评估中相比RT-2平均提高了15%的成功率。
英伟达今年2月宣布成立GEAR(Generalist Embodied Agent Research)实验室,专注通用具身智能体研究;在3月的GTC大会上,英伟达发布人形机器人通用基础模型Project GR00T,以及专为人形机器人打造的新型计算平台Jetson Thor。
微软不仅和英伟达、OpenAI一起投资了具身智能明星创企Figure AI,今年5月还与仿人机器人公司Sanctuary AI达成合作,为其提供Azure云资源、加速具身AI研究。
OpenAI与Figure、1X Technologies 等公司合作开发机器人大模型,并将视觉语言模型加持在Figure 01人形机器人上;同时时隔四年重新组建了自己的机器人团队。
特斯拉持续发布擎天柱(Optimus)机器人的演示视频,展示其从叠衣服、散步到进厂分拣电池的最新进展。
国内具身智能浪潮的主要参与者包括科技大厂、传统机器人公司和新生代的具身智能创业公司等。
阿里通义千问联合有鹿机器人发布具身智能大模型LPLM;百度为优必选的人形机器人Walker S接入文心大模型;腾讯通过RoboticsX机器人实验室持续研究多模态大模型与机器人的融合;华为成立具身智能创新Lab且与乐聚机器人合作发布盘古具身智能大模型;小米成立独立的人形机器人公司,推出Cyberone机器人。
以下是《中国具身智能创投报告》部分内容: