谈及AI落地的本质,首先我们得先搞清楚AI的架构是什么。
今年年初,黄仁勋用“五层蛋糕”的比喻对其进行了剖析:AI的底层是能源、芯片,中层是基础设施与模型,顶层则是重塑万物的行业应用。五层架构紧密交织,全方位创造数字时代的新价值。
回顾人工智能发展的历程,我们不难发现,前期市场对这“五层蛋糕”的焦点普遍集中在底层的算力基建和中层的大模型研发上。而当人工智能的风吹到了今天,这块“五层蛋糕”的演进脉络愈发清晰,越来越多的人开始将视线投向顶层的应用场景。
就在5月27日至30日,第六届 BEYOND 国际科技创新博览会(BEYOND Expo 2026)召开,全球 120 多个国家和地区的3万余名观众、近800 家展商汇聚澳门,把脉具身智能、AI 基础设施、AI Agent与新一代智能终端的最新风口。
《前方智能》也参与了此次盛会,并逛完了这四天的展会、论坛与演讲,能够感觉到一个很明显的趋势:AI正在打通数实共生的最后一公里,从底层技术到顶层应用,全面重塑着各行各业。
01
顶层的应用:具身智能走进日常生活只差“临门一脚”
不得不说,在黄仁勋所提出的“五层蛋糕”架构中,与大众距离最近、感受最真切的无疑是应用层。而在应用层中,若论哪个赛道最能让人真切感受到 AI 正在重塑现实世界,我认为非具身智能莫属。
在BEYOND Expo 2026的现场,可以看见各种形态的机器人。它们早已不再局限于跳舞、拳击等表演性动作,而是开始真正驶入现实生活,端咖啡、扫地、辅助作业,甚至深入到复杂的工业制造场景之中。
更有甚者,不少机器人开始尝试理解人类的意图、创意与情绪,提供多模态的深度陪伴。在展会上光是瞄准“AI 陪伴玩偶”赛道的初创公司就至少有五六家,它们全面覆盖了睡眠陪伴、婴幼儿看护、深度情绪识别等细分领域。不难看出,随着人类创意与技术应用的双向升级,具身智能在生活场景中的落地体验已经有了质的飞跃。
然而,即便展台上的应用百花齐放,在回归现实后,机器人的实际表现与人类的期望值之间,依然隔着一道难以逾越的鸿沟。具身智能是否已经迎来了属于自己的“ChatGPT时刻”?行业内给出的普遍答案是:尚未到来,但距离真正的爆发,或许就差最后的“临门一脚”。
开幕式上,不少业内人士对具身智能真正落地的“临门一脚”给出了分析:
一是绝对的准确率。英伟达机器人与边缘 AI 副总裁 Deepu Talla指出,“全球接近 80% 的 GDP 都来自于制造业、物流、零售和交通等物理实体。在传统数字 AI 领域,如果模型在总结文本或撰写邮件时达到了95%或99%的准确率,剩下1%的容错空间完全可以由人类作为“安全阀”来手动补齐。但在没有人类干预的物理世界中,哪怕只有1%的失误,导致的可能就是整条生产线停摆,甚至是严重的恶性安全事故。”这意味着,在物理AI的世界,AI准确性是零容忍的,这直接将具身智能的技术落地门槛拉到了极致。
二是数据的稀缺性。普渡机器人创始人兼 CEO 张涛从产业一线视角算了一笔账:自动驾驶作为一个自由度相对较低、运行在二维平面上的机器人系统,要做好算法尚且需要 1000 万小时以上的真机数据;而机器人在三维空间中的作业,面临的是几何级数上升的复杂度。具身智能要实现真正的泛化能力,依然需要累计数千万至亿级小时的真机数据,去完成物理世界的最终校准。这意味着,即使虚拟仿真能解决绝大多数长尾场景的预训练,物理世界的最后一公里校准仍是一条无法绕开的漫漫长路。目前大多数高调宣称进军具身智能的公司,实际上还尴尬地停留在真机数据金字塔的最底层。
更何况,物理世界的突破绝非单纯的算法迭代和模型魔改,而是一个漫长且痛苦的工业化降本过程。当年大模型之所以能迎来“ChatGPT时刻”并迅速引爆全球,是因为网页聊天框提供了一个零硬件成本、零使用门槛的交互界面。而机器人想要真正走进千家万户,必须先在物理层面上造出一款价格亲民、让人没有心理负担、能像买电视冰箱一样方便的“通用爆款硬件”。
因此,我们不必苛求精准预测那个爆发节点的具体时点。但可以预见,不可逆转的趋势是,具身智能距离补齐最后的“临门一脚”,差的仅仅是工程落地的时间,以及在物理世界中不断试错与沉淀的耐心。而作为这波技术浪潮的亲历者,我们不妨放长眼光,给予市场与技术更多的信任、宽容与守候。
02
中层协同:模型与AI基础设施,正打通to B的最后一公里
在“五层蛋糕”的架构中,模型层与基础设施层的协同构成了承上启下的中层核心,其协同效率在很大程度上决定了 AI 能否真正扎根于企业。
回看大模型的演进脉络,每一次模型的重大更新,都对企业工作流的重塑起到了决定性的推进作用。随着 GPT-5.5、Claude 4.7、DeepSeek-V4 等新一代模型的相继发布,大模型技术在泛化和涌现后已然步入了一个超高速的迭代周期,产业重心也从最初的通用大语言模型,迅速卷向多模态、深度推理进阶,以及智能体与具身智能的应用落地。
例如今年 Anthropic 推出的 Claude 4.7,其强大的编程能力直接重塑了企业的软件开发范式,有公开消息称,这家专注于企业级AI的巨头第二季度营收有望冲到 109 亿美元并可能首次实现季度运营盈利,这足以证明模型与 AI 基础设施的紧密协同正在加速企业 AI 的落地,也极大地提振了资本市场对商业闭环的信心。
然而,即便如此,B 端企业在打通落地“最后一公里”时,依然面临着多重现实困境。
一是硬件周期的硬伤。中兴通讯首席发展官崔丽在 BEYOND Expo 2026 的数字AI峰会上指出,当前 MoE(混合专家模型)、MLA(多头潜在注意力机制)、超长上下文等算法创新层出不穷,其迭代时钟以“月”为单位,但尴尬的是,重资产的算力系统与硬件本体的研发、部署周期通常长达两三年,这种“六个月的模型演进”与“两三年的硬件周期”之间存在着天然的错位。为了破局这一硬伤,算力竞争的度量体系正在从单点芯片的理论峰值,彻底转向追求全栈 TCO(总体拥有成本)的最优解。
为此,崔丽也提出了基础设施建设的四大原则,即必须通过“开放解耦”拒绝与单一硬件生态深度绑定,随时吸收最新的算法成果;通过“渐进扩展”拒绝一步到位的盲目豪赌,利用组件化设计“小步快跑”以缓解硬件折旧与淘汰压力;同时还要“灵活适配”,拒绝盲目崇拜“大参数”,在 B 端落地中根据具体行业场景量体裁衣;最终指向“全栈最优”,聚焦工程能力工具化并打造 AI 操作系统与智能体中枢,通过高效资源调度与导航式训推加速等软件平台将开发与异构算力混池的复杂性进行有效封装,用系统软件的“柔性”去化解硬件层面的不确定性。
二是数据隐私与安全的雷池。InfiX.ai 创始人杨红霞指出,过去二十年互联网经济繁荣的底层基石是云原生(Cloud Native)架构、云服务以及 Linux 操作系统,它们以极低的门槛支撑了企业的数字化转型,而现阶段中心化大模型的突破主要依赖互联网可抓取的公开海量数据。进入 To B 落地的下半场,企业需要深度挖掘自身专属的私有数据,此时将企业 PB 级别的私有数据高频搬迁至公有云,不仅意味着高昂的传输与带宽成本,更面临着严峻的数据不安全与合规监管隐患,这正强烈倒逼着 B 端企业放弃“全量上云”的幻想,转向大模型的本地化训练与分布式架构,让模型走向数据,在本地筑起数据安全的第一道防线。
三是大模型的信任危机,Cloudwise CTO杜方宇表示,数据的本地化训练虽然在较大程度上保证了隐私,却无法完全解决大模型在核心业务场景中的“信任危机”,即大模型的幻觉问题。如果大模型在核心银行等关键生产环境中出现幻觉,其引发的后果可能是灾难性的。对此,杜方宇给出了明确的工程解法,即企业必须引入“因果推理模型”去叠加、纠偏现有的“大模型基模”能力,通过在底层建立起可解释、可干预的逻辑链条,保障 AI 的每一步推理都能与人类进行基本交互与合规审计,从而在根本上重构生产环境对 AI 的信任。
四是员工习惯异构带来的组织协同难题。Cloudsway 联合创始人William Du表示,由于员工个体的代码编写和工具使用习惯带有极致的“个人主义”风格,企业在实际管理中很难强迫所有人使用同一款 Coding Agent,因此中底层基础设施的架构设计必须具备极高的柔性。一方面,基础设施必须在底层支持全球化的多模态数据架构,从源头上保证私域数据的真实性与时效性;另一方面,则需要在企业内部打造一个统一的 Harness协作框架。通过这套框架,企业既能充分释放员工的个体创造力,容纳各种异构智能体,又能将这些带有“个人主义”色彩的创意与应用安全、合规地纳入统一的技术底座之中。中层全栈系统级极致协同的建立,最终达成了模型、算力、数据与组织的高效协同,让数字世界的智力真正转化为企业触手可及的普惠生产力。
03
AI的下半场,是底层建设的降本增效
对于企业级 AI 市场而言,比起模型本身的“好不好用”,更多B端客户关心“高性价比”的问题。因此,阻碍AI真正融入企业工作流的主要原因,还有企业的投入成本产出比的问题。
杜方宇在会上坦言,调用大模型进行推理和数据判断的成本,实际比传统结构化数据查询高出 10 到 100 倍。这种高昂且不可控的Token费用,让不少企业在精打细算后痛苦地发现“用 AI 甚至不如用人便宜”,生生劝退了大量处于观望状态的捕风者。
然而,针对这种普遍蔓延的成本焦虑,William Du也提出了一个洞察:Token 的绝对消耗量或许是个伪命题,真正的破局点在于前置的业务目标设定与执行中的协作管理。如果企业能够依托通用的 Harness 架构将垂直场景做深做透,让最终交付的商业价值远超Token自身的成本,实现10倍以上的能效跃升,那么在商业账本上,这笔算力投入不仅完全可以被市场接受,更将转化为企业的核心竞争力。
为了彻底解开“用不起”的死结,底层的算力生态与软硬件技术范式已经迎来了一场颠覆性的“瘦身革命”。杨红霞指出,大模型横跨预训练、后训练和推理等多个长周期范式,传统训练模式高度依赖 FP16 精度,这给底层的算力与存储带来了极度臃肿的负担。
如今,行业正全力攻坚低比特无损训推一体技术。以最新一代的 DeepSeek-V4 模型为例,其已成功采用 FP4 与 FP8 的混合精度训练。这也意味着企业只需投入传统模式一半的存储与算力资源,就能跑出性能同等甚至更优的模型,在算力层实现了真正意义上的“无损降本”。
从概念走向普惠,“AI原生”基础设施的底层重构,正在让每一个传统行业真正拥有能够支撑起顶层具身应用的数字化钢铁骨肉。
04
写在最后
从下一代半导体芯片的研发、高密集性能源模块的部署,到硬核人形机器人本体的柔性制造,数字智能想要真正拥有物理肉身,就必须扎根于这片最强制造的工业土壤。
面对这场由芯片、硬件到Physical AI构筑的底层剧变,关于“AI是否会引发大规模失业”的终极思辨也迎来了理性的共识。技术变革的本质从来不是淘汰人类,而是将人类从重复性的 Skill(技能)劳作中释放出来,去从事更多高价值的创造。人不会被 AI 替代,但一定会率先被使用 AI 的人替代。
当底层与中层技术将智力与工程成本彻底普惠,大模型与多智能体系统在低成本、高信任的框架下完美执行意图时,人类最终留下的不可替代的核心资产,将是无法被硅基复制的人际情感连接、批判性思维与最终的决策力。
科技与人文应成为 AI 进化的双螺旋基因,在这场波澜壮阔的硅基寒武纪大爆发中,唯有保持对工程的系统定力与对人类价值的温情守护,才能真正将数字世界的智慧,锻造为物理世界的钢铁骨肉,开启属于人类的数实共生新大陆。










