科创丨国内原生AGI Infra迎7亿融资记录,AI基建迎来新生产力壁垒

IP归属:广东

文章AI导读

一键萃取文章精髓,核心观点即刻呈现

前言

2026年资本开始把目光移向另一层更底部的资产,谁能把GPU、国产芯片、智算中心、电力、模型服务和企业场景,压缩成可稳定交付的Token生产能力。

这正是原生AGI Infra受到追捧的核心原因,它卖的是一整套把算力转化为智能输出的系统能力。

作者 | 方文三

图片来源 | 网络

7亿融资押注的是Token经济的[炼化厂]

近日,无问芯穹宣布此前已再获超7亿元融资,这笔融资被多家媒体称为中国AI原生基础设施公司融资规模之首。

联合领投方包括杭州高新金投集团和惠远资本,跟投方包括国兴资本、秦淮数据、广发乾和、力合清瞳、中保投资、AEF NextGen、腾瑞投资、卡莱特、中信建投资本和宽德智能学习实验室,老股东君联资本、上海国投孚腾和元智未来追加投资。

资金将投向多元异构技术、软硬协同效率提升,以及企业级智能体服务平台建设。

无问芯穹的业务很容易被理解为[算力运营商],这个说法只说对了一半。

传统算力服务的核心在供给侧,企业采购GPU服务器、租用云资源、搭建集群,关键指标是卡数、租金、带宽和机房条件。

AI原生基础设施的逻辑更进一步,它要解决的是算力进入模型之后的工程效率问题。

一张芯片并不会自动等于生产力,模型部署、并行推理、显存管理、负载调度、KV Cache优化、模型路由、服务稳定性、工具调用准确率,都会影响最终的Token成本和用户体验。

企业真正需要的结果是每天能稳定处理多少业务请求,每次调用的延迟是多少,单位Token成本能不能继续下降。

Token正在成为AI产业的高频计量单位,国家数据局信息称:2025年底跃升至100万亿;2026年3月已突破140万亿,两年增长超千倍。

AI商业化正从试用进入高频调用,如今智能体开始进入销售、研发、制造、金融风控、代码生成、数据分析等流程,调用频次呈指数级放大。

一个企业内部流程被AI重构后,Token消耗不再是零散需求,而会变成类似电力、带宽、云存储一样的持续性基础资源。

无问芯穹这类AGI Infra公司的价值就出现在这个位置,它承担的角色更像AI产业链中的[炼化厂]。

上游接入多元芯片、智算中心和模型,下游面向企业应用、智能体平台和行业客户,中间通过调度、优化和服务化,把原始算力加工成可计量、可调用、可交付的智能资源,AI Infra厂商负责把这些碎片化能力组织成可用的生产系统。

AI生产力公式:定义Token价值

未来几年,AI产业会出现越来越清晰的分层。

最上层是应用和智能体,负责直接进入业务流程;中间是模型层,负责提供推理、规划、生成和多模态能力;底层是芯片、服务器、数据中心和能源;贯穿其中的,是AI Infra。

它把底层资源组织起来,把模型能力服务化,再把服务能力交付给应用。

这意味着AI Infra会成为AI时代非常关键的[窄腰]。

它未必最接近用户,也未必最接近硬件制造,但它连接两端,决定智能生产的效率、成本和稳定性。

在本轮融资落地官宣后,无问芯穹对外发布了全新的AI生产力逻辑,首提AI生产力公式:

AI生产力=智能规模×Token生产效率×Token价值转化。

过往,Token只是一个单纯的技术计量单位,用来统计模型交互消耗。

这套全新公式直接将Token升级为驱动AI产业发展的核心经济变量,清晰拆解出AI产业化落地、价值变现的完整闭环逻辑。

①智能规模:可通过技术极致优化的多元异构算力规模。

②Token生产效率:将电能高效转化为Token的能力(Token/s)

③Token价值转化:将Token高效转化为全社会生产力的能力(生产力/Token)

[Token生产效率]与[Token价值转化]的单位相乘,即得到[生产力/s]。

无问芯穹提出的价值转化逻辑是:投入→电能→Token→生产力→价值。

三大新生产力壁垒

大厂的基础设施通常服务于自身生态,它们拥有强大的技术能力,但资源组织方式往往围绕自家云、自家模型、自家客户体系展开。

大量中小模型公司、行业应用公司、科研机构、地方智算中心以及使用国产芯片的企业,并不一定能直接复用大厂内部那套高度定制化系统。

中国AI产业的一个现实情况是供给侧相当复杂,芯片并非单一架构,GPU、NPU、ASIC、国产AI芯片并存。

模型高度分散,DeepSeek、Kimi、智谱、通义、MiniMax等模型各有接口、性能、成本和部署方式。

地方智算中心建设快速推进,但许多项目面临利用率、调度效率和客户转化压力。

①中立性:无问芯穹最核心的优势,也是最难被复制的优势,就是它的中立第三方定位。

AI行业同样遵循专业人做专业事的规则,模型企业深耕算法与场景,底层算力优化与Token生产,交由专业的第三方MaaS平台落地。

然而大厂Infra以服务内部业务为主,芯片厂商Infra绑定硬件生态,均难以做到全行业公平开放。

而模型公司自建Infra则受竞争关系限制,无法成为全行业通用底座。

在这样的行业格局下,只有保持中立,才能成为中国AI产业链的最大公约数。

无问芯穹的中立性,让它能够同时服务包括MiniMax、智谱、Kimi、DeepSeek在内的多家头部模型公司。

其Agentic MaaS平台已上线160余种大模型,面向国产主流模型提供服务优化,并对万亿参数大模型进行推理优化。

截至2026年4月底,该平台日均Token调用量较2025年底增长超20倍。

②多元异构:当前AI产业上游有N种不同架构的AI芯片,下游有M种不同结构的大模型,硬件与模型间的适配成本高昂。

一个模型要适配一种新的芯片,通常需要3-6个月的时间,这在技术快速迭代的AI行业几乎是不可接受的。

无问芯穹的多元异构技术,正是为了解决这个[M×N]适配难题。

其平台已支持英伟达、华为昇腾、壁仞等10种以上不同芯片,通过将异构算力池化、虚拟化,屏蔽底层硬件差异。

通过任务拆解实现异构混训混推,让模型厂商提升国产芯片比例时无需承受3~6个月的迭代周期损失。

更重要的是,无问芯穹将行业平均不到30%的GPU利用率,提升到了97%以上。

同样一块H100别人只能用4成,它能用到几乎满负荷,直接把算力成本砍了一半还多。

它打破了单一芯片厂商的供给和成本结构对AI规模化落地的制约,为行业提供了更多选择和更高的灵活性。

③软硬协同:无问芯穹的软硬协同技术,跨越软件硬件做联合设计,把芯片的应用算力挖到极致。

其Agentic MaaS平台通过软硬件协同优化,将系统吞吐量提升2到3倍,整体时延缩减50%,首字延迟控制在500毫秒以内。

在执行精度上,与原厂模型的精度对齐率超过99.9%,并实现了99.95%的企业级高可用性。

这种极致的效率提升,在Token需求爆发的当下显得尤为关键。

随着Token价格的上涨,每提升一点Token生产效率,都意味着实实在在的成本节约和利润增长。

结尾:

谁能用更低成本把电力和芯片转化为Token,再把Token转化为企业生产力,谁就会在AI产业链中拥有更强的话语权。

国内拥有发展Token经济的得天独厚的优势,充沛稳定的能源结构,为大规模算力运转提供了扎实底座,全球最完整的AI产业链、最大的AI应用消费市场。

部分资料参考:量子位:《Token需求狂飙千倍,22亿热钱涌向这家AGI Infra头号玩家》,

无问芯穹:《无问芯穹再获超7亿融资|首发AI生产力公式,跻身Token经济枢纽》,虎嗅APP:《7亿融资流向清华系[Token工厂]》

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

AI芯天下专栏: https://www.tuoluo.cn/columns/author1911711/

本文网址: https://www.tuoluo.cn/article/detail-10128700.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

相关文章