科创丨国内原生AGI Infra迎7亿融资记录，AI基建迎来新生产力壁垒_陀螺科技

我要发布

科创丨国内原生AGI Infra迎7亿融资记录，AI基建迎来新生产力壁垒

AI芯天下原创 2026-05-13 07:06 热度 0

分享

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

IP归属：广东

文章AI导读

一键萃取文章精髓，核心观点即刻呈现

# 梳理该事件的完整脉络

# 该文章有哪些有意思的观点或数据

# 大家对该事件的态度表现如何？

前言：

2026年资本开始把目光移向另一层更底部的资产，谁能把GPU、国产芯片、智算中心、电力、模型服务和企业场景，压缩成可稳定交付的Token生产能力。

这正是原生AGI Infra受到追捧的核心原因,它卖的是一整套把算力转化为智能输出的系统能力。

作者 | 方文三

图片来源 | 网络

7亿融资押注的是Token经济的[炼化厂]

近日，无问芯穹宣布此前已再获超7亿元融资，这笔融资被多家媒体称为中国AI原生基础设施公司融资规模之首。

联合领投方包括杭州高新金投集团和惠远资本，跟投方包括国兴资本、秦淮数据、广发乾和、力合清瞳、中保投资、AEF NextGen、腾瑞投资、卡莱特、中信建投资本和宽德智能学习实验室，老股东君联资本、上海国投孚腾和元智未来追加投资。

资金将投向多元异构技术、软硬协同效率提升，以及企业级智能体服务平台建设。

无问芯穹的业务很容易被理解为[算力运营商]，这个说法只说对了一半。

传统算力服务的核心在供给侧，企业采购GPU服务器、租用云资源、搭建集群，关键指标是卡数、租金、带宽和机房条件。

AI原生基础设施的逻辑更进一步，它要解决的是算力进入模型之后的工程效率问题。

一张芯片并不会自动等于生产力，模型部署、并行推理、显存管理、负载调度、KV Cache优化、模型路由、服务稳定性、工具调用准确率，都会影响最终的Token成本和用户体验。

企业真正需要的结果是每天能稳定处理多少业务请求，每次调用的延迟是多少，单位Token成本能不能继续下降。

Token正在成为AI产业的高频计量单位，国家数据局信息称：2025年底跃升至100万亿；2026年3月已突破140万亿，两年增长超千倍。

AI商业化正从试用进入高频调用，如今智能体开始进入销售、研发、制造、金融风控、代码生成、数据分析等流程，调用频次呈指数级放大。

一个企业内部流程被AI重构后，Token消耗不再是零散需求，而会变成类似电力、带宽、云存储一样的持续性基础资源。

无问芯穹这类AGI Infra公司的价值就出现在这个位置，它承担的角色更像AI产业链中的[炼化厂]。

上游接入多元芯片、智算中心和模型，下游面向企业应用、智能体平台和行业客户，中间通过调度、优化和服务化，把原始算力加工成可计量、可调用、可交付的智能资源，AI Infra厂商负责把这些碎片化能力组织成可用的生产系统。

AI生产力公式：定义Token价值

未来几年，AI产业会出现越来越清晰的分层。

最上层是应用和智能体，负责直接进入业务流程；中间是模型层，负责提供推理、规划、生成和多模态能力；底层是芯片、服务器、数据中心和能源；贯穿其中的，是AI Infra。

它把底层资源组织起来，把模型能力服务化，再把服务能力交付给应用。

这意味着AI Infra会成为AI时代非常关键的[窄腰]。

它未必最接近用户，也未必最接近硬件制造，但它连接两端，决定智能生产的效率、成本和稳定性。

在本轮融资落地官宣后，无问芯穹对外发布了全新的AI生产力逻辑，首提AI生产力公式：

AI生产力=智能规模×Token生产效率×Token价值转化。

过往，Token只是一个单纯的技术计量单位，用来统计模型交互消耗。

这套全新公式直接将Token升级为驱动AI产业发展的核心经济变量，清晰拆解出AI产业化落地、价值变现的完整闭环逻辑。

①智能规模：可通过技术极致优化的多元异构算力规模。

②Token生产效率：将电能高效转化为Token的能力（Token/s）

③Token价值转化：将Token高效转化为全社会生产力的能力（生产力/Token）

[Token生产效率]与[Token价值转化]的单位相乘，即得到[生产力/s]。

无问芯穹提出的价值转化逻辑是：投入→电能→Token→生产力→价值。

三大新生产力壁垒

大厂的基础设施通常服务于自身生态，它们拥有强大的技术能力，但资源组织方式往往围绕自家云、自家模型、自家客户体系展开。

大量中小模型公司、行业应用公司、科研机构、地方智算中心以及使用国产芯片的企业，并不一定能直接复用大厂内部那套高度定制化系统。

中国AI产业的一个现实情况是供给侧相当复杂，芯片并非单一架构，GPU、NPU、ASIC、国产AI芯片并存。

模型高度分散，DeepSeek、Kimi、智谱、通义、MiniMax等模型各有接口、性能、成本和部署方式。

地方智算中心建设快速推进，但许多项目面临利用率、调度效率和客户转化压力。

①中立性：无问芯穹最核心的优势，也是最难被复制的优势，就是它的中立第三方定位。

AI行业同样遵循专业人做专业事的规则，模型企业深耕算法与场景，底层算力优化与Token生产，交由专业的第三方MaaS平台落地。

然而大厂Infra以服务内部业务为主，芯片厂商Infra绑定硬件生态，均难以做到全行业公平开放。

而模型公司自建Infra则受竞争关系限制，无法成为全行业通用底座。

在这样的行业格局下，只有保持中立，才能成为中国AI产业链的最大公约数。

无问芯穹的中立性，让它能够同时服务包括MiniMax、智谱、Kimi、DeepSeek在内的多家头部模型公司。

其Agentic MaaS平台已上线160余种大模型，面向国产主流模型提供服务优化，并对万亿参数大模型进行推理优化。

截至2026年4月底，该平台日均Token调用量较2025年底增长超20倍。

②多元异构：当前AI产业上游有N种不同架构的AI芯片，下游有M种不同结构的大模型，硬件与模型间的适配成本高昂。

一个模型要适配一种新的芯片，通常需要3-6个月的时间，这在技术快速迭代的AI行业几乎是不可接受的。

无问芯穹的多元异构技术，正是为了解决这个[M×N]适配难题。

其平台已支持英伟达、华为昇腾、壁仞等10种以上不同芯片，通过将异构算力池化、虚拟化，屏蔽底层硬件差异。

通过任务拆解实现异构混训混推，让模型厂商提升国产芯片比例时无需承受3~6个月的迭代周期损失。

更重要的是，无问芯穹将行业平均不到30%的GPU利用率，提升到了97%以上。

同样一块H100别人只能用4成，它能用到几乎满负荷，直接把算力成本砍了一半还多。

它打破了单一芯片厂商的供给和成本结构对AI规模化落地的制约，为行业提供了更多选择和更高的灵活性。

③软硬协同：无问芯穹的软硬协同技术，跨越软件硬件做联合设计，把芯片的应用算力挖到极致。

其Agentic MaaS平台通过软硬件协同优化，将系统吞吐量提升2到3倍，整体时延缩减50%，首字延迟控制在500毫秒以内。

在执行精度上，与原厂模型的精度对齐率超过99.9%，并实现了99.95%的企业级高可用性。

这种极致的效率提升，在Token需求爆发的当下显得尤为关键。

随着Token价格的上涨，每提升一点Token生产效率，都意味着实实在在的成本节约和利润增长。

结尾：

谁能用更低成本把电力和芯片转化为Token，再把Token转化为企业生产力，谁就会在AI产业链中拥有更强的话语权。

国内拥有发展Token经济的得天独厚的优势，充沛稳定的能源结构，为大规模算力运转提供了扎实底座，全球最完整的AI产业链、最大的AI应用消费市场。

部分资料参考：量子位：《Token需求狂飙千倍，22亿热钱涌向这家AGI Infra头号玩家》，

无问芯穹：《无问芯穹再获超7亿融资｜首发AI生产力公式，跻身Token经济枢纽》，虎嗅APP：《7亿融资流向清华系[Token工厂]》

Token AI 模型

陀螺科技现已开放专栏入驻，详情请见入驻指南： https://www.tuoluo.cn/article/detail-27547.html

AI芯天下专栏： https://www.tuoluo.cn/columns/author1911711/

本文网址： https://www.tuoluo.cn/article/detail-10128700.html

免责声明：
1、本文版权归原作者所有，仅代表作者本人观点，不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为，侵权责任将由作者本人承担。

上一篇：与王暖暖“和平分手”后，无忧传媒创始人雷彬艺朋友圈图片引发猜想

下一篇：芯报丨芯动联科推出两款全国产工业级MEMS加速度传感器

相关文章

AI巨头纷纷下场，大模型的竞赛正悄悄转向企业部署

2026年，谁在为中小企业的“AI梦”买单？

DeepSeek-V4正在悄悄升级

DeepSeek突传重磅：梁文峰出资200亿，V4.1定...

报告丨Token经济学全景报告

国产算力「大考」通关：DeepSeek 迁居，美团 Lo...