智谱上市5个月,交出了一份怎样的AI答卷?

IP归属:北京

文章AI导读

一键萃取文章精髓,核心观点即刻呈现

作者|冰拿铁

编辑|星奈

媒体|AI大模型工场

智谱大涨,市值逼近9000亿港元!

5月29日,港股智谱午后股价继续拉升,截至发稿,涨超22%,股价报1984港元/股,市值逼近9000亿港元。一个上市才几个月的大模型公司,市值突然站到了中国互联网巨头的前排。

而在股价走高之前,智谱也刚好给市场递出了一张新的产品牌。

5月22日,智谱推出GLM-5.1 高速版API,官方披露输出速度达到400 tokens/s,主要面向AI编程、实时交互、商业决策、实时语音等低延迟场景,目前已向MaaS平台部分企业客户开放。

所以,现在看智谱,不能只看它又发了一个模型,也不能只看它股价涨了多少。

真正值得追问的是:资本市场为什么愿意给一家仍在重投入、重亏损阶段的大模型公司如此高的估值?高速API、企业级Agent和MaaS平台,能不能把“模型能力”变成真实调用量,再把调用量变成可持续收入?

上市5个月后,智谱交出的这份成绩单,表面上是股价和市值的狂飙,底层其实是大模型公司商业化路径的一次集中验证。

它能不能撑住这个估值,关键不在于故事讲得多像“中国版 OpenAI”,而在于接下来能不能证明:自己不只是会训练模型,也能把模型卖进企业、嵌进应用、跑出规模。

智谱先交出了一份高增长、重投入的财务答卷

上市之前,智谱身上的标签比较明确:清华系背景、GLM系列模型、国内大模型创业公司代表之一。它被讨论时,更多是在技术路线和模型能力的语境里。

但上市之后,外界对它的关注开始变得更具体。

资本市场不会只看一次模型发布,也不会只看某个榜单分数。它会持续追问:收入在哪里,增长来自哪里,客户愿不愿意持续付费,亏损是否有收窄可能,业务结构有没有从项目制向平台化迁移。

从财务数据看,智谱2025年的收入增长比较明显。全年收入7.24亿元,同比增长131.9%。这个规模放在整个大模型行业里,至少说明智谱已经不只是停留在模型展示和概念验证阶段,而是有了一定数量的真实客户和付费场景。

但与此同时,亏损也仍然是绕不开的问题。经调整净亏损31.82亿元,说明大模型公司的商业化仍然处在高投入阶段。

训练、推理、研发、模型服务、企业交付、云端平台建设,每一项都需要持续投入。尤其当模型从实验室能力走向企业生产环境,成本结构并不会马上变轻。

所以,智谱这份财报更像是一份“增长进展表”,而不是“盈利证明书”。

更值得关注的是收入结构。按部署方式看,2025年智谱本地化部署收入约5.34亿元,同比增长102.3%,仍然是主要收入来源;云端部署收入约1.90亿元,同比增长292.6%,占总收入比重从2024年的15.5%提升至26.3%。

按产品线看,开放平台及API收入约1.90亿元,企业级智能体收入约1.66亿元,同比增长248.8%。

不难看出,智谱仍然依赖本地化部署打底,但云端API和企业级智能体正在变得更重要。

本地化部署适合政企、金融、能源、制造等场景。这类客户对数据安全、私有化和系统可控性要求较高,也更愿意为定制化服务付费。对智谱来说,这部分业务可以提供比较确定的收入基础。

但如果长期只依赖本地化项目,大模型公司容易变成偏重交付的工程服务商。项目收入可以增长,但标准化程度、毛利弹性和平台效应都会受到一定限制。

相比之下,云端API和智能体业务更能体现大模型公司的平台价值。API对应的是调用量和Token消耗,智能体对应的是模型从“回答问题”走向“完成任务”。

这两部分业务的增长,说明智谱正在尝试把模型能力转化成更标准化、更可复用的产品形态。

当然,这种迁移还处在进行时。云端部署占比虽然提升,但本地化部署仍然占大头;智能体业务增长较快,但能否形成稳定复购,还需要继续观察。

从这个角度看,上市5个月后的智谱,已经交出了一些阶段性进展:收入在增长,业务结构在变化,API和智能体开始贡献更高增速。但它同时也处在一个很典型的大模型公司阶段:增长较快,投入更重,盈利周期仍不明朗。

把竞争焦点从“模型能力”推向“模型可用性”

而智谱最近一次被市场集中关注,发生在5月22日。

当天,港股AI应用概念股集体拉升,智谱盘中一度大涨超30%,股价再创历史新高;MINIMAX、滴普科技、五一视界等AI相关标的也出现明显上涨。

这轮情绪并不只来自单一消息。一方面,智谱此前一直被视为“中国版OpenAI”,而近期OpenAI也传出加快推进IPO的消息,某种程度上强化了市场对AI应用和大模型公司的想象空间。

另一方面,智谱当天上午宣布面向部分企业客户开放 GLM-5.1高速版API——GLM-5.1-highspeed,也给市场提供了更直接的产品催化。

从产品指标看,GLM-5.1-highspeed最核心的关键词就是:快。

根据智谱披露的信息,GLM-5.1高速版API的模型输出速度达到 400 tokens/s,刷新当前全球大模型厂商API的速度上限。它主要面向AI编程、实时交互、商业决策、实时语音等对响应延迟要求较高的场景。

对普通用户来说,400 tokens/s最直观的感受,是模型输出更快、等待时间更短。但放到大模型应用落地的语境下,速度提升的意义并不只是体验优化。

因为很多AI应用,尤其是Agent类应用,并不是一次问答就结束。

比如在Coding Agent场景中,一个复杂任务往往不是一次调用就结束,而是需要多轮规划、多轮代码生成、多轮调试、多轮工具调用。

如果每一次模型调用都很慢,整个Agent链路就会被严重拖慢。用户感受到的不是“模型思考得很深”,而是“这个工具不好用”。

再比如实时语音、在线客服、商业决策辅助、办公自动化等场景,延迟会直接影响体验。一旦模型响应速度达不到要求,很多看似成立的应用场景,实际落地时都会变得很尴尬。

所以,GLM-5.1-highspeed的价值,不只是让智谱多了一个高速版本,而是让GLM-5.1更适合进入高频、连续、低延迟的业务场景。

从技术实现看,GLM-5.1高速版API由智谱GLM团队与TileRT团队联合打造,并不是简单通过牺牲模型能力来换速度,而是在推理引擎、调度系统和底层基础设施三个层面进行了系统级优化。

在推理引擎层,团队针对GLM-5.1的架构特点重写了核心推理路径,以提升单卡吞吐能力;在调度系统层,通过动态批处理、请求合并和KV缓存调度优化,降低高并发场景下的尾延迟;在基础设施层,则围绕推理集群部署、网络链路和负载均衡做协同优化。

换句话说,400 tokens/s并不是一个单纯的峰值指标,智谱希望把它做成稳定可用的生产级能力。

这也是大模型行业接下来竞争的一个重要变化。

早期大家更关注模型有多聪明,参数有多大,榜单分数有多高。

但当模型进入企业系统、开发者工具和Agent工作流之后,客户会更在意另一组指标:调用速度是否稳定,高并发能不能扛住,长上下文是否顺畅,Function Call是否可靠,API接入是否方便,单位Token成本能不能控制。

也就是说,大模型公司的竞争,正在从“模型能力”延伸到“模型服务能力”。

这对智谱尤其重要。作为上市公司,智谱需要不断向市场证明,模型升级不只是技术新闻,也能和商业化进展发生关系。GLM-5.1-highspeed的发布,恰好把模型性能、API调用、企业客户和Agent应用连接到了一起。

与此同时,外部环境也在强化AI应用侧的预期。

政策层面,5月22日,国家发改委政策研究室副主任李超表示,近期国家发改委正在谋划出台加快人工智能落地的配套文件,进一步加大要素保障,并将持续推动央国企开放高价值应用场景,面向各行业、各领域、各地方打造人工智能标杆应用,加快引导人工智能融入经营管理等环节。

机构观点也在关注这一方向。国信证券指出,AI Agent发展迅速,大模型Agentic能力提升、OpenClaw持续破圈,有望加速AI能力渗透,持续看好AI应用端机会。

这和智谱这次的产品路线刚好契合。GLM-5.1-highspeed适合AI编程、实时交互、实时语音和商业决策,本质上都是更靠近应用层的能力。它不是只服务模型评测,而是服务更具体的业务调用。

还有个值得关注的点是,“Token运营”正在成为AI产业链里的新变量。

近期,国内外越来越多公司开始参与Token运营和分销,特别是电信运营商、营销公司等角色逐渐进入大模型产业链。

招商证券认为,“Token运营”能够兼顾AI产业链不同主体的利益诉求,推动产业链更快发展。

对大模型公司来说,训练和推理都需要大量算力投入,现金流压力普遍较大。模型厂商生产了大量Token,但真正愿意持续为Token付费的用户和企业仍在培养过程中。

如果出现更多Token运营商,能够提前采购、分销和运营模型调用能力,就有可能帮助大模型公司改善现金流,也加快Token消耗进入更多应用场景。

这也是为什么,GLM-5.1-highspeed这样的高速API不只是技术指标。

当模型API变得更快、更稳定,才更适合被运营商、企业服务商、开发者平台和应用公司进一步包装、分发和集成。速度提升带来的不只是用户体验改善,也可能提高Token被消费的频率和场景密度。

对于智谱来说,这正好对应上市后的商业化主线:从本地化部署,到云端API,再到企业级智能体和MaaS平台。

财报数据显示,智谱的云端部署、开放平台API和企业级智能体业务都在保持较快增长。GLM-5.1-highspeed的推出,实际上是在补强这条业务线最基础的能力:让模型调用更快、更稳,也更适合承接Agent和高频应用。

当然,目前GLM-5.1-highspeed仍然主要面向部分企业客户开放,后续能否扩大覆盖范围、在更多开发者和行业客户中形成持续使用,还需要进一步观察。

但从产品方向看,智谱这次更新释放出的信号比较明确:它正在把GLM-5.1的能力,进一步压缩到更低延迟、更高吞吐的API服务中。

在大模型应用逐渐走向Agent、AI编程、实时交互和企业自动化的过程中,速度会越来越接近商业化本身。

这也是GLM-5.1-highspeed值得关注的原因:它不是智谱单纯展示模型速度的一次更新,而是上市后公司围绕AI应用、MaaS平台和Token消耗,继续推进商业化的一块拼图。

不做最重的流量入口,而做企业级Agent和MaaS平台

放在国内大模型格局里看,智谱的生态位比较清晰:它不是典型的C端流量入口公司,也不是传统云厂商,而是更偏向模型能力供应商、MaaS平台和企业级Agent服务商。

这决定了它的竞争逻辑和互联网大厂不太一样。

像阿里、腾讯、百度、火山等云厂商,有云资源、办公产品、内容生态和存量客户,可以把大模型嵌入原有业务体系中。

相比之下,智谱没有那么重的流量入口和云生态优势,因此更需要依靠模型能力、开放平台、本地化部署和企业服务来建立差异化。

这也能解释智谱的收入结构。

2025年,智谱本地化部署收入仍然占主要部分,说明它在政企、金融、制造、能源等企业客户侧已有一定基础;

与此同时,云端部署、开放平台API和企业级智能体业务增速更快,说明它正在尝试把过去偏项目制的能力,沉淀到更标准化的平台服务中。

这种路径的优势在于,企业客户对大模型的需求更明确,也更容易对应具体预算。比如知识库、客服、办公、研发、数据分析、代码生成和行业解决方案,都有较强的落地需求。对智谱来说,B端市场可以让它避开单纯C端流量竞争,也更容易形成收入。

但挑战也很明显。企业级市场通常交付更重,客户需求差异更大,销售和服务周期也更长。如果一家大模型公司长期依赖项目制收入,就容易面临“收入增长,但成本也同步上升”的问题。

因此,智谱接下来要看的,不只是能不能拿下更多企业客户,而是能不能把行业需求沉淀成可复用的模型服务和智能体产品。

换句话说,智谱正在尝试从“做项目”走向“做平台”。

本地化部署可以帮助它进入高价值客户场景,API和MaaS平台则决定它能否扩大调用规模,企业级Agent则关系到模型能否真正进入业务流程。三者如果能形成联动,智谱才有机会在云厂商和垂类应用公司之间,站稳一个相对独立的位置。

所以,上市5个月后的智谱,不只是交出了一份收入增长的成绩单,也在回答一个更长期的问题:一家独立大模型公司,能不能在巨头云生态和垂直应用之间,找到自己的企业级AI入口。

这个答案目前还在形成中,但至少从业务走向看,智谱正在把重点放在更适合B端商业化的路径上:模型能力平台化、企业服务产品化、智能体应用行业化。

数据支持天眼查,大模型独家合作账号

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

AI大模型工场专栏: https://www.tuoluo.cn/columns/author1911862/

本文网址: https://www.tuoluo.cn/article/detail-10129054.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

相关文章