智谱上市5个月，交出了一份怎样的AI答卷？

AI大模型工场原创 2026-05-29 16:29 热度 830

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

IP归属：北京

文章AI导读

一键萃取文章精髓，核心观点即刻呈现

# 梳理该事件的完整脉络

# 该文章有哪些有意思的观点或数据

# 大家对该事件的态度表现如何？

作者｜冰拿铁

编辑｜星奈

媒体｜AI大模型工场

智谱大涨，市值逼近9000亿港元！

5月29日，港股智谱午后股价继续拉升，截至发稿，涨超22%，股价报1984港元/股，市值逼近9000亿港元。一个上市才几个月的大模型公司，市值突然站到了中国互联网巨头的前排。

而在股价走高之前，智谱也刚好给市场递出了一张新的产品牌。

5月22日，智谱推出GLM-5.1 高速版API，官方披露输出速度达到400 tokens/s，主要面向AI编程、实时交互、商业决策、实时语音等低延迟场景，目前已向MaaS平台部分企业客户开放。

所以，现在看智谱，不能只看它又发了一个模型，也不能只看它股价涨了多少。

真正值得追问的是：资本市场为什么愿意给一家仍在重投入、重亏损阶段的大模型公司如此高的估值？高速API、企业级Agent和MaaS平台，能不能把“模型能力”变成真实调用量，再把调用量变成可持续收入？

上市5个月后，智谱交出的这份成绩单，表面上是股价和市值的狂飙，底层其实是大模型公司商业化路径的一次集中验证。

它能不能撑住这个估值，关键不在于故事讲得多像“中国版 OpenAI”，而在于接下来能不能证明：自己不只是会训练模型，也能把模型卖进企业、嵌进应用、跑出规模。

智谱先交出了一份高增长、重投入的财务答卷

上市之前，智谱身上的标签比较明确：清华系背景、GLM系列模型、国内大模型创业公司代表之一。它被讨论时，更多是在技术路线和模型能力的语境里。

但上市之后，外界对它的关注开始变得更具体。

资本市场不会只看一次模型发布，也不会只看某个榜单分数。它会持续追问：收入在哪里，增长来自哪里，客户愿不愿意持续付费，亏损是否有收窄可能，业务结构有没有从项目制向平台化迁移。

从财务数据看，智谱2025年的收入增长比较明显。全年收入7.24亿元，同比增长131.9%。这个规模放在整个大模型行业里，至少说明智谱已经不只是停留在模型展示和概念验证阶段，而是有了一定数量的真实客户和付费场景。

但与此同时，亏损也仍然是绕不开的问题。经调整净亏损31.82亿元，说明大模型公司的商业化仍然处在高投入阶段。

训练、推理、研发、模型服务、企业交付、云端平台建设，每一项都需要持续投入。尤其当模型从实验室能力走向企业生产环境，成本结构并不会马上变轻。

所以，智谱这份财报更像是一份“增长进展表”，而不是“盈利证明书”。

更值得关注的是收入结构。按部署方式看，2025年智谱本地化部署收入约5.34亿元，同比增长102.3%，仍然是主要收入来源；云端部署收入约1.90亿元，同比增长292.6%，占总收入比重从2024年的15.5%提升至26.3%。

按产品线看，开放平台及API收入约1.90亿元，企业级智能体收入约1.66亿元，同比增长248.8%。

不难看出，智谱仍然依赖本地化部署打底，但云端API和企业级智能体正在变得更重要。

本地化部署适合政企、金融、能源、制造等场景。这类客户对数据安全、私有化和系统可控性要求较高，也更愿意为定制化服务付费。对智谱来说，这部分业务可以提供比较确定的收入基础。

但如果长期只依赖本地化项目，大模型公司容易变成偏重交付的工程服务商。项目收入可以增长，但标准化程度、毛利弹性和平台效应都会受到一定限制。

相比之下，云端API和智能体业务更能体现大模型公司的平台价值。API对应的是调用量和Token消耗，智能体对应的是模型从“回答问题”走向“完成任务”。

这两部分业务的增长，说明智谱正在尝试把模型能力转化成更标准化、更可复用的产品形态。

当然，这种迁移还处在进行时。云端部署占比虽然提升，但本地化部署仍然占大头；智能体业务增长较快，但能否形成稳定复购，还需要继续观察。

从这个角度看，上市5个月后的智谱，已经交出了一些阶段性进展：收入在增长，业务结构在变化，API和智能体开始贡献更高增速。但它同时也处在一个很典型的大模型公司阶段：增长较快，投入更重，盈利周期仍不明朗。

把竞争焦点从“模型能力”推向“模型可用性”

而智谱最近一次被市场集中关注，发生在5月22日。

当天，港股AI应用概念股集体拉升，智谱盘中一度大涨超30%，股价再创历史新高；MINIMAX、滴普科技、五一视界等AI相关标的也出现明显上涨。

这轮情绪并不只来自单一消息。一方面，智谱此前一直被视为“中国版OpenAI”，而近期OpenAI也传出加快推进IPO的消息，某种程度上强化了市场对AI应用和大模型公司的想象空间。

另一方面，智谱当天上午宣布面向部分企业客户开放 GLM-5.1高速版API——GLM-5.1-highspeed，也给市场提供了更直接的产品催化。

从产品指标看，GLM-5.1-highspeed最核心的关键词就是：快。

根据智谱披露的信息，GLM-5.1高速版API的模型输出速度达到 400 tokens/s，刷新当前全球大模型厂商API的速度上限。它主要面向AI编程、实时交互、商业决策、实时语音等对响应延迟要求较高的场景。

对普通用户来说，400 tokens/s最直观的感受，是模型输出更快、等待时间更短。但放到大模型应用落地的语境下，速度提升的意义并不只是体验优化。

因为很多AI应用，尤其是Agent类应用，并不是一次问答就结束。

比如在Coding Agent场景中，一个复杂任务往往不是一次调用就结束，而是需要多轮规划、多轮代码生成、多轮调试、多轮工具调用。

如果每一次模型调用都很慢，整个Agent链路就会被严重拖慢。用户感受到的不是“模型思考得很深”，而是“这个工具不好用”。

再比如实时语音、在线客服、商业决策辅助、办公自动化等场景，延迟会直接影响体验。一旦模型响应速度达不到要求，很多看似成立的应用场景，实际落地时都会变得很尴尬。

所以，GLM-5.1-highspeed的价值，不只是让智谱多了一个高速版本，而是让GLM-5.1更适合进入高频、连续、低延迟的业务场景。

从技术实现看，GLM-5.1高速版API由智谱GLM团队与TileRT团队联合打造，并不是简单通过牺牲模型能力来换速度，而是在推理引擎、调度系统和底层基础设施三个层面进行了系统级优化。

在推理引擎层，团队针对GLM-5.1的架构特点重写了核心推理路径，以提升单卡吞吐能力；在调度系统层，通过动态批处理、请求合并和KV缓存调度优化，降低高并发场景下的尾延迟；在基础设施层，则围绕推理集群部署、网络链路和负载均衡做协同优化。

换句话说，400 tokens/s并不是一个单纯的峰值指标，智谱希望把它做成稳定可用的生产级能力。

这也是大模型行业接下来竞争的一个重要变化。

早期大家更关注模型有多聪明，参数有多大，榜单分数有多高。

但当模型进入企业系统、开发者工具和Agent工作流之后，客户会更在意另一组指标：调用速度是否稳定，高并发能不能扛住，长上下文是否顺畅，Function Call是否可靠，API接入是否方便，单位Token成本能不能控制。

也就是说，大模型公司的竞争，正在从“模型能力”延伸到“模型服务能力”。

这对智谱尤其重要。作为上市公司，智谱需要不断向市场证明，模型升级不只是技术新闻，也能和商业化进展发生关系。GLM-5.1-highspeed的发布，恰好把模型性能、API调用、企业客户和Agent应用连接到了一起。

与此同时，外部环境也在强化AI应用侧的预期。

政策层面，5月22日，国家发改委政策研究室副主任李超表示，近期国家发改委正在谋划出台加快人工智能落地的配套文件，进一步加大要素保障，并将持续推动央国企开放高价值应用场景，面向各行业、各领域、各地方打造人工智能标杆应用，加快引导人工智能融入经营管理等环节。

机构观点也在关注这一方向。国信证券指出，AI Agent发展迅速，大模型Agentic能力提升、OpenClaw持续破圈，有望加速AI能力渗透，持续看好AI应用端机会。

这和智谱这次的产品路线刚好契合。GLM-5.1-highspeed适合AI编程、实时交互、实时语音和商业决策，本质上都是更靠近应用层的能力。它不是只服务模型评测，而是服务更具体的业务调用。

还有个值得关注的点是，“Token运营”正在成为AI产业链里的新变量。

近期，国内外越来越多公司开始参与Token运营和分销，特别是电信运营商、营销公司等角色逐渐进入大模型产业链。

招商证券认为，“Token运营”能够兼顾AI产业链不同主体的利益诉求，推动产业链更快发展。

对大模型公司来说，训练和推理都需要大量算力投入，现金流压力普遍较大。模型厂商生产了大量Token，但真正愿意持续为Token付费的用户和企业仍在培养过程中。

如果出现更多Token运营商，能够提前采购、分销和运营模型调用能力，就有可能帮助大模型公司改善现金流，也加快Token消耗进入更多应用场景。

这也是为什么，GLM-5.1-highspeed这样的高速API不只是技术指标。

当模型API变得更快、更稳定，才更适合被运营商、企业服务商、开发者平台和应用公司进一步包装、分发和集成。速度提升带来的不只是用户体验改善，也可能提高Token被消费的频率和场景密度。

对于智谱来说，这正好对应上市后的商业化主线：从本地化部署，到云端API，再到企业级智能体和MaaS平台。

财报数据显示，智谱的云端部署、开放平台API和企业级智能体业务都在保持较快增长。GLM-5.1-highspeed的推出，实际上是在补强这条业务线最基础的能力：让模型调用更快、更稳，也更适合承接Agent和高频应用。

当然，目前GLM-5.1-highspeed仍然主要面向部分企业客户开放，后续能否扩大覆盖范围、在更多开发者和行业客户中形成持续使用，还需要进一步观察。

但从产品方向看，智谱这次更新释放出的信号比较明确：它正在把GLM-5.1的能力，进一步压缩到更低延迟、更高吞吐的API服务中。

在大模型应用逐渐走向Agent、AI编程、实时交互和企业自动化的过程中，速度会越来越接近商业化本身。

这也是GLM-5.1-highspeed值得关注的原因：它不是智谱单纯展示模型速度的一次更新，而是上市后公司围绕AI应用、MaaS平台和Token消耗，继续推进商业化的一块拼图。

不做最重的流量入口，而做企业级Agent和MaaS平台

放在国内大模型格局里看，智谱的生态位比较清晰：它不是典型的C端流量入口公司，也不是传统云厂商，而是更偏向模型能力供应商、MaaS平台和企业级Agent服务商。

这决定了它的竞争逻辑和互联网大厂不太一样。

像阿里、腾讯、百度、火山等云厂商，有云资源、办公产品、内容生态和存量客户，可以把大模型嵌入原有业务体系中。

相比之下，智谱没有那么重的流量入口和云生态优势，因此更需要依靠模型能力、开放平台、本地化部署和企业服务来建立差异化。

这也能解释智谱的收入结构。

2025年，智谱本地化部署收入仍然占主要部分，说明它在政企、金融、制造、能源等企业客户侧已有一定基础；

与此同时，云端部署、开放平台API和企业级智能体业务增速更快，说明它正在尝试把过去偏项目制的能力，沉淀到更标准化的平台服务中。

这种路径的优势在于，企业客户对大模型的需求更明确，也更容易对应具体预算。比如知识库、客服、办公、研发、数据分析、代码生成和行业解决方案，都有较强的落地需求。对智谱来说，B端市场可以让它避开单纯C端流量竞争，也更容易形成收入。

但挑战也很明显。企业级市场通常交付更重，客户需求差异更大，销售和服务周期也更长。如果一家大模型公司长期依赖项目制收入，就容易面临“收入增长，但成本也同步上升”的问题。

因此，智谱接下来要看的，不只是能不能拿下更多企业客户，而是能不能把行业需求沉淀成可复用的模型服务和智能体产品。

换句话说，智谱正在尝试从“做项目”走向“做平台”。

本地化部署可以帮助它进入高价值客户场景，API和MaaS平台则决定它能否扩大调用规模，企业级Agent则关系到模型能否真正进入业务流程。三者如果能形成联动，智谱才有机会在云厂商和垂类应用公司之间，站稳一个相对独立的位置。

所以，上市5个月后的智谱，不只是交出了一份收入增长的成绩单，也在回答一个更长期的问题：一家独立大模型公司，能不能在巨头云生态和垂直应用之间，找到自己的企业级AI入口。

这个答案目前还在形成中，但至少从业务走向看，智谱正在把重点放在更适合B端商业化的路径上：模型能力平台化、企业服务产品化、智能体应用行业化。

数据支持天眼查，大模型独家合作账号

模型公司能力模型场景应用

陀螺科技现已开放专栏入驻，详情请见入驻指南： https://www.tuoluo.cn/article/detail-27547.html

AI大模型工场专栏： https://www.tuoluo.cn/columns/author1911862/

本文网址： https://www.tuoluo.cn/article/detail-10129054.html

免责声明：
1、本文版权归原作者所有，仅代表作者本人观点，不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为，侵权责任将由作者本人承担。

上一篇：视涯科技拟与歌尔签16亿元硅基OLED合同

下一篇：选型、演进、实战：腾讯云AI产业应用大会，16个专场拆解Agent产品底层逻辑

AI进入下半场：模型不再稀缺，真正稀缺的是算力、场景和信...

Anthropic交表，MiniMax冲A，而我最想聊的...

从“卖云”到“卖Token”：运营商全面加入AI战场

重新定义AI价值标尺，百度用“DAA”打开产业下一幕

Token时代，移动云不止有云

后龙虾时代：谁在成为企业落地AI的真正底座？