前言:
美国风投a16z与全球模型聚合平台OpenRouter联合发布的《State of AI》研究显示,中国开源AI模型的周使用量占比已从2024年底的1.2%飙升至2025年后期的近30%,全球下载量正式超越美国。
100万亿Token的背后,是数千万开发者的用脚投票,是从模式预测到机器思考的技术跃迁。
图片来源|网 络
中国开源AI的爆发式增长
2024年底,在OpenRouter平台的全球流量池中,中国开源模型的身影几乎可以忽略不计,1.2%的周使用量占比,让其只能徘徊在全球AI生态的边缘。
彼时,行业共识依然是闭源模型定调技术上限,开源模型只是廉价平替,Meta的Llama系列、OpenAI的GPT家族牢牢掌控着话语权。
谁也没有想到,这场力量对比的反转会来得如此迅猛。
2025年,随着DeepSeek V3、Qwen 3 Coder、Kimi K2等模型密集发布,中国开源AI开启了指数级增长模式。
每一次重要版本更新都伴随着使用量的显著跃升,且增长极具持续性,表明这些模型已深度融入真实生产工作流。
到2025年后期,部分周度的使用量占比已逼近30%,全年平均份额稳定在13%左右,与其他地区开源模型的平均份额基本持平。
更具里程碑意义的是,中国开源模型的全球下载量在2025年中完成了历史性反超。
Hugging Face数据显示,截至2025年8月,中国开源模型的累计下载量已超越美国。
仅阿里Qwen系列就贡献了月度40%以上的新衍生模型,衍生模型总数突破18万,远超Meta Llama系列的15%占比。
DeepSeek模型更是以1.28万次点赞成为Hugging Face平台最受欢迎的开源模型,是Llama头号模型点赞数的两倍。
这场爆发式增长的背后,是中国开源生态从单点突破到集团军作战的进化。
2024年底,DeepSeek家族曾占据超50%的开源Token量,形成一家独大的格局。
而到2025年底,市场已演变为五强争霸的战国时代,没有任何单一开源模型能持续占据超过25%的市场份额。
流量均匀分布在DeepSeek、Qwen、Kimi K2、MiniMax M2、GPT-OSS等五到七个主要竞争者之间。
这种健康的多元化态势,既为开发者提供了更丰富的选择,也迫使模型提供者通过持续创新维持竞争力,推动整个生态螺旋式上升。
中型模型崛起与推理能力革新
报告数据显示,中国模型在核心技术维度实现了三大关键突破,彻底打破了开源模型性能不如闭源的刻板印象。
①中型模型的崛起:过去,开源模型市场呈现两极分化,要么是参数少于150亿的小型模型,虽轻便但能力有限;要么是参数超700亿的大型模型,虽强大但成本高昂。
中国团队率先找到了破局之道,参数在150亿到700亿之间的中型模型,在能力与效率之间实现了最佳平衡。
2024年11月Qwen2.5-Coder-32B发布后,Mistral Small 3、GPT-OSS 20B等模型迅速跟进,共同催生了中型模型这一新兴赛道。
这类模型足够聪明,能处理复杂逻辑推理和代码生成,又足够轻盈,推理成本低廉,成为支撑100万亿Token处理量的中流砥柱。
②推理范式革新:2024年12月OpenAI发布o1模型,标志着AI从文本预测迈入机器思考时代,而中国开源模型快速跟进并实现超越。
DeepSeek R1、Qwen3等模型引入扩展的推理时计算过程,包含内部多步思考、潜在规划和迭代优化,在数学推理、逻辑一致性和多步决策等方面实现系统性提升。
报告显示,推理模型的Token处理量已占总量的50%,其中DeepSeek R1、Qwen3均跻身推理模型使用量前列。
而马斯克xAI旗下的Grok Code Fast 1虽占据推理流量榜首,但中国模型的追赶速度让行业瞩目。
更关键的是成本效率的颠覆性突破,在GPU资源受限的背景下,中国团队通过极致优化的数据处理、稀疏注意力等前沿架构,将大模型训练成本压缩至原来的10%。
以Kimi K2为例,其256K上下文、200-300次工具调用的强大能力,训练成本仅460万美元,而美国同规模闭源模型的训练成本预估高达3亿美元。
DeepSeek-V3仅用2048个GPU在57天内完成训练,成本约557.6万美元,仅为其他主流模型的1/10。
这种成本优势转化为市场竞争力,中国开源模型的每百万Token成本普遍低于0.4美元,而OpenAI的GPT-4/5高达35美元,Anthropic的Claude系列约2美元。
英伟达CEO黄仁勋直言,DeepSeek和Qwen是[开源AI模型之中最好的]。
Airbnb CEO布莱恩·切斯基公开表示,公司核心应用大量依赖Qwen,其[比OpenAI的产品更好更便宜]。
硅谷80%的初创公司选择中国开源模型,只因每月1亿Token的使用成本能从30万美元暴跌至1400美元,成本优势直接决定了企业的生存能力。
编程与角色扮演的[双引擎]驱动
100万亿Token的数据揭示了一个反直觉的真相,AI的核心价值不仅在于生产力提升,更在于情感连接与创造性表达。
编程与角色扮演两大场景,共同构成了中国开源AI的增长双引擎,合计占据了大部分开源模型Token使用量。
编程场景的爆发式增长尤为引人注目,2025年编程相关的查询量从年初占总Token量的11%攀升至年底的超过50%,成为第一大应用场景。
这一趋势背后是AI对开发工作流程的彻底重构,如今的编程任务不再局限于简单的代码补全,而是扩展到复杂的系统设计、调试优化和多步骤问题解决。
中国开源模型在编程领域的表现尤为亮眼,Qwen3-Coder在多项国际编程测试中表现出色,甚至能与Anthropic的Claude系列掰手腕,迫使Claude在OpenRouter上的编程场景市场份额从7月的46%一个月内降至32%。
DeepSeek、MiniMax等模型也在开源编程领域快速崛起,形成对西方模型的有力冲击。
而在开源模型的使用中,角色扮演场景的占比更是高达52%,超过了编程场景,成为最受欢迎的应用方向。
中国开源模型在这一领域占据绝对优势,DeepSeek的流量中,有惊人的三分之二来自角色扮演和休闲聊天。
对于海量C端用户而言,AI首先是[情感投射对象],其次才是工具。
这种被主流叙事忽略的需求,在开源社区得到了充分释放,形成了巨大的[供需真空]。
编程与角色扮演的双轮驱动揭示了AI生态的多元性,闭源模型更像[穿着西装的精英],专注于严肃的生产力场景。
而中国开源模型则兼具[工程师]与[游吟诗人]的双重特质,既能够高效处理代码逻辑,又能灵活满足情感与创意需求。
这种全场景覆盖能力,让中国开源模型获得了更广泛的用户基础,也为生态增长提供了源源不断的动力。
水晶鞋效应与回旋镖效应
在模型迭代速度日新月异的AI行业,吸引用户不难,留住用户才是真正的核心竞争力。
报告提出的[灰姑娘水晶鞋效应]与中国模型独有的[回旋镖效应],揭示了中国开源AI高粘性的底层逻辑。
[灰姑娘水晶鞋效应]的核心是:当一个新模型恰好满足了一类长期未被解决的高价值需求时,就会形成[完美契合],用户会将其深度融入工作流和业务流程,形成强大的锁定效应。
即使后续出现更优的替代方案,高昂的迁移成本也让用户难以割舍,中国模型精准把握了这一逻辑,契合了中小企业的降本需求。
更具中国特色的是DeepSeek展现出的[回旋镖效应],部分用户在尝试其他模型后,会重新回归DeepSeek。
这种现象背后,是中国模型在特定维度建立的难以替代的优势,可能是成本效率、特定领域的性能,或是对中文场景的深度适配。
用户在探索其他选项后发现,在角色扮演、中文编程、长文档处理等场景中,中国模型依然是[无可替代的旧爱]。
这种基于独特体验的留存,比单纯依靠技术参数堆砌的竞争力更加坚固。
中国模型的高留存,还得益于对用户行为变化的敏锐捕捉。
报告显示,2025年用户发送给AI的平均提示词长度从1500个Token增长到6000多个,增长了近4倍。
AI的输出内容从平均150个Token增长到400个,增长了近3倍。
这一变化反映了AI角色从[助手]到[协作者]的转变,而中国模型早早就布局了长上下文处理能力。
从硅谷主导到多极共生
中国开源AI的崛起,正在打破全球AI发展的[西方中心论],推动形成全球分布式创新的新格局。
报告数据显示,亚洲在全球AI使用量中的份额已从约13%显著提升至31%,北美份额则从50%以上首次跌破50%,标志着AI使用正从美国主导转向全球共享。
全球企业对中国开源模型的接纳,正在突破地缘的壁垒。
Airbnb的客服AI由13个模型组成,在很大程度上依赖阿里Qwen。
硅谷初创公司纷纷将推理任务、RAG应用迁移到Kimi K2。
Meta甚至在最新的[牛油果]模型训练中,蒸馏了阿里Qwen的开源模型。
这种接纳的背后,是商业逻辑的必然选择,在AI研发成本高企、商业化压力增大的背景下,中国模型[又好又便宜]的优势几乎无法抗拒。
对于中小企业和初创公司而言,中国开源模型的低成本意味着[活下去]的可能。
对于大型企业而言,中国模型的高适配性和灵活性能够降低试错成本、提升创新效率。
目前,在LMArena、Artificial Analysis等多个开源模型排行榜上,前10名几乎全部来自中国团队,中国已成为全球开源AI技术标准的重要制定者之一。
推理即服务,生态定胜负
中国开源AI的成功,正是在于找到了自己的独特定位,不是成为闭源模型的[平替],而是成为AI普及的[基础设施],就像Linux、MySQL一样,通过开放共享推动整个行业的进步。
中国开源AI正在通过技术普惠+生态共建的路径,构建一个全球性的开发者社区。
当大量开发者和企业基于中国开源框架构建应用时,其背后的工具链、评测基准、安全规范将潜移默化地成为全球产业的一部分。
部分资料参考:腾讯科技:《a16z 100万亿Token研究揭示的真相:中国力量重塑全球AI版图》,算泥:《一百万亿Token里的AI现状:OpenRouter和a16z重磅研究带你透视AI江湖》,快刀青衣:《100万亿token背后六大洞察:效率与创意并重》,凤凰网科技:《昔日开源霸主承认蒸馏阿里千问,世界进入中国AI时间》,紫金财经:《AI浪潮之下,国产大模型赶超了吗?》,奇偶工作室:《80%美国小公司,都在使用中国开源模型!成本是生死线》










