文/王慧莹
编辑/子夜
进入2026年,AI大模型的牌桌上玩家已经不多。
当市场仍在消化DeepSeek V4和阿里Qwen3.6的技术参数时,腾讯交出了一份与以往截然不同的答卷——Hy3 preview。
如果只看参数和技术指标,很容易低估这个时间节点对腾讯的意义。Hy3 preview的定位,并非一次普通的模型迭代。它是混元在今年2月完成预训练和强化学习等底层基础设施重建后的第一个模型,也是混元重建后训练的首个版本。
换句话说,这是腾讯在亲手拆掉旧系统后,用一套全新的技术底座和研发逻辑重新训练出来的产品。重建、追赶、回归,不到三个月的时间里,腾讯混元追回到了第一梯队的牌桌上。
腾讯也在回应一个核心命题:手握海量场景与亿级用户的互联网巨头,到底该如何打赢大模型的下半场。
1、重回牌桌,Hy3 preview追到哪儿了?
要理解Hy3 preview的进步,必须先看清过去的混元有多被动。
去年12月,智谱AI、月之暗面等头部厂商,推出新一代基座模型,重新划定了第一梯队的准入标准,模型在真实场景中的可用性,更是取代了公开榜单分数,成为衡量模型价值的核心标尺。
腾讯混元虽然也在迭代,但实际落地的场景远不及榜单的成绩,甚至腾讯体系内的产品能力也很难被混元承接。
2月,混元团队完成了预训练与强化学习两大核心基础设施的全面重做。同期,腾讯完成组织架构调整,撤销成立十年的AI Lab,核心研发人员全员并入混元团队。
三个月后交出来的Hy3 preview,正在证明这条新路径的可行性。
作为混元重建后的第一个模型,Hy3 preview定位语言模型,在复杂推理、指令遵循、上下文学习、代码、智能体能力以及推理性能上均实现了大幅提升。
真正让人眼前一亮的是代码和智能体能力。在SWE-Bench基准测试中,Hy3 preview取得了74.4%的准确率。放在行业坐标系里看,这个成绩已接近智谱GLM-4.7。外界普遍认为,Hy3 preview的代码能力大致追到了智谱2025年12月的水平,相差约4个月。
图源腾讯混元微信公众号
在智能体维度,Hy3 preview在Terminal-Bench 2.0、BrowseComp、WideSearch等基准测试中跻身行业第一梯队。它还支持接入OpenClaw等主流开源智能体框架,在ClawEval和WildClawBench等评测中表现突出。
另一项容易被忽视的能力是上下文学习和指令遵循。Hy3 preview是一个快慢思考融合的混合专家模型,在杂乱冗长上下文中理解和遵循复杂规则的测试中,Hy3 preview也表现出了不俗的能力。
连线Insight让Hy3 preview帮忙查一下最近三个月AI公司模型推出的情况,对比5个不同背景的信源,列出已知事实和矛盾点,给出信度评分。
五分钟内,Hy3 preview不仅列出了表格,还总结出最近三个月AI模型发布呈现 “智能体化、效率化、长上下文”三大趋势,其中涵盖信息交叉验证、多轮搜索等步骤。
整体来看,这些数据说明了两件事。第一,混元重建后的第一个模型,在核心指标上已经达到了可观的基线。第二,也是最关键的,混元重建后已经追赶上了第一梯队。
坦率来讲,如果把Hy3 preview放到行业语境里,它并不足以引发技术震撼。几乎同时,DeepSeek V4、阿里Qwen3.6-Max-Preview等竞品也在陆续登场或释出消息。
但如果拉长时间看,一个在2026年2月才完成底层基础设施重建的团队,1月底开训,不到三个月发布,能追到2025年底第一梯队的水平,这个速度本身就是对重建路径的证明。
当然,要清醒地看到,Hy3 preview追上的只是第一梯队四个月前的水平。动态竞争之下,混元的真正考验不在于preview这一关,而在于接下来的迭代速度能否持续压缩这条差距曲线。
从这个意义上说,Hy3 preview的发布,是腾讯AI真正意义上的一次归队。它不是终点,而是拿到了留在牌桌上的资格。
2、生态为王,腾讯“全家桶”接入
如果说模型能力是重回牌桌的准入门槛,那腾讯生态是Hy3 preview区别于行业所有竞品的核心差异化优势,也是其能够实现快速落地、持续进化的核心支撑。
目前,Hy3 preview已在元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享、腾讯地图、腾讯电子签等产品首发上线,微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等多个主线产品也在陆续接入。
这意味着,混元的底座能力正在渗透到腾讯C端的核心场景中。
全生态接入绝非简单的模型能力堆砌,而是针对不同产品的核心场景完成深度Co-Design协同设计,让Hy3 preview的能力与产品场景实现了深度融合,真正实现了体验重构。
事实上,重构最大的变化,不在于产品接入Hy3 preview的速度,而在于思路的改变。过去两年,混元做模型的逻辑是线性的,即先训练一个通用模型,再拿给各产品线做适配。这次重构之后,模型与产品不是先后关系,而是协同关系,混元从模型训练开始就将“有用”贯穿始终。
要理解这个变化有多根本,元宝莫过于最具C端感知的。接入Hy3 preview后,元宝在写作、闲聊、搜索三大场景的体验提升,连线Insight最直观的感受是元宝更像一个能听懂话的员工,活人感很足。
连线Insight模拟了一个工作场景,“下周要出差见一个消费零售的客户,客户让我在周一中午前准备好问题,同时我们要现场走访做交流,我现在需要根据客户资料写一份访谈问题,同时还要想好现场交流的侧重点,我该怎么安排。”
表面上是访谈问题构思,实际上考验的是元宝对拆分任务、理解需求、上下文部署的能力。接入Hy3 preview的元宝,并非给出一大长串的内容,而是将需求落到访谈问题、基地交流、时间安排等具体的环节中,还给出了需要避坑的建议。
这并非元宝突然变聪明了,而是混元模型团队与元宝产品团队联合优化的结果。Hy3 preview从测试到落地,模型团队和产品团队是联动的,双方合作,根据用户的需求,在各自擅长的方向上调整、优化,反复将混元打磨到能用变成好用,这在混元内部被叫作Co-design(深度协同)。
将这个逻辑从元宝延伸到整个腾讯产品矩阵,尤其是今年爆火的代码与智能体,Hy3 preview也展现出不俗的协同和主动思考能力。
在WorkBuddy中,模型学会了“调查记者式”的主动规划。面对“库克加入小米”这样的模糊指令,它能自主发起六轮工具调用,对信源的权威层级做出内在判断,用多方信源对比表逐层解构传闻。
此外,CodeBuddy首Token延迟降低54%,任务执行成功率稳定在99.99%以上;ima的长文理解能力更强,实现从深度理解到逻辑归纳再到结构化PPT生成的完整自动化链路,用户只需一句自然语言提问,就能完成跨章节信息提取、数据交叉验证、项目可行性分析。
这也意味着,腾讯的整个AI生态呈现出同一个底座支持,不同产品不同长板的优势。
值得注意的是,得益于模型和推理框架上的深度协同,以及在推理框架、算子性能、量化算法等优化,Hy3 preview整体推理效率提升40%,推理成本相比上一代模型大幅下降。
在腾讯云大模型服务平台TokenHub上,Hy3 preview输入价格最低1.2元/百万tokens,输入命中缓存价格0.4元/百万tokens,输出价格最低4元/百万tokens。
图源腾讯混元微信公众号
本质上,Hy3 preview迈出了腾讯混元追赶的第一步。腾讯全场景的真实用户需求,为Hy3 preview的研发提供了优化方向;而海量场景产生的真实交互数据,又能持续反哺模型的能力迭代,让模型在真实使用中不断进化。
3、腾讯AI,要统一作战
把这些变化串起来看,一个更深层的战略图景浮现出来:腾讯AI的竞争逻辑变了。
过去两年,中国AI行业的竞争规则是明确的,谁在通用跑分榜上分数高,谁就能获得更多的资本关注和市场声量。混元也跟着这条规则跑了很久,结果被马化腾批评“太慢了”,上一轮游戏规则里,腾讯优势不明显。
Hy3 preview的真正价值,在于把竞争从别人制定的规则拉回到了自己的主场。
当一个模型的能力是由真实用户的需求和真实场景反向打磨出来的,那这个模型的竞争力就不再取决于它在第三方评测中的排名,而是取决于它在腾讯生态内部的正向循环深度。
这是一个更高级的壁垒。纯模型公司可以在跑分上无限逼近甚至超越GPT,但它们永远无法获得13亿微信用户、8亿QQ用户的真实使用反馈。这些数据就像磨刀石,磨得越久,刀越锋利。
这背后,是腾讯AI组织长达一年的重构。
2025年4月,腾讯对混元大模型研发体系进行重构,将技术部门拆分为大语言模型部和多模态模型部,确立了算法研发的双轨制;同年12月,腾讯新成立AI Infra部、AI Data部、数据计算平台部。前者负责大模型分布式训练与高性能推理服务,后者负责数据与评测体系建设,数据计算平台部负责数据智能融合平台建设。
这是一个清晰的信号,腾讯不再只拼算法,而是开始从算力、数据、工程三条基线上同时发力。
这期间,混元关键人物姚顺雨担任CEO/总裁办公室首席 AI 科学家,同时兼任全新设立的AI Infra 部、大语言模型部双部门负责人,实行双线汇报,直接向腾讯总裁刘炽平、TEG 技术工程事业群负责人卢山汇报。
将模型研发与基础设施统一到一个负责人手中、AI Lab的撤销,腾讯逐步将散落在各处的AI力量集中收拢,围绕混元大模型构建单一主线的研发体系。
3月份的财报会上,刘炽平直言,“过去几个月,腾讯密集进行了整个团队的升级和工作流程的重构”,目的就是让“团队更健壮、组织方式更合理”。
如今,88天的极限冲刺完成后,混元团队面临的考验才刚刚开始,更大的考验来Hy3正式版和后续的迭代中。
姚顺雨对此的表述很克制,“Hy3 preview是混元大模型重建的第一步。我们希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助我们提升Hy3正式版的实用性。”
大模型行业的追赶本身不是线性竞赛,第一梯队也在加速。DeepSeek、字节、阿里等对手不会停下来等腾讯,重建后的研发体系能否保持甚至加速这个迭代节奏,将在接下来2-3个版本中得到更真实的检验。市场对混元3.0正式版的期待已被拉高,腾讯此前也透露混元3.0计划于4月陆续向外开放,preview之后的正式版不能让市场等太久。
图源腾讯官网
更关键的挑战来自生态价值的商业兑现。目前,接入混元全家桶是能力渗透,而不是商业模式,To C的付费、To B的API输出、云服务打包销售等商业化仍在探索中。
2025年全年,腾讯云已实现全年规模化盈利,AI相关服务需求驱动企业服务收入同比增长接近20%。但混元想要拉动利润,还需要更清晰的商业设计。
此外,Co-Design模式大范围的推广也是挑战。腾讯生态拥有数十款核心产品,如何将这种场景反向训练模型的机制从元宝和WorkBuddy扩展到更广泛的产品矩阵,并在组织层面确保每个产品团队都具备与模型团队深度Co-Design的能力和意愿,是一个远比发一个模型版本更复杂的系统工程。
正如马化腾所说,腾讯的风格就是稳扎稳打,Hy3 preview是跑起来的第一步,而腾讯AI下半场的真正考验,在于接下来跑得远不远、稳不稳。
(本文头图来源于腾讯混元微信公众号。)










