腾讯混元重生，推倒重建、奋力追赶的一场赛跑

连线Insight 原创 2026-05-08 20:05 热度 249

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

IP归属：上海

文章AI导读

一键萃取文章精髓，核心观点即刻呈现

# 梳理该事件的完整脉络

# 该文章有哪些有意思的观点或数据

# 大家对该事件的态度表现如何？

文/王慧莹

编辑/子夜

进入2026年，AI大模型的牌桌上玩家已经不多。

当市场仍在消化DeepSeek V4和阿里Qwen3.6的技术参数时，腾讯交出了一份与以往截然不同的答卷——Hy3 preview。

如果只看参数和技术指标，很容易低估这个时间节点对腾讯的意义。Hy3 preview的定位，并非一次普通的模型迭代。它是混元在今年2月完成预训练和强化学习等底层基础设施重建后的第一个模型，也是混元重建后训练的首个版本。

换句话说，这是腾讯在亲手拆掉旧系统后，用一套全新的技术底座和研发逻辑重新训练出来的产品。重建、追赶、回归，不到三个月的时间里，腾讯混元追回到了第一梯队的牌桌上。

腾讯也在回应一个核心命题：手握海量场景与亿级用户的互联网巨头，到底该如何打赢大模型的下半场。

1、重回牌桌，Hy3 preview追到哪儿了？

要理解Hy3 preview的进步，必须先看清过去的混元有多被动。

去年12月，智谱AI、月之暗面等头部厂商，推出新一代基座模型，重新划定了第一梯队的准入标准，模型在真实场景中的可用性，更是取代了公开榜单分数，成为衡量模型价值的核心标尺。

腾讯混元虽然也在迭代，但实际落地的场景远不及榜单的成绩，甚至腾讯体系内的产品能力也很难被混元承接。

2月，混元团队完成了预训练与强化学习两大核心基础设施的全面重做。同期，腾讯完成组织架构调整，撤销成立十年的AI Lab，核心研发人员全员并入混元团队。

三个月后交出来的Hy3 preview，正在证明这条新路径的可行性。

作为混元重建后的第一个模型，Hy3 preview定位语言模型，在复杂推理、指令遵循、上下文学习、代码、智能体能力以及推理性能上均实现了大幅提升。

真正让人眼前一亮的是代码和智能体能力。在SWE-Bench基准测试中，Hy3 preview取得了74.4%的准确率。放在行业坐标系里看，这个成绩已接近智谱GLM-4.7。外界普遍认为，Hy3 preview的代码能力大致追到了智谱2025年12月的水平，相差约4个月。

图源腾讯混元微信公众号

在智能体维度，Hy3 preview在Terminal-Bench 2.0、BrowseComp、WideSearch等基准测试中跻身行业第一梯队。它还支持接入OpenClaw等主流开源智能体框架，在ClawEval和WildClawBench等评测中表现突出。

另一项容易被忽视的能力是上下文学习和指令遵循。Hy3 preview是一个快慢思考融合的混合专家模型，在杂乱冗长上下文中理解和遵循复杂规则的测试中，Hy3 preview也表现出了不俗的能力。

连线Insight让Hy3 preview帮忙查一下最近三个月AI公司模型推出的情况，对比5个不同背景的信源，列出已知事实和矛盾点，给出信度评分。

五分钟内，Hy3 preview不仅列出了表格，还总结出最近三个月AI模型发布呈现 “智能体化、效率化、长上下文”三大趋势，其中涵盖信息交叉验证、多轮搜索等步骤。

整体来看，这些数据说明了两件事。第一，混元重建后的第一个模型，在核心指标上已经达到了可观的基线。第二，也是最关键的，混元重建后已经追赶上了第一梯队。

坦率来讲，如果把Hy3 preview放到行业语境里，它并不足以引发技术震撼。几乎同时，DeepSeek V4、阿里Qwen3.6-Max-Preview等竞品也在陆续登场或释出消息。

但如果拉长时间看，一个在2026年2月才完成底层基础设施重建的团队，1月底开训，不到三个月发布，能追到2025年底第一梯队的水平，这个速度本身就是对重建路径的证明。

当然，要清醒地看到，Hy3 preview追上的只是第一梯队四个月前的水平。动态竞争之下，混元的真正考验不在于preview这一关，而在于接下来的迭代速度能否持续压缩这条差距曲线。

从这个意义上说，Hy3 preview的发布，是腾讯AI真正意义上的一次归队。它不是终点，而是拿到了留在牌桌上的资格。

2、生态为王，腾讯“全家桶”接入

如果说模型能力是重回牌桌的准入门槛，那腾讯生态是Hy3 preview区别于行业所有竞品的核心差异化优势，也是其能够实现快速落地、持续进化的核心支撑。

目前，Hy3 preview已在元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享、腾讯地图、腾讯电子签等产品首发上线，微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等多个主线产品也在陆续接入。

这意味着，混元的底座能力正在渗透到腾讯C端的核心场景中。

全生态接入绝非简单的模型能力堆砌，而是针对不同产品的核心场景完成深度Co-Design协同设计，让Hy3 preview的能力与产品场景实现了深度融合，真正实现了体验重构。

事实上，重构最大的变化，不在于产品接入Hy3 preview的速度，而在于思路的改变。过去两年，混元做模型的逻辑是线性的，即先训练一个通用模型，再拿给各产品线做适配。这次重构之后，模型与产品不是先后关系，而是协同关系，混元从模型训练开始就将“有用”贯穿始终。

要理解这个变化有多根本，元宝莫过于最具C端感知的。接入Hy3 preview后，元宝在写作、闲聊、搜索三大场景的体验提升，连线Insight最直观的感受是元宝更像一个能听懂话的员工，活人感很足。

连线Insight模拟了一个工作场景，“下周要出差见一个消费零售的客户，客户让我在周一中午前准备好问题，同时我们要现场走访做交流，我现在需要根据客户资料写一份访谈问题，同时还要想好现场交流的侧重点，我该怎么安排。”

表面上是访谈问题构思，实际上考验的是元宝对拆分任务、理解需求、上下文部署的能力。接入Hy3 preview的元宝，并非给出一大长串的内容，而是将需求落到访谈问题、基地交流、时间安排等具体的环节中，还给出了需要避坑的建议。

这并非元宝突然变聪明了，而是混元模型团队与元宝产品团队联合优化的结果。Hy3 preview从测试到落地，模型团队和产品团队是联动的，双方合作，根据用户的需求，在各自擅长的方向上调整、优化，反复将混元打磨到能用变成好用，这在混元内部被叫作Co-design（深度协同）。

将这个逻辑从元宝延伸到整个腾讯产品矩阵，尤其是今年爆火的代码与智能体，Hy3 preview也展现出不俗的协同和主动思考能力。

在WorkBuddy中，模型学会了“调查记者式”的主动规划。面对“库克加入小米”这样的模糊指令，它能自主发起六轮工具调用，对信源的权威层级做出内在判断，用多方信源对比表逐层解构传闻。

此外，CodeBuddy首Token延迟降低54%，任务执行成功率稳定在99.99%以上；ima的长文理解能力更强，实现从深度理解到逻辑归纳再到结构化PPT生成的完整自动化链路，用户只需一句自然语言提问，就能完成跨章节信息提取、数据交叉验证、项目可行性分析。

这也意味着，腾讯的整个AI生态呈现出同一个底座支持，不同产品不同长板的优势。

值得注意的是，得益于模型和推理框架上的深度协同，以及在推理框架、算子性能、量化算法等优化，Hy3 preview整体推理效率提升40%，推理成本相比上一代模型大幅下降。

在腾讯云大模型服务平台TokenHub上，Hy3 preview输入价格最低1.2元/百万tokens，输入命中缓存价格0.4元/百万tokens，输出价格最低4元/百万tokens。

图源腾讯混元微信公众号

本质上，Hy3 preview迈出了腾讯混元追赶的第一步。腾讯全场景的真实用户需求，为Hy3 preview的研发提供了优化方向；而海量场景产生的真实交互数据，又能持续反哺模型的能力迭代，让模型在真实使用中不断进化。

3、腾讯AI，要统一作战

把这些变化串起来看，一个更深层的战略图景浮现出来：腾讯AI的竞争逻辑变了。

过去两年，中国AI行业的竞争规则是明确的，谁在通用跑分榜上分数高，谁就能获得更多的资本关注和市场声量。混元也跟着这条规则跑了很久，结果被马化腾批评“太慢了”，上一轮游戏规则里，腾讯优势不明显。

Hy3 preview的真正价值，在于把竞争从别人制定的规则拉回到了自己的主场。

当一个模型的能力是由真实用户的需求和真实场景反向打磨出来的，那这个模型的竞争力就不再取决于它在第三方评测中的排名，而是取决于它在腾讯生态内部的正向循环深度。

这是一个更高级的壁垒。纯模型公司可以在跑分上无限逼近甚至超越GPT，但它们永远无法获得13亿微信用户、8亿QQ用户的真实使用反馈。这些数据就像磨刀石，磨得越久，刀越锋利。

这背后，是腾讯AI组织长达一年的重构。

2025年4月，腾讯对混元大模型研发体系进行重构，将技术部门拆分为大语言模型部和多模态模型部，确立了算法研发的双轨制；同年12月，腾讯新成立AI Infra部、AI Data部、数据计算平台部。前者负责大模型分布式训练与高性能推理服务，后者负责数据与评测体系建设，数据计算平台部负责数据智能融合平台建设。

这是一个清晰的信号，腾讯不再只拼算法，而是开始从算力、数据、工程三条基线上同时发力。

这期间，混元关键人物姚顺雨担任CEO/总裁办公室首席 AI 科学家，同时兼任全新设立的AI Infra 部、大语言模型部双部门负责人，实行双线汇报，直接向腾讯总裁刘炽平、TEG 技术工程事业群负责人卢山汇报。

将模型研发与基础设施统一到一个负责人手中、AI Lab的撤销，腾讯逐步将散落在各处的AI力量集中收拢，围绕混元大模型构建单一主线的研发体系。

3月份的财报会上，刘炽平直言，“过去几个月，腾讯密集进行了整个团队的升级和工作流程的重构”，目的就是让“团队更健壮、组织方式更合理”。

如今，88天的极限冲刺完成后，混元团队面临的考验才刚刚开始，更大的考验来Hy3正式版和后续的迭代中。

姚顺雨对此的表述很克制，“Hy3 preview是混元大模型重建的第一步。我们希望通过这次开源和发布，获得来自开源社区和用户的真实反馈，帮助我们提升Hy3正式版的实用性。”

大模型行业的追赶本身不是线性竞赛，第一梯队也在加速。DeepSeek、字节、阿里等对手不会停下来等腾讯，重建后的研发体系能否保持甚至加速这个迭代节奏，将在接下来2-3个版本中得到更真实的检验。市场对混元3.0正式版的期待已被拉高，腾讯此前也透露混元3.0计划于4月陆续向外开放，preview之后的正式版不能让市场等太久。