生成式人工智能这波浪潮,正在孕育新一轮产业创新机遇。
回顾互联网的发展,第一代平台经济诞生了阿里巴巴、腾讯等科技巨头;移动互联网时代又成长出字节跳动、小红书等新兴平台。然而,在此后相当长的一段时间里,科技行业鲜有真正意义上的平台级新巨头出现。
而今,随着ChatGPT 5.5、Claude 4.7、DeepSeek V4等大模型迭代出现,大量新型企业如雨后春笋般涌现,以“一人公司”为代表的新兴组织形态开始走向现实,人们的工作流也正被更高效的方式重新塑造。
“接下来,企业必将进入AI原生时代。”InfiX.ai创始人兼首席科学家杨红霞教授在Beyond expo 2026数字AI峰会上,分享了她对这轮生成式AI浪潮的观察与思考。
提及杨红霞,业界并不陌生。她曾担任阿里巴巴达摩院M6大模型负责人,主导研发AliGraph、M6等开源平台;随后加入字节跳动,担任大语言模型研发技术专家。2024年离开字节后,她又加入香港理工大学担任讲座教授,并创立AI原生基础设施公司 InfiX.ai。
在Beyond expo 2026举办期间,《前方智能》有幸与杨红霞展开了一场深度对话,探寻生成式人工智能时代的产业变革方向,以及下一代企业形态的演进路径。
01
AI原生时代下,企业面临的现实困境
“在云原生时代,得益于Linux 等开源操作系统,任何企业想要做云原生开发,都有现成的底层地基可循。但到了AI原生时代,这样一套通用且能适配各行各业的基础设施,其实是缺失的。”对话伊始,杨红霞便指出了她的判断:AI原生时代的挑战并非模型能力本身,而是支撑产业智能化落地的底层基础设施尚未成熟。
过去几年,大模型能力的持续突破,让很多人认为,企业只需要调用大模型API、购买Token服务,便能够完成AI转型。但现实远比想象复杂。在杨红霞看来,这种看似快捷的模式背后,实则存在两大痛点。
首先,是数据安全与隐私合规问题。垂直行业一旦调用公有云服务,意味着核心业务数据必须向外传输、被动分享。由于极严格的隐私监管和成本,许多拥有高价值资产的企业也只能望而却步。
其次,是公网数据与行业高精尖数据之间的断层。目前市面上大模型的训练主要依赖互联网公开数据。但事实上,大量领域内最高精尖的数据都沉淀在行业线下。以医疗行业为例,一家大型三甲医院积累的临床数据规模便可能达到数个PB,而这些数据既无法公开,也无法上传至互联网。对于癌症诊疗、复杂手术决策等场景而言,仅依赖互联网数据训练出来的通用模型,其准确率也十分有限,很难达到真正可落地的专业水平。
“近期我们看到的诸多技术突破,其实大多集中在代码编写领域,这是因为互联网上有海量的开源代码和在线交互数据把模型养熟了。但在像癌症诊疗判断这种对精准度要求极高的专业领域,至今没有一个大模型能够胜任。”杨红霞表示,这并非模型本身的能力不行,而是因为行业最核心的数据根本不在互联网上。
“只要一家企业最核心的数据不在互联网上,那么单纯依赖中心化大模型,往往无法解决它的问题。因此,我认为分布式协同AI一定会成为未来的发展方向,而这也是我选择创业的原因之一。”杨红霞解释道,InfiX.ai 的愿景并不是仅仅再造一个通用大模型,而是构建孕育所有模型的系统。同时通过构建AI原生基础设施,帮助企业构建属于自己的领域化AI模型。
02
低比特训练+小规模模型适配,破解算力壁垒
谈及如何帮助企业构建专属领域模型,杨红霞坦言,算力依然是壁垒。但InfiX.ai并没有盲目追随主流,而是选择不同的破局路径。
首先是低比特训练技术。杨红霞介绍称,目前除了 OpenAI、DeepSeek 等少数头部模型厂商外,绝大多数企业仍主要采用 FP16或BF16精度进行模型训练,而Infix.ai开源了全球首个覆盖预训练与后训练的「端到端FP8低比特训练全套方案」。这意味着,在保持模型性能与训练质量基本一致的前提下,InfiX.ai仅需行业平均水平约一半的算力资源与存储空间,便能够完成同等级别模型的训练。
但这也仅仅是一个开始。当前技术前沿正向更低比特演进,正如DeepSeek-V4团队已完成了FP4与FP8的混合精度训练,杨红霞透露,InfiX.ai团队目前也正在全力攻关FP4训练,一旦这个技术实现突破,未来模型的训练成本有望进一步降至传统方案的四分之一。
其次,在低比特技术控本的同时,InfiX.ai也更推崇「以更小规模模型完成更深度场景适配」的路径。杨红霞认为,参数规模的提升带来的是通用能力增强,但对于医疗、金融、工业等专业领域而言,决定模型价值的并非参数数量,而是行业知识密度。
以医疗领域为例,InfiX.ai团队打造的模型参数规模是320亿,相较于参数规模可能达到万亿级别的GPT-5,它的体量显然小得多,但由于长期使用专业医疗数据进行深度训练,其表现出的专业准确度是可以超越这种几万亿的通用大模型。
间接地,她也在回应一件事情:AI的竞争,不一定是谁的模型最大,而是谁离行业最近。
03
模型融合:实现「数据不出域,知识可共享」
相比低比特训练和行业模型,更让杨红霞欣慰的,其实是另一项探索——模型融合。
在她看来,这或许才是未来人工智能发展的真正分水岭。目前全球绝大多数大模型的发展路径,本质上是中心化的。“还是以医疗为例,如果今天我们想打造一个国家级癌症临床大模型,按照传统思路,第一步就需要全国顶级医院把最核心的患者数据汇聚到同一个地方。但无论从隐私保护、法律合规还是商业利益角度来看,这件事几乎不可能实现。”杨红霞说道。
对此,InfiX.ai提出了另一种思路:不是去集中数据,而是融合模型。具体而言,就是每家医院都可以利用自身数据训练专属模型。例如,中山大学附属肿瘤医院针对鼻咽癌训练专业模型;复旦大学附属华山医院围绕自身优势病种构建模型;山东省肿瘤医院则针对胃癌及放疗场景训练模型。
“不同地区、不同医院积累的优势病种和临床经验并不相同。这些模型本身,其实已经浓缩了背后海量数据所蕴含的知识。”杨红霞补充道,InfiX.ai所做的并不是获取这些原始数据,而是获取这些已经训练完成的模型。通过后训练技术,把多个垂直模型重新融合,训练出一个全新的基础模型。最终得到的新模型能够同时掌握各家医院的专业知识,而整个过程中,患者数据从未离开医院本地。
杨红霞将这种模式,比喻为武侠小说中的「吸星大法」:“每个模型都有自己的独门内功,而我们的技术,就是把这些散落的功力提炼出来,融会贯通成一个集大成者。”
更重要的是,这种方式也能降低算力成本。据杨红霞介绍,传统方法训练一个150亿到250亿参数的大模型,可能需要消耗1-200万GPU hour,而模型融合本质上是一种高阶后训练过程,仅需要几百GPU hour。
谈及InfiX.ai取得的成果,杨红霞表示,我们的相关研究成果已经连续被NeurIPS、ICML等全球顶级AI学术会议录用,同时已成功完成多个国际领先开源模型之间的跨模型融合实验,包括欧洲领先模型、阿里通义千问系列模型以及微软生态中的顶级开源模型。
杨红霞还透露,在150亿至250亿参数规模区间内,这些原始模型在代码生成、数学推理等核心能力测试中的平均成绩通常维持在75至77分左右。而经过InfiX.ai模型融合,新模型在11个涉及代码、数学、科学等推理能力测试中综合评分直接提升至88分。简单理解,InfiX.ai已经成功将A模型擅长编程、B模型擅长数学推理、C模型擅长知识问答等优势能力汇聚到同一个模型之中,实现了“1+1+1远大于3”的效果。
据悉,目前围绕这一方向展开探索的企业并不多。放眼全球,除了InfiX.ai之外,日本AI独角兽Sakana AI以及由前OpenAI核心团队创立的Thinking Machines Lab(TML)也在探索类似方向。
杨红霞表示,这并非一条容易走通的道路,挑战非常大,过去行业发展大模型时,还能够参考GPT-3等公开技术路线。但模型融合属于全球最前沿的研究领域,至今没有成熟范式。某种意义上,我们都是致力解答这样的课题:当数据无法流动时,知识如何流动;当模型无法无限增大时,智能又该如何继续增长。
模型融合,或许正是其中一种值得期待的答案。
04
结语
对话最后,杨红霞向《前方智能》分享了她对未来产业格局的判断。
“生成式人工智能这波浪潮毫无疑问将重塑各行各业。但真正推动行业变革的,一定是各行各业本身。”
在她看来,每一个行业都有自己独特的数据资产、业务流程和专业知识体系。只有长期深耕行业的一线参与者,才真正掌握着最核心的数据、最真实的业务场景,以及判断AI输出是否正确的专业标准。他们现在缺少的,只是一套能够安全、高效、低成本释放AI价值的「脚手架」,而 InfiX.ai 正在做的,就是这个「脚手架」。
透过这一视角,我们或许也能重新理解AI与人的关系。AI从来不是为了取代人类,而是为了放大人类的能力边界,帮助人们摆脱重复、低效的工作,将更多时间投入到创造、决策与创新之中。
当算力成本、技术门槛以及数据安全等底层难题被基础设施逐步化解,人类或将取得前所未有的生产力自由。因此,未来的竞争优势,不仅来自模型本身,更来自行业认知与AI能力的融合。
浪潮奔涌,时代向前。生成式AI的大幕已经拉开,但产业智能化的故事才刚刚开始。而下一批真正定义时代的创新者,也许正诞生于那些最懂行业的人群之中。










