7 月 10 日,前英特尔 CEO Pat Gelsinger(帕特·基辛格) 宣布推出一项全新的 AI 基准测试——Flourishing AI(FAI),旨在评估大模型在促进人类繁荣和价值对齐方面的表现。据悉,这项基准由 Gelsinger 十年前投资并现任董事会主 席的“信仰科技”公司 Gloo 推动开发,其核心依据为哈佛大学与贝勒大学主导的全球繁荣研究(Global Flourishing Study)。
图源:FAI
FAI 基准涵盖了全球繁荣研究中的六大核心维度,包括品格与美德、亲密社会关系、幸福与生活满意度、意义与目标、心理与身体健康、财务与物质稳定,并额外加入了信仰与灵性维度。基准通过超过 1200 道客观与主观题目,结合多模型评审机制,对大语言模型在这七个维度的表现进行 0 到 100 分的量化打分。评分采用几何平均法,以确保模型在某一维度的短板会显著影响整体表现,避免“偏科”现象。
目前,OpenAI 的 o3 模型在 FAI 基准中得分最高,为 72 分,其次为 Gemini 2.5 Flash Thinking(68 分)、Grok 3(67 分)以及 GPT-4.5 Preview(66 分)。整体来看,模型在健康和财务等传统技术评测中表现较好,但在信仰、意义等维度存在明显提升空间,相关分数普遍偏低。
Gelsinger 表示,当前大多数 AI 基准集中在技术性能和准确性,而 FAI 则希望引导行业关注 AI 是否真正促进了人的成长与社会良善。他强调,AI 的价值观嵌入在模型权重中,如何衡量和优化这些价值观,将决定 AI 对人类社会的影响力。Gloo 团队还指出,FAI 目前未涉及文化差异、经济影响或环境风险等更广泛议题,未来将持续完善。
Gelsinger 希望,随着 FAI 的推广,能促使主流 AI 模型在促进人类繁荣的七大维度上持续进步,并推动整个行业关注“善”的实现,而不仅仅是避免“恶”或追求技术领先。