英特尔前 CEO 推出全新 AI 基准测试

IP归属:广东

7 月 10 日,前英特尔 CEO Pat Gelsinger(帕特·基辛格) 宣布推出一项全新的 AI 基准测试——Flourishing AI(FAI),旨在评估大模型在促进人类繁荣和价值对齐方面的表现。据悉,这项基准由 Gelsinger 十年前投资并现任董事会主 席的“信仰科技”公司 Gloo 推动开发,其核心依据为哈佛大学与贝勒大学主导的全球繁荣研究(Global Flourishing Study)。

图源:FAI

FAI 基准涵盖了全球繁荣研究中的六大核心维度,包括品格与美德、亲密社会关系、幸福与生活满意度、意义与目标、心理与身体健康、财务与物质稳定,并额外加入了信仰与灵性维度。基准通过超过 1200 道客观与主观题目,结合多模型评审机制,对大语言模型在这七个维度的表现进行 0 到 100 分的量化打分。评分采用几何平均法,以确保模型在某一维度的短板会显著影响整体表现,避免“偏科”现象。

目前,OpenAI 的 o3 模型在 FAI 基准中得分最高,为 72 分,其次为 Gemini 2.5 Flash Thinking(68 分)、Grok 3(67 分)以及 GPT-4.5 Preview(66 分)。整体来看,模型在健康和财务等传统技术评测中表现较好,但在信仰、意义等维度存在明显提升空间,相关分数普遍偏低。

Gelsinger 表示,当前大多数 AI 基准集中在技术性能和准确性,而 FAI 则希望引导行业关注 AI 是否真正促进了人的成长与社会良善。他强调,AI 的价值观嵌入在模型权重中,如何衡量和优化这些价值观,将决定 AI 对人类社会的影响力。Gloo 团队还指出,FAI 目前未涉及文化差异、经济影响或环境风险等更广泛议题,未来将持续完善。

Gelsinger 希望,随着 FAI 的推广,能促使主流 AI 模型在促进人类繁荣的七大维度上持续进步,并推动整个行业关注“善”的实现,而不仅仅是避免“恶”或追求技术领先。

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

前方智能专栏: https://www.tuoluo.cn/columns/author1911845/

本文网址: https://www.tuoluo.cn/article/detail-10123526.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

相关文章