在过出乎意料的物理学奖后,AI 在诺贝尔奖的舞台上又拿下一局。
10 月 9 日下午,诺贝尔化学奖被授予谷歌人工智能部门DeepMind联合创始人兼首席执行官戴密斯·哈萨比斯(Demis Hassabis)、谷歌 DeepMind 高级研究科学家约翰·M·詹伯(John M。Jumper)和华盛顿大学的大卫·贝克(David Baker),以表彰他们在预测和开发新蛋白质方面的开创性工作。
图源:网络
2020 年,哈萨比斯、詹伯和 Google DeepMind 团队开发了一种能够根据氨基酸序列预测蛋白质结构的 AI 模型“AlphaFold2” 。此后,谷歌 DeepMind 开源了 AlphaFold2,该模型在两年时间内被用于预测科学已知的几乎所有 2 亿种蛋白质的结构。
大卫·贝克的获奖理由则在于其对计算设计蛋白质的贡献,他成功创造了前所未有的新蛋白质,开启了构建全新蛋白质的大门。
瑞典皇家科学院强调了AlphaFold前所未有的影响,并认为其解决了困扰了生物学 50 年的老问题:蛋白质结构预测,也即如何从蛋白质的氨基酸序列预测蛋白质的三维结构。
相比之前的物理学奖,诺贝尔化学奖花落 AI 显得并不那么出人意料。过去,该奖项频繁出现蛋白质研究的身影,至今已颁奖十余次,而在最近几年,AI 预测蛋白质结构成为了生物以及 AI 领域的重磅话题,再加上 AI 在 2024 风头正盛,三位 AI 蛋白质研究领域的知名人物获奖也完全合情合理。
图源:网络
最强蛋白质预测 AI 模型
与其背后的两个男人
几十年来,科学家们知道蛋白质的功能是由其 3D 形状决定的,但预测氨基酸串如何折叠成该形状却极其复杂。自 20 世纪 70 年代以来,研究人员一直试图解决这个问题,但由于莱文塔尔悖论(即可能的折叠结构数量众多),准确的预测仍然难以实现。
直到哈萨比斯关于利用 AI 解决生物学问题想法的出现。这位 13 岁成为国际象棋大师、2005 年创立人工智能公司 DeepMind 的天才少年,在开发成功 AlphaGo 并接连击败全球顶尖的围棋世界冠军后,选择坚定人工智能路线,并将人工智能“解决其他一切问题”的愿景确定在了蛋白质结构预测上。
图源:网络
DeepMind 为此成立了一个开展蛋白质结构预测的小团队,并根据蛋白质空间结构的形成方式——折叠(Fold),将开发中的人工智能系统被命名为 AlphaFold。
另一位诺奖得主詹伯的出场则在 AlphaFold 陷入瓶颈之时。
相较于传统方法,AlphaFold 实现了蛋白质预测的较大突破,在 2018 年发布后首次参加 CASP(Critical Assessment of protein Structure Prediction)比赛就一举夺冠,复杂蛋白 GDT 平均达到 60 分,成功预测出给定的 43 种蛋白质中的 25 种,作为对比,比赛第二名也仅预测出其中 3 种,展示了 AI 在蛋白质结构预测方面的潜力。
值得一提的是,拿下此次诺贝尔化学奖一半奖金的大卫·贝克开发出了一系列能够根据氨基酸序列预测蛋白质结构的软件“Rosetta”,并同样在 CASP 上领先多年。
说回 AlphaFold,AlphaFold 的初次亮相惊艳但并非完美,其预测结构平均分辨率为 0.66 纳米,与实验方法所得最佳分辨率 0.1 纳米相比完全不够看,60 分的成绩相比 90 分以上的完美预测标准也仍有较大差距。因此,DeepMind 着手开始改进 AlphaFold 系统,并在 2018 年 7 月任命 2017 年才刚刚加入 DeepMind 的詹伯为 AlphaFold 项目主管,负责 AlphaFold 改进工作。
图源:网络
此后在詹伯团队抛弃传统算法的束缚、引入空间立体结构和进化理念并完善机器有效学习策略的大刀阔斧改革下,AlphaFold2 于 2020 年面世,以此前认为无法达到的精度解决了许多最困难的蛋白质折叠问题。2020 年,AlphaFold2 在当年的 CASP 竞赛上 GDT 平均得分 92.4,远超所有竞争对手,对高难度蛋白预测 GDT 平均得分 87,比第二名高出 25 分,相关研究还被《科学》周刊评选为 2021 年度十大科学突破之首。
使用 AlphaFold2 设计的蛋白质结构(图源:网络)
AlphaFold 利用 AI 以接近实验的精度预测蛋白质的 3D 结构,其对蛋白质 3D 结构的预测与传统实验方法获得的结果非常接近。对于大多数蛋白质来说,AlphaFold 通常误差范围已经缩小在 0.1 纳米左右,这意味着该模型的预测与实验手段确定的实际结构紧密匹配,使其成为生物学家的变革性工具。
在过去,预测蛋白质的 3D 结构往往需要长达数年的时间,现在,AlphaFold 将这一任务时长压缩到了几分钟内,以加快解决抗生素耐药性、设计降解塑料的酶以及帮助疫苗开发。
同时,AlphaFold 的预测结果可通过 AlphaFold 蛋白质结构数据库免费访问,使其成为最重要的开放获取科学工具之一。来自 190 个国家的超过 200 万研究人员已经使用了该工具,用来推进从酶设计到药物发现的关键工作,并在分子生物学、药物开发甚至气候科学等各个领域取得了突破。
2024 年早些时候,DeepMind 和 Isomorphic Labs 推出了第三代模型 AlphaFold 3,不仅能预测单链蛋白质的结构,还能准确预测蛋白质复合物、DNA、RNA 等,AI 蛋白质结构预测被推升到了新高度。
诺奖成 AI 盛会,
ChatGPT 获奖的呼声更高了
有了前面的拿下物理奖的约翰·霍普菲尔德和杰弗里·辛顿,再加上现在手捧化学奖的三位 AI 蛋白质结构预测专家,网友们纷纷预测下一个被 AI 攻陷的诺贝尔奖项会是文学奖。
图源:X
毕竟 AI 对科学研究的影响一般人很难关注到,但 AI 对于文学创作的渗透在过去的一段时间通过社交媒体的发酵已经几乎成为共识。
2024 年,日本作家九段理江作品《东京都同情塔》获得日本芥川奖,其中约 5%的句子是利用 ChatGPT 生成的。这一做法在文学界引起了广泛的讨论,即有认为这是文学创新的,也有认为违背了文学创作的真实性和原创性的,而后更是引发了对 AI 生成内容的作品是否应该获得文学奖项的评选标准的讨论。
图源:网络
现在打开几乎任何一个 AI 软件,都有文案生成、修饰的功能选项,AI 技术在提高写作效率、生成文本内容、辅助创作等方面发挥了重要作用,可以根据输入的主题和风格需求,自动生成小说情节、对话及诗歌等,对于提高创作效率和创意的多样性具有显著作用。
但 AI 生成的内容是否具备文学价值显然并非人人认可。2023 年 5 月,代表 11500 名编剧和作家的美国编剧工会发起罢工,主要诉求除了提高薪酬外,还要求制片方限制 AI 在剧本和影视剧创作中的应用。虽然这场罢工在持续 148 天结束后,并未达成完全禁止 AI 使用的协议,但也表明了文字创作群体对 AI 滥用的看法。
现在,对于 AI 是否会拿下代表文学领域最高奖项之一的诺贝尔文学奖的讨论再次将 AI 文学推上热议,甚至奖项得主未出,伪造的获奖祝图就已经先行。
图源:X
因为诺贝尔奖只颁发给个人或组织,以表彰他们在物理学、化学、生理学或医学、文学和和平领域对人类做出的重大贡献,因此,ChatGPT 拿奖还是有点难度的。不过脑洞大开的网友们并没有放弃这一可能性,“既然 ChatGPT 拿不了,那奥特曼总有资格拿奖了吧!”
图源:X
更有甚者,认为奥特曼拿个经济学奖也不为过:
图源:X
当然,奥特曼拿文学奖是不可能了,刚刚,诺贝尔文学奖得主已经公布,为韩国作家韩江。不过,AI 呼声这么大,虽然夹杂的都是负面的声音,但按这个发展速度,再加上诺奖委员会的青睐,还真很难说明年不会出现 AI 黑马。
村上春树要加油了。