6月1日,Anthropic向SEC秘密递交S-1文件,正式启动IPO进程。据多家外媒报道,其最新投后估值已达9650亿美元,最快有望于今年秋季登陆美股。对于一家正全力冲刺上市的AI公司而言,此刻本应加足马力推进技术研发,持续强化资本市场对人工智能产业的信心。
然而,仅仅几天后,它却主动呼吁行业按下"减速键"。6月5日,Anthropic在社交媒体发布深度报告《When AI Builds Itself(当人工智能开始自我构建)》,呼吁全球顶尖AI实验室建立协调机制,在必要时放缓乃至阶段性暂停前沿模型研发。报告由Anthropic Institute负责人Marina Favaro与联合创始人、政策主管Jack Clark联合署名。
文章一经发布便迅速引发热议。批评者认为,Anthropic此举或是监管俘获策略的延伸,试图通过推动更严格的监管框架来限制竞争对手;也有人将其解读为IPO前的一次形象工程,意在以"AI安全旗手"的姿态吸引投资者与监管机构的目光。
但抛开动机猜测,认真研读这份报告不难发现:随着AI能力的持续跃升,一条通向递归自我改进的路径正离我们越来越近。
01
AI正在参与创造下一代AI
所谓"递归自我改进",简言之,就是AI能够参与设计、训练乃至优化比自身更强大的后继模型,从而形成能力持续增强的正反馈循环。在这个过程中,人类只需按下启动键,此后的具体工作便由AI自主自主完成,这样的场景正在加速成为现实。
据Anthropic内部测算,据Anthropic内部测算,截至今年5月,其代码库中逾80%的合并代码由Claude编写,而在2025年2月Claude Code发布之前,这一比例还仅为个位数。不到一年半,代码贡献率便从个位数跃升至八成。与此同时,人类工程师的效率也被显著放大,Anthropic的工程师平均每个季度交付的代码量是2021年至2025年期间的8倍,内部调查显示,借助最新模型,员工平均产出约为未使用 AI 时的四倍。不少员工表示,利用Claude还能解决长期积压任务。2026 年 4 月,它一次性提交 800 余项修复,将某类 API 错误率降低约一千倍,若完全依赖人工,预计需要四年才能完成。
在代码质量方面,Claude进步同样迅速。在最具挑战性的开放式编程任务中,其成功率从半年前的 26% 提升至 2026年5月的 76%,半年内提高 50 个百分点。多位工程师认为,Claude 当前生成代码的质量已经接近顶尖人类工程师,并有望在未来一年实现明显超越。
与此同时,Claude也能进行代码审查工作。如今,Anthropic代码库中的每一次变更都会先经过 Claude自动审查系统,对漏洞、安全问题和潜在错误进行检测。回顾历史事故后,Anthropic发现,如果过去所有代码都经过 Claude 审查,大约三分之一的线上故障本可以提前避免。
更值得关注的是,Claude已能独立开展实验。每次Anthropic发布新模型,都会进行同一项测试:给Claude一段训练小型AI模型的代码,要求它在不改变正确性检查的前提下,尽可能提升运行效率。2025年5月,Claude Opus 4的优化幅度约为3倍;到2026年4月,Mythos Preview已能实现约52倍的提升。
2026 年4月,Claude 还独立完成了一项关于“弱模型监督强模型”的开放研究项目,在累计 800 小时计算和约 1.8 万美元算力支持下,自主提出假设、设计实验、分析结果并不断迭代,将性能差距缩小了 97%,而参与对照实验的人类研究员仅缩小了23%。
在科研决策能力上,AI的进步同样迅猛。Anthropic针对129个真实科研关键节点的测试显示:2025年11月版本的Opus 4.5在51%的情况下能给出更优的下一步方案;到2026年4月,Mythos Preview已将这一比例提升至64%。AI正逐渐掌握真正的科研判断力,并朝着独立研究的方向迈进。
综上可见,无论是代码能力,亦或是模型优化,更或是科研探索,Claude 已在某些纬度与人类媲美甚至超越人类。那么,当AI真正开始进化AI,人类的价值又该何去何从?
02
人类角色的转移
回顾人工智能的发展历程,人类在很大程度上始终主导着AI开发周期的每一个环节。我们的角色,也随着AI技术的演进持续重塑,人机关系的定位与互动,在每一个阶段都呈现出截然不同的面貌。
Anthropic在报告中以自身为例,将这段历程划分为五个阶段:2021 至 2023 年,是构建第一个 Claude的时期,彼时的工作方式与其他科技公司并无二致工程师们在笔记本电脑上编写代码与文档,一切都由人完成。
2023至2025年,早期聊天机器人开始介入部分流程,人们用它生成短代码片段,再手动复制到编辑器中,AI 是辅助,人是主导。2025至2026年,编码智能体崛起,它们已能独立编写和编辑代码,有时甚至可以处理整个文件,人的角色开始从执行者向审查者漂移。
到了现在,自主智能体可以自行运行代码,并将数小时的工作委托给其他智能体,人类的直接参与进一步收缩。而在可以预见的未来,"闭合循环"阶段或将到来,智能体具备足够能力自行构建和训练模型,未来版本的Claude,将由 Claude 自身持续改进。
由此可见,在AI 开发过程中,人类的角色正在逐步缩小。一旦人类编写的代码与AI编写的代码质量趋于等同,人类将完全退出代码编写,转而专注于审查。但新的问题随之而来,如果人工审查的速度远远跟不上 Claude 生成代码的速度,审查本身就会成为整个开发流程的瓶颈。
同样,一旦 Claude 能够自主运行实验,真正需要人类回答的问题就不再是"怎么做",而是"哪些实验值得做"。简单来说:执行(写代码、跑实验、出结果)现在几乎不花人类时间了,虽然仍然要消耗算力。
那么,人类的优势将落在哪里?
Anthropic 指出,就目前而言,人类尚存比较优势的领域,是研究品味与判断力,判断哪些问题真正重要,哪些结果值得信赖,以及何时一条路径已是死胡同。这或许是人类在这场演变中,最后也最难被替代的位置。未来的人类工作,或许将更多地收束于方向引导与关键决策,而非重复执行。
03
递归自我改进的三种未来
人类角色的持续收缩,并不必然指向某一种确定的未来。沿着这条轨迹走下去,等待我们的究竟是什么?报告的最后,针对递归自我改进可能带来的走向,描绘了三种情景。
第一种:是模型能力冻结在今天,世界依然会发生巨大变化。Project Glasswing 就是一个早期信号:Mythos Preview 在上线几周内,就在全球最重要的系统中发现了超过一万个高危和严重软件漏洞,这足以表明网络防御的瓶颈已经从发现漏洞转移到快速修复漏洞。与此同时,现有模型推广到更广泛经济领域仍处于早期阶段,一家100人的公司可以越来越多地完成一家1000人公司的工作,因为每个员工都将处于一个代理金字塔的顶端。
第二种:AI持续加速,但人类仍握方向盘。借助AI系统,小型组织的生产力将大幅跃升,100人团队可完成万人级别的工作量,深刻重塑知识工作与公共服务格局,但也带来被滥用的风险。Anthropic援引阿姆达尔定律指出,加速某一环节往往只是将瓶颈转移至其他尚未优化之处。代码部署加速后,人工审查随即成为新瓶颈;强大模型的普及,又催生了远超组织处理能力的新想法与项目。因此,在AI时代,组织的核心竞争力不仅在于引入工具,更在于持续识别并突破由此产生的新瓶颈。这种动态调适能力,将成为未来组织最关键的生存技能。
第三种:AI实现完全的递归自我改进,开始自己造下一代自己。在这个场景下,AI的发展速度将完全取决于算力,人类退守监督、验证与审核的位置。一旦这种能力成真,大概率将迁移至其他科学领域,重塑整个人类知识生产的方式。
04
写在最后
当然,除了上述三种情景,递归自我改进还存在着另一种可能,那便是失败。在AI自我迭代的过程中,偏差可能无声渗透、逐步累积,直至系统彻底失控,人类对技术的掌控权也随之土崩瓦解。而这可能催生的,是一个智力上全面超越人类的存在:它的目标未必与我们一致,它的行动未必受我们约束。
“你必须始终保留踩下刹车的能力。”Anthropic联合创始人Jack Clark在接受BBC采访时反复强调。他指出,递归自我改进有可能在未来两年内成为现实,甚至来得更早。
或许,这也正是Anthropic真正想向整个行业发出的警示:最值得忧虑的,并非某一天突然涌现出一个失控的超级智能,而是在不知不觉之间,我们已经进入了一条加速下坡的赛道,却没有人能够确定,终点究竟在哪里。










