人工智能创业的黄金时代已经到来。
在过去的一段时间内,AI 创业之风盛行,涌现出了多个全球瞩目的行业黑马公司。这些公司或是团队背景不俗、或是融资表现强劲,一出道就吸引了全球目光,大有成为下一个 OpenAI 的意思。
而这些 AI 新秀中,既有通用大模型公司,也有专注于细分 AI 赛道,从电子商务到内容创作,从医疗保健到金融服务,深入各行各业,成为驱动创新、提升效率的关键力量,为整个 AI 市场注入活力。
最注重安全的 Safe Superintelligence
作为一家成立仅 3 月就能拿下 10 亿美元融资的初创公司,Safe Superintelligence(SSI)出名靠的是强大的创始阵容。
该公司由 OpenAI 前首席科学家 Ilya Sutskever、前苹果公司 AI 负责人 Daniel Gross 以及前 OpenAI 研究员 Daniel Levy 共同创立,专注于开发安全的超级智能 AI 系统。
其中最为人熟知的莫过于 Ilya Sutskever。2023 年 11 月 17 日,以 Ilya 为首的 OpenAI 董事会以 “沟通不畅” 为由,突然解雇公司首席执行官 Sam Altman。不过在遭到约 500 名 OpenAI 员工集体辞职的威胁之后,这场内斗闹剧最终以 Altman 回归结束,之后参与罢免事件的 Ilya 则被曝已基本被排除在 OpenAI 核心之外,甚少发声,并最终于 2024 年 5 月宣布离开 OpenAI。
图源:网络
而根据此前各方的言论,可以发现 Ilya 和 Altman 意见分歧已久。Altman 更看重 OpenAI 的商业发展,而 Ilya 则更侧重于 AI 公益和 AI 安全。
具体来看,Ilya 认为 OpenAI 应专注于社会公益,致力于开发安全且有益的人工智能技术,确保其被用于造福全人类,而 Altman 则觉得为实现 OpenAI 的目标,需要与商业公司合作并筹集更多资金,还需开发可盈利的应用程序来维持财务独立性,这在 Ilya 看来可能会导致 OpenAI 偏离最初使命,Ilya 对与其他公司的合作有所担忧,害怕技术落入错误之手。
此外,Ilya 对人工智能技术的快速发展感到担忧,认为 AI 在解决很多问题的同时也会带来如假新闻泛滥、更极端的网络攻击、自动化 AI 武器等新问题,Altman 则倾向于加快技术发展,与各大科技巨头进行军备竞赛以加速 AGI 的到来。
内斗事件只是两者冲突的开始,在离开 OpenAI 后,Ilya 在社交平台 X 上透露了“一个意义重大的项目”,并在一个月后正式官宣了 SSI 的成立。Ilya 表示,SSI 的核心使命是构建安全的超级智能,并避免陷入竞争激烈的竞赛中,与 OpenAI 不同,SSI 采用传统的盈利性公司架构,专注于长期的研究与开发。
SSI 在美国加利福尼亚州帕洛阿尔托和以色列特拉维夫设有办事处,公司目前由约 10 名员工组成,致力于组建一支精干的团队,专注于安全超级智能的研究和开发。公司强调,其唯一的目标和产品就是实现这一使命,避免受到管理开销或产品周期的干扰(有一点“真 OpenAI”的意思了)。
得益于强大的研发背景,2024 年 9 月,SSI 就从包括 Andreessen Horowitz 和 Sequoia Capital 在内的投资者那里筹集了 10 亿美元,公司估值达到 50 亿美元。因此,SSI 预计在未来几年内都不会受到短期商业压力的影响,可以将精力专注于产品研发。
押宝“空间智能”的 World Labs
又是一家以研发团队出名的 AI 初创公司。
World Labs 成立于 2024 年 4 月,是一家专注于“空间智能”的人工智能公司,该公司由“AI 教母”李飞飞创立,致力于构建能够感知、生成并与 3D 世界互动的大型世界模型,旨在将人工智能从 2D 像素平面提升到包括虚拟和现实环境在内的完整 3D 世界,使机器能够理解 3D 空间。
从团队组成上看,除了李飞飞外,公司核心成员还包括 Justin Johnson、Christoph Lassner 和 Ben Mildenhall,成员在计算机视觉和图形学领域都具有深厚的专业背景。
图源:网络
空间智能的概念最早由美国心理学家 Howard Gardner 在 1905 年提出,但李飞飞的空间智能概念有新的阐释和拓展,即通过将物理世界中的空间、场景、数据、用户进行链接,与虚拟世界相结合,构建一个供广大用户共建的数字世界底座。
World Labs 的核心技术为利用深度学习算法实现图像到三维空间的转换。模型通过理解、分析 2D 图像特征,能够在学习大量三维数据集后预测隐藏的 3D 结构和细节,重建出图像中显示的物体,生成相匹配的背景和环境,创建完整的三维场景。
该技术未来将有望在多个领域实现应用。例如在机器人领域,空间智能将使机器人能够理解三维世界,执行诸如在复杂环境中导航、操作物体等更复杂的任务;而在游戏开发、VR/AR 领域,空间智能能快速生成 3D 世界,不仅能提升视觉效果以及玩家体验,还能降低虚拟空间的制作成本。
目前,World Labs 已有具体的产品推出。公司于 2024 年 12 月发布名为 “大型世界模型(Large World Model)” 的 AI 系统,可从单张图像生成可交互的 3D 世界,生成的 3D 世界具有高度的交互性,符合基本空间原理和物理定律,用户可以自由移动视角,体验如同现实世界般的深度和细节。
图源:World Labs
融资方面,截至 2024 年 9 月,World Labs 已完成两轮融资,总计筹集约 2.3 亿美元。投资方包括 Andreessen Horowitz、New Enterprise Associates(NEA)、Radical Ventures,以及英伟达(NVIDIA)和 AMD 等知名企业的投资部门。此外,人工智能领域的多位知名人士,如 Jeff Dean、Geoffrey Hinton 等,也参与了投资。
开发机器人“通用大脑”的 Physical Intelligence
Physical Intelligence(简称 PI)是一家成立于 2024 年 3 月、总部位于美国旧金山的机器人初创公司,致力于将 AGI 应用于物理世界,专注为机器人和物理设备开发基础模型和学习算法。
该公司计划通过大规模的数据积累和模型训练,推动机器人技术的进步,使其在现实世界中具备更强的适应性和灵活性。
PI 创始团队由来自加州大学伯克利分校、斯坦福大学的教授团队,以及特斯拉、谷歌科学家等专家共同创立。
公司首席执行官 Karol Hausman 为斯坦福大学兼职教授,曾任 Google DeepMind 资深研究科学家,其他联合创始人还包括 Sergey Levine、Chelsea Finn、Brian Ichter、Lachy Groom 等。其中 Sergey Levine 在加州大学伯克利分校电气工程与计算机科学系任助理教授,专注于机器学习决策和控制领域的研究,Chelsea Finn 在斯坦福大学计算机科学与电气工程系任教授职务,研究方向为机器人学习。
图源:网络
融资方面,2024 年 3 月,PI 获得了由 Khosla Ventures、Lux Capital、OpenAI、红杉资本和 Thrive Capital 等投资机构参与的 7000 万美元种子轮融资,投后估值约为 4 亿美元。
2024 年 11 月,PI 完成了 4 亿美元 A 轮融资,投资方包括亚马逊创始人杰夫·贝佐斯、OpenAI、Thrive Capital、Lux Capital、Bond Capital、Khosla Ventures 和红杉资本等,投后估值达到 24 亿美元。
PI 的核心产品是其通用机器人基础模型 π0(pi-zero)。该模型通过融合视觉、语言和动作数据,具备跨平台和跨任务的迁移学习能力,能够控制多种不同类型的机器人执行复杂任务。π0 采用流匹配技术生成连续的动作分布,适用于高频率的动作执行,特别是在灵巧任务中表现出色,可赋予机器人执行家务、工业劳动、医疗辅助、灾难救援等任务的能力。
在一次测试中,搭载 π0 模型的机器人顺利完成了折叠衣物、清理桌子和将垃圾与餐具分开等家务,机器人手臂的动作看来起就像真实人类的双手一样,配合熟练。
图源:网络
而与 Figure AI 和特斯拉等其他专注于构建仿人机器人的公司不同,PI 旨在创建可以应用于广泛机器人硬件的软件,这意味着 PI 的“机器人大脑”使用将不局限于特定的机器人类型,可使得 AI 机器人技术具有更广泛的市场应用前景。
具备 AI + 机器人生产力级全栈技术的千寻智能 Spirit AI
成立不到一年就斩获近 2 亿元融资,这家具有清华等多所高校背景的机器人公司在 2024 年带着“中国版 Figure 01”打入了人形机器人赛场。
千寻智能成立于 2024 年 2 月,团队成员来自 UC Berkeley、CMU、清华大学、北京大学、浙江大学等国内外顶尖高校,以及小米、华为、腾讯、大疆等知名企业。
其中创始人兼 CEO 韩峰涛在机器人行业拥有十余年经验,曾任珞石机器人联合创始人&CTO。联合创始人高阳拥有十年的具身智能、机器视觉和机器学习研究经验,师从国际计算机视觉大师 Trevor Darrell 教授,目前为清华大学交叉信息学院助理教授、清华大学视觉与具身智能实验室主任。
千寻智能创始人韩峰涛(图源:网络)
团队成员在基座模型预训练、RL、IL 等核心技术力,以及机械臂系统设计、机器人安全、控制架构等方面都具有深厚技术积累,也让千寻智能具备了 AI + 机器人生产力级全栈技术能力。
在此前的一段演示视频中,千寻智能展示了公司通用机器人泛化技术的最新研究成果。基于神经网络架构,千寻智能机器人可以在非结构化环境下成功完成冲泡咖啡、手掂苹果等复杂动作,实现了多任务连续泛化能力。
图源:千寻智能
作为一家专注于人形机器人研发的企业,千寻智能致力于打造行业领先的通用人形机器人。公司构建了视觉语言模型 ViLa 和部件约束模型 CoPa 作为具身智能机器人底层的多模态大模型,机器人所执行的每一个动作都是神经网络自主生成与优化的结果,端到端神经网络训练使机器人拥有对日常场景的深刻理解能力和丰富的生活常识,能够在多变环境中执行各种复杂任务。
强大的创业阵容、技术能力让千寻智能一出道便备受资本青睐。截止 2024 年 11 月,千寻智能在成立半年多的时间里已完成三轮融资。公司到目前为止融资总额近 2 亿元,其中种子轮由顺为资本和绿洲资本投资,天使轮由弘晖基金领投,达晨创投、千乘资本跟投,顺为资本和绿洲资本继续跟投,融资金额近 2 亿元,天使 + 轮由柏睿资本独家注资。
视频大模型黑马 Pika
除了以上 2024 年成立的新秀外,有不少创立稍早的 AI 公司也在 2024 年实现了蜕变。备受瞩目的视频 AI 生成公司 Pika 就是其中之一。
2023 年 4 月,仅有四名成员的初创公司 Pika Labs 成立了,公司叫板 Sora,立志于打造一个人人都能轻松使用的 AI 视频制作平台,降低创作门槛,激发全球创意表达,首个演示视频一经推出便点燃了 AIGC 社区。
图源:网络
公司创始人兼 CEO 郭文景(Demi Guo)在哈佛大学获得数学学士学位以及计算机科学硕士学位,后转至斯坦福大学攻读博士学位,主攻图形学和神经语言程序学交叉领域的研究。联合创始人兼 CTO 孟辰霖(Chenlin Meng)是斯坦福大学计算机科学博士生,曾发表超过 28 篇研究论文,研究领域涵盖图像合成与编辑、扩散模型简化、自回归模型改进等,是 DDIM、Img2Img、Model Distillation 的作者。
2023 年,Pika 共完成三轮合计 5500 万美元的融资,分别由 Nat Friendman、Daniel Gross 和 Lightspeed Venture Partners 领投。
2024 年,Pika 完成由 Spark Capital 领投,Greycroft、Lightspeed Venture Partners 和 Jared Leto 等参投的 8000 万美元 B 轮融资 ,此轮融资后,Pika 总融资额已达 1.35 亿美元,估值将超过 4.7 亿美元。
公司首款 AI 视频生成工具 Pika 1.0 于 2023 年 11 月 29 日正式上线,能够生成和编辑 3D 动画、动漫、卡通和电影等各种风格的视频。
2024 年 12 月,Pika 2.0 上线更是引发新的轰动,新版本不仅上线了场景配料、运动渲染、扩展视频等多种功能,还推出了免费 + 付费的订阅模式,让免费版用户已也能体验基本视频生成功能。
图源:Pika
接连拿下巨额融资的 xAI
因为美国大选和震惊全网的“筷子夹火箭”,Elon Musk 无疑已经成为 2024 年的焦点人物之一,而由其创立的 AI 公司 xAI 也同样受到科技圈的广泛关注。
xAI 成立于 2023 年 7 月,旨在“理解宇宙的真实本质”,构建能够理解宇宙真实本质的通用人工智能,解决深层次科学问题,推动对宇宙的探索。
团队成员来自谷歌 DeepMind、OpenAI、谷歌研究院、微软研究院、特斯拉及多伦多大学等,专业背景涵盖数学、物理和计算机科学等领域,核心成员包括前 DeepMind 研究科学家 Igor Babuschkin、前谷歌研究院研究科学家 Christian Szegedy 等,由现任人工智能安全中心主任 Dan Hendrycks 担任顾问。
和 SSI 类似,xAI 的创立也和 OpenAI 有不小的渊源。创始人 Musk 曾参与创立 OpenAI,但于 2018 年离开董事会,并于 2023 年 4 月传出计划成立新的人工智能初创企业的消息,这也是有关 xAI 的信息第一次出现在公众视线。
图源:网络
xAI 的核心产品为 Grok 模型。2023 年 11 月,xAI 推出了其首个人工智能大模型产品“Grok”,能通过 X 社交媒体平台实时了解世界,具备回答复杂问题的能力。而后,xAI 又分别在 2024 年 3 月 28 日推出 Grok-1.5,在 2024 年 8 月 13 日发布 Grok-2 系列早期预览版,让 Grok 模型拥有了长语境、多模态理解和高级推理能力。
不过相比较模型产品,xAI 更受关注的原因在于其融资消息。在 2023 年,xAI 分别完成了 10 亿、20 亿美元的两轮融资,而到了 2024 年,xAI 融资额直接翻倍,公司估值也水涨船高。
2024 年 5 月,xAI 完成第三轮 60 亿美元融资,公司估值达到 240 亿美元。2024 年 12 月,xAI 再完成第四轮 60 亿美元融资,公司估值一度超过 400 亿美元。
此外,2024 年 9 月,xAI 还宣布完成名为 Colossus 的人工智能训练系统的组装,该系统将配备 10 万张英伟达 H100 显卡,成为全球最大的超级计算机之一。
200 亿估值新玩家百川智能
同样拿下巨额融资的也有国内 AI 公司。
2024 年 7 月,百川智能完成 A 轮融资,总融资金额达 50 亿元人民币,投资方包括阿里巴巴、小米、腾讯、亚投资本、中金等科技巨头和市场化投资机构,以及北京市人工智能产业投资基金、上海人工智能产业投资基金、深创投等国资背景产业投资基金,并将以 200 亿元的估值开启 B 轮融资。
百川智能为国内“大模型六小虎”之一,公司成立于 2023 年 4 月 10 日,核心成员来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司。创始人王小川为清华大学工程博士,曾任搜狗公司 CEO,公司多位核心成员如陈炜鹏、洪涛、茹立云等同样来自搜狗。
图源:网络
百川智能天使轮便获得 5000 万美元启动资金,2023 年 10 月 17 日又获由阿里、腾讯、小米等科技巨头及多家顶级投资机构参投 3 亿美元 A1 轮战略融资,再加上前面提到的 50 亿元 A 轮融资,百川智能估值已达 200 亿元。
2024 年 5 月,百川智能发布其最新一代基座大模型,相较 baichuan3 在各项能力上均有极大提升,通用能力提升超过 10%,数学和代码能力分别提升 14% 和 9%,在国内权威大模型评测机构 SuperCLUE 的评测中模型能力居国内第一,同时具备多模态能力。
10 月,百川智能推出 1+3 产品矩阵,包括全链路优质通用训练数据,baichuan4-turbo、baichuan4-air 两款模型和全链路领域增强工具链,其中 baichuan4-air 是百川智能的首个 MoE 模型,首创了 PRI(Pyramid、Residual、Interval)架构,更适用于已经验证过的较大规模流量的场景,效果与 baichuan4 基本持平,推理成本仅为 baichuan4 的 1%。
12 月,百川智能又发布全链路领域增强大模型 baichuan4-finance,实现了金融能力和通用能力的协同提升,在金融专业能力与场景应用能力方面大幅超越 gpt-4o,在 flame 评测体系以及国内主流开源金融评测基准 financeiq 中均荣登榜首。
数学推理模型超越 o1 的月之暗面
与百川智能相同,另一家“大模型六小虎”之一的月之暗面也在 2024 年实现了 200 亿估值。
在成立还不到一年的时间内,月之暗面就已完成四轮融资。其中在 2024 年 2 月完成红杉中国、美团、阿里、小红书参投的超 10 亿美元 A + 轮融资后,月之暗面估值达到 25 亿美元(折合人民币 183 亿元)。而在 8 月完成腾讯参与的超 3 亿美元融资后,月之暗面估值更是升至 33 亿美元(折合人民币 242 亿元),跨入 200 亿估值玩家行列。
图源:网络
月之暗面核心团队主要来自清华,创始人杨植麟为 90 后,本科毕业于清华大学计算机系,博士毕业于卡内基梅隆大学计算机学院,曾就职于 Meta AI、谷歌大脑,联合创立循环智能,参与盘古 NLP、悟道等大模型开发,在国际顶级 AI 会议发表论文 20 余篇,引用超 22000 次。
联合创始人兼 CTO 张宇韬同样毕业于清华大学计算机系,曾是循环智能联合创始人,在 KDD、CIKM 等计算机顶会发表多篇文章,并参与了 AMiner 研发。
产品方面,月之暗面于 2024 年 10 月 11 日正式推出具备自主搜索能力的 AI 产品 Kimi 探索版,其搜索量是普通版的 10 倍,一次搜索即可精读超过 500 个页面,能借助超大的脑容量优势,一次并行搜索几十个不同的关键词,筛选和阅读几百个权威的信息源。同时,Kimi 探索版还能模拟人类的推理思考过程,对复杂问题进行多层次拆解,实施深度搜索,并能实时反思优化答案。
此外,月之暗面还于 2024 年 11 月 16 日发布新一代数学推理模型 K0-math,基于深度学习和神经网络的多层结构,融合了强化学习与思维链推理技术,使得模型可以将问题拆解成多个步骤,逐步推导答案,以理解问题结构,提高解题准确性。
图源:网络
K0-math 能模拟人类解题时的思考与反思机制,深入思考、规划解题思路,在中考、高考、考研以及包含入门竞赛题的 MATH 等 4 个数学基准测试中,其成绩超越 OpenAI 的 o1-mini 和 o1-preview 模型。在 OMNI-MATH 和 AIME 两大高难度竞赛级数学题库中,K0-math 还取得了 o1-mini 最高分的 90% 和 83%。
模型性能比肩 GPT-4o 的 DeepSeek
DeepSeek(杭州深度求索)是量化巨头幻方量化旗下的一家 AI 大模型公司,成立于 2023 年 7 月,创始人梁文锋同时也是幻方量化创始人,在金融科技和 AI 领域都有丰富经验。
2024 年 5 月,DeepSeek 发布其第二代开源 MoE 模型 DeepSeek - V2,12 月又发布 DeepSeek - V3。
DeepSeek-V3 为自研 MoE 模型,671B 参数,激活 37B,在 14.8T token 上进行了预训练。在多项评测中,DeepSeek-V3 的成绩都超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,而与闭源模型相比,DeepSeek-V3 参数量约为 GPT-4o 的 1/3,价格仅为 Claude 3.5 Sonnet 的 9%,却能在性能表现上和 GPT-4o 以及 Claude-3.5-Sonnet 这两个世界顶尖的闭源模型不分伯仲。
图源:DeepSeek
在百科知识、长文本、代码、数学、中文能力等多种类型任务中,DeepSeek-V3 对比其他模型也是优势在我,特别是在数学和代码任务中,DeepSeek-V3 在美国数学竞赛(AIME 2024, MATH)和全国高中数学联赛(CNMO 2024)上大幅超过了所有开源闭源模型,在算法类代码场景(Codeforces),远远领先于市面上已有的全部非 o1 类模型,并在工程类代码场景(SWE-Bench Verified)逼近 Claude-3.5-Sonnet-1022。
不仅如此,与 o1、Claude、Gemini 和 Llama 3 等模型动辄数亿美元的训练成本相比,DeepSeek-V3 仅用 557.6 万美元的预算,在 2048 个 H800 GPU 集群上仅花费 3.7 天/万亿 tokens 的训练时间,就达到了足以与这些头部模型比肩的性能,推理和训练成本仅为硅谷顶级大模型的十分之一。
这也意味着使用大型 GPU 集群训练前沿模型或许并非必要,在英伟达高端 GPU 显卡中国大陆遭禁后,这种低成本模式将为 AI 公司应对算力不足提供新的思路。
仅用一年实现 1 亿收入的零一万物
在 2023 年新成立的 4 家大模型六小虎里,零一万物是第一家做到 1 亿收入的。
零一万物成立于 2023 年 5 月 16 日,由李开复创立,团队核心技术产品成员来自谷歌、微软、阿里巴巴、字节跳动、百度等全球顶尖大厂。
图源:网络
融资方面,截至目前零一万物已完成三轮融资,其中包括由阿里领投的 2.5 亿美元 Pre-A 轮融资,公司估值已超过 10 亿美元。
2025 刚刚开年,就有消息传出阿里云正在洽谈收购零一万物相关事项,更有网友发文称“国内第一个大模型公司倒了,零一万物散伙了”。不过传言发酵后,李开复直接评论区否认传言:“2024 年零一万物收入一个多亿,不知为什么会有这样的谣言散播。”
图源:网络
而后,零一万物官方也就阿里收购传闻发文辟谣,称进入新的一年,零一万物将与阿里云联合启动“产业大模型实验室”,强强联合的新型合作模式包含双方在技术、算力、业务、人才等板块技术共享与深度共建。双方合作的产业大模型实验室不仅将提供世界第一梯队的基座模型,还着眼于将优异的大模型能力带入真实行业场景,加速产业大模型落地及应用生态扩大,助力各行各业大模型落地。
不过,虽然进行了辟谣,但零一万物也表示公司确实经历了一些团队调整。李开复直言,2025 年将是大模型考验年,是应用爆发年,更是商业化淘汰年,“只有大公司能继续做超大模型、Scaling Law 在变慢、商业化灵魂拷问的时刻已经到来”,希望大家专注重要的事情。
零一万物是第一家公开大幅调整发展方向的中国大模型独角兽。李开复在接受媒体采访时表示,公司还会做预训练,但现阶段的最高优先级是先巩固自身实力。“决定不做大模型的同时,我们已经在同步做 MoE 模型 Yi-Lightning,它的速度比 Yi-Large 快好几倍,而价钱只有 GPT-4o 的 1/30。Yi-Lightning-V2 也在开发中。”
结语
当然,受制于篇幅,以上只是我们总结的 2024 年 AI 新星代表,在 2023 年、2024 年成立的 AI 公司中,值得关注的还有很多,包括赶在 2024 年底最后一个进入 200 亿估值梯队的通用大模型公司阶跃星辰、由字节跳动前视觉技术负责人王长虎创办的 AI 视频大模型公司爱诗科技、国产通用 3D 大模型公司 VAST 等等等等。
展望未来,AI 发展之路必将越走越宽。随着技术持续迭代,AI 有望在量子计算、脑机接口等前沿领域取得重大突破,进一步提升智能水平,解锁更多未知潜能。而这些新公司作为行业先锋,将继续引领创新浪潮,塑造人机协同、万物智能的全新世界,为人类生活带来超乎想象的变革与福祉,开启科技新纪元。