谷歌发布 Gemini 3 Pro;Anthropic 获 150 亿美元投资;英伟达 Q3 净利润同比增长 65%;

IP归属:广东

文章AI导读

一键萃取文章精髓,核心观点即刻呈现

AI 编程初创公司 Lovable 正以约 60 亿美元估值融资

据《福布斯》报道,瑞典 AI 编程初创公司 Lovable 正在与投资方洽谈新一轮融资,目标估值约为 60 亿美元。该估值较 4 个月前的 18 亿美元(由 Accel 领投的 2 亿美元 A 轮)超过三倍。报道援引四位知情人士称交易仍在推进中,具体条款可能调整。

图源:Lovable

Lovable 以 AI 自动生成应用与网站为核心,主打让专业开发者与非技术用户均能通过“Vibe Coding”构建产品。今年 6 月,Lovable 上线 8 个月即实现年化订阅收入(ARR) 1 亿美元,被《福布斯》称为“史上最快增长的软件初创公司”;其创始人 Anton Osika 本周披露平台活跃用户达 800 万,较 7 月的 230 万显著增长。

赛道层面,“Vibe Coding”工具估值与营收快速抬升。面向专业程序员的 Cursor 今年估值飙升至 293 亿美元、年化收入突破 10 亿美元,并使四位联合创始人成为亿万富豪。与此同时,谷歌在 7 月以 24 亿美元“聘用” Windsurf 创始团队,OpenAI 与 Anthropic 也推出自家编码产品,模型供应商正加速下场与生态内工具形成正面竞争。

甲骨文股价一个月下跌近 30%,巨额 AI 投资与债务风险承压

据英国《金融时报》等多家媒体报道,甲骨文因加速押注 AI 基础设施而在近期科技股与债市的剧烈波动中承受更大压力。过去一个月,甲骨文股价下跌约 25%—30%,跌幅显著高于多家同业巨头,抹去自去年 9 月披露与 OpenAI 合作以来累积的逾 2500 亿美元市值涨幅;同期,一项追踪甲骨文债券价格的指数自 9 月中旬以来下跌约 6%。

图源:网络

市场担忧的核心在于:甲骨文为满足与 OpenAI 等客户的算力与数据中心需求,推行高度资本密集的扩张。公司长期债务已由一年前的 750 亿美元升至约 960 亿美元,摩根士丹利预计到 2028 年或升至约 2900 亿美元;此外,甲骨文据称正与多家美国银行洽谈约 380 亿美元的新增债务融资。与此相伴的是较弱的自由现金流与显著抬升的资产负债风险,摩根大通数据显示其债务股本比一度达 500%,远高于部分主要对手。

甲骨文目前面临两大结构性风险:其一,商业模式从传统企业软件向资本开支沉重的云与算力租赁转变,GPU 等算力租赁毛利显著低于公司历史核心业务;其二,客户集中度升高。标普全球预计到 2028 年甲骨文约三分之一收入可能与单一客户绑定,被认为主要是对 OpenAI 的依赖。巴克莱近期将甲骨文债务评级下调至“减持”,并建议客户关注其 5 年期信用违约互换(CDS)价格上行带来的信用风险信号。

管理层与看多方则强调中长期需求与订单储备:甲骨文称 2027—2032 年与 OpenAI 的相关协议可贡献约 3000 亿美元收入,基础设施业务收入目标到 2030 财年增至 1660 亿美元(较 2026 财年 180 亿美元显著提升);OpenAI CEO Sam Altman 表示公司年化收入或已超过 200 亿美元,并将在 2030 年达到数千亿美元规模。甲骨文高管亦称 OpenAI 具备按年向甲骨文支付约 600 亿美元的能力。尽管如此,市场仍在等待 12 月中旬的财报以验证订单兑现进度、现金流改善与资本结构可持续性。

杰夫·贝索斯出任 AI 初创公司 CEO,首轮融资 62 亿美元

据《纽约时报》报道,亚马逊创始人杰夫·贝索斯(Jeff Bezos)将以联合 CEO 身份参与管理 AI 初创公司 Project Prometheus,并为其提供部分资金支持;该公司首轮融资规模达 62 亿美元,成为全球融资体量最大的一批早期初创公司之一。这也是贝索斯自 2021 年卸任亚马逊 CEO 以来首次担任公司的正式运营职务。

图源:网络

该公司由贝索斯与 Vik Bajaj 共同领导。Bajaj 曾在 Google 的 “Moonshot Factory” X 任职,与 Sergey Brin 密切合作,并参与创建生命科学公司 Verily,后又领导孵化器 Foresite Labs;他近期离开该岗位转而聚焦 Prometheus。Project Prometheus 的定位是面向“物理经济的 AI”,核心场景为计算机、汽车与航天等工程与制造环节的智能化加速,方向与 Periodic Labs 等以大规模物理试验驱动模型学习的团队相似。

在人才与资源端,Project Prometheus 已招募接近 100 名员工,其中包括来自 OpenAI、DeepMind、Meta 等顶尖 AI 机构的研究人员。结合现有信息,外界普遍预计其在航天领域与贝索斯的 Blue Origin 存在协同空间,尤其是在复杂工程设计与验证、材料与结构优化、合规文档处理自动化等方向。

xAI 发布 Grok 4.1:免费开放,速度与质量同步提升

11 月 17 日,xAI 宣布正式上线 Grok 4.1 及 Grok 4.1 Thinking,两款模型已在 grok.com、X 以及移动端全面开放,免费用户可直接使用,付费用户将享受更少的使用限制。官方强调,本次更新在对话智能、情绪理解与真实世界实用性方面显著提升,并将信息类场景的“幻觉率”降低至此前的三分之一,是 xAI 迄今错误率最低的版本。

图源:网络

在社区基准方面,LMSYS 的 Text Arena 初步数据显示,Grok 4.1 Thinking 以 Elo 1483 位列文本榜单第 1,Grok 4.1 以 Elo 1465 紧随其后;在 Arena Expert 榜单中,Grok 4.1 Thinking 以 Elo 1510 居首,Grok 4.1 以 Elo 1437 位列第 19。与两个月前上线的 Grok 4 fast 相比,本次更新带来 40 分以上的综合提升。

xAI 对外表示,Grok 4.1 的后训练阶段聚焦于个性一致性、细粒度意图识别以及大规模自主化奖励建模,从而在盲测人类偏好评估中树立新基准。目前,所有用户均可在模型选择器启用 Grok 4.1,或通过 Auto 模式默认体验更新版本。xAI 表示将持续以无付费墙的方式,将更高能力的模型向更广泛用户群开放。

谷歌正式发布 Gemini 3 Pro,年度最强模型诞生

11 月 18 日,谷歌正式发布其迄今最强大的多模态大模型 Gemini 3 Pro,并在推理、编码与多模态能力上全面超越 2.5 Pro。新模型已同步登陆 Gemini 应用、AI Mode 搜索、AI Studio、Vertex AI 以及开发者工具链,并引入可为响应即时生成交互式界面的“生成式 UI”。

图源:谷歌

在公开基准中,Gemini 3 Pro 以 1501 Elo 登顶 LMArena,并在 Humanity’s Last Exam(无工具)拿到 37.5%、在 GPQA Diamond 取得 91.9%、MMMU-Pro 81%、Video-MMMU 87.6%、SimpleQA Verified 72.1%,编码类则在 Terminal‑Bench 2.0 54.2%、SWE‑Bench Verified 76.2%。这些成绩共同指向更稳健的复杂推理与跨模态理解能力。

图源:谷歌

根据外部模型卡,Gemini 3 Pro 支持最高 100 万输入 token、最多 64K 输出 token,知识库信息截止到 2025 年 1 月,架构为稀疏 MoE 的原生多模态 Transformer;同时引入更严格的安全评估与前沿安全框架审查,降低“拍马屁”式迎合与被越狱风险。

功能层面,AI Mode 第一次在首日接入 Gemini 3,通过升级的查询发散(query fan‑out)与生成式 UI,为复杂问题自动构建动态视觉布局、交互式工具与模拟,这类界面由模型在响应时调用工具并生成代码实时拼装。⁠

图源:谷歌

开发者生态方面,Gemini 3 已接入 Google AI Studio、Vertex AI、Gemini API 与 Gemini CLI,并支持在 Cursor、JetBrains、Manus、Replit 等第三方平台使用。定价上,Gemini 3 Pro 在 ≤200k token 档为每百万输入 2 美元、输出 12 美元(高档位分别为 4 美元与 18 美元),略高于 2.5 Pro、低于 Claude Sonnet 4.5。与此同时,谷歌还公布了 Deep Think 模式(更强推理与多模态理解),将率先面向 Google AI Ultra 用户开放。

谷歌发布 Antigravity AI IDE,接入 Gemini 3 Pro,可免费使用

伴随 Gemini 3 Pro 发布,谷歌同时发布新的代理式开发平台 Google Antigravity,旨在让开发者以“任务为中心”的方式与 AI 代理协作。与传统 AI IDE 不同,Antigravity 强调代理优先,在默认的编辑器视图提供类 IDE 体验,并新增 Manager 视图用于并行创建、编排与观察多个代理,使其在独立工作区中更具自治性。

图源:谷歌

Antigravity 的核心在于可验证性与协作反馈:平台会生成称为 Artifacts 的工作证据,包括任务清单、实施计划、分步讲解、截图与浏览器录屏,便于用户校验代理的计划与执行过程;用户可对特定 Artifact 留下评论,代理在不中断任务的情况下异步接纳反馈并调整方案。此外,Antigravity 支持从过往工作中学习,将代码片段、架构要点与执行步骤纳入知识库,提升跨任务与长周期的复用与稳健性。

从工具能力看,Antigravity 直接接入编辑器、终端与浏览器,结合 Gemini 3 的高级推理、多步工具调用与 Computer Use 功能,能在真实环境中计划、编码与验证应用,并在多代理并行下推进复杂项目。谷歌表示,该平台已在公共预览中免费开放,支持 Windows、macOS 与 Linux,对 Gemini 3 Pro 提供较为宽松的速率限制,并兼容 Claude Sonnet 4.5 与 OpenAI 的 GPT-OSS。

英伟达公布 Q3 财报,净利润同比增长 65%,数据中心业务再破纪录

英伟达公布 2026 财年第三财季(截至 10 月 26 日)业绩,营收达 570.06 亿美元,同比增长 62%,环比增长 22%;GAAP 稀释每股收益 1.30 美元,净利润 319.1 亿美元,同比增长 65%,均显著超过华尔街预期。公司同时给出第四财季营收约 650 亿美元(±2%)的强势指引,盘后股价一度上涨逾 4%。

图源:英伟达

支撑亮眼成绩单的核心仍是数据中心业务。本季数据中心营收创下 512 亿美元新高,同比增长 66%、环比增长 25%,其中 GPU 等加速器计算收入约 430 亿美元,增长主要由 GB300 等新一代芯片的初始出货带动;网络业务收入 82 亿美元,同比大增 162%,反映客户在向机架级与规模化 AI 工厂架构迁移时加大对互联设备采购。

除数据中心外,游戏业务营收 43 亿美元,同比增长 30%,环比小幅下滑 1%;专业可视化营收 7.60 亿美元,同比增长 56%、环比增长 26%,DGX Spark 等 AI 工作站平台拉动明显;汽车与机器人业务营收 5.92 亿美元,同比增长 32%。公司第三财季 GAAP 毛利率为 73.4%,并预计第四财季 GAAP 毛利率约 74.8%。

Meta 发布 SAM 3 与 SAM 3D 计算机视觉模型,从图像分割到 3D 重建

Meta 宣布推出全新的计算机视觉模型 SAM 3 与 SAM 3D,进一步扩展其 Segment Anything 系列,为图像与视频中的对象检测、分割、跟踪以及三维重建带来重要升级。

图源:Meta

SAM 3 在开放词汇分割方面实现突破,支持用简短文本或视觉示例在图片与视频中精确找到并跟踪所有匹配对象,并与多模态大模型协同理解更长、更复杂的提示语。相较以往只能处理固定标签的模型,SAM 3 能识别更精细的概念,并以更高准确度完成多实例分割与跨帧跟踪;官方表示其在包含 27 万独特概念的 SA-CO 基准上达到约 75%–80% 的人类水平。

SAM 3D 则面向单张自然图像的三维重建,包含 SAM 3D Objects(对象与场景重建)与 SAM 3D Body(人体姿态与形体估计)两大模型,能够在遮挡、间接视角、小目标等真实场景下重建带纹理的 3D 网格并估计姿态与布局。Meta 通过大规模现实世界数据与“模型在环”的标注引擎突破 3D 数据匮乏瓶颈:在近百万图像上生成约 314 万候选网格并由标注者进行排序与验证,同时提出 SA-3DAO 评测集,将研究评测从“摆拍与合成”转向复杂、真实的物理世界。官方称 SAM 3D Objects 在人类偏好测试中以至少 5:1 的优势领先主流方法,并在工程优化与扩散捷径加持下实现数秒级重建,具备近实时 3D 感知潜力。SAM 3D Body 使用开放的 Meta Momentum Human Rig(MHR)参数化人体模型,分离骨骼与软组织以提升可解释性,并在多项 3D 基准上取得显著精度提升。

两款模型均已登陆 Segment Anything Playground,普通用户可零门槛体验。Meta 也将这些技术用于产品创新:Facebook Marketplace 的 “View in Room” 功能已接入 SAM 3 与 SAM 3D,帮助用户在购买前将家居物品虚拟摆放到自家环境中进行风格与空间适配预览。开源方面,SAM 3 提供权重与研究论文,SAM 3D 暂未完全开源,但已共享推理代码与模型检查点,并将持续发布 3D 评测与数据集。Meta 同时提示当前局限:SAM 3D 的中等分辨率影响复杂对象细节表现,且对象布局推断尚未建模多物体交互;SAM 3D Body 对多人与人—物交互、手部姿态的精度仍有提升空间。

谷歌推出 Nano Banana Pro:基于 Gemini 3 的专业级图像生成与编辑模型

11 月 20 日,继 Gemini 3 Pro 之后,谷歌再度发力,正式发布了 Nano Banana Pro 图像模型,在图像生成与编辑方面带来更强的推理与指令理解能力、可直接在图像内渲染高质量多语言文本、以及最高 4K 分辨率输出与专业级创作控制,面向创作者与企业工作流全面升级。该模型已在全球 Gemini 应用中开放试用,免费用户设有额度限制,付费用户(Google AI Plus/Pro/Ultra)额度更高。

图源:谷歌

Nano Banana Pro 的核心升级包括三方面:其一,借助 Gemini 3 的推理与世界知识,可在一次生成中产出结构化、上下文丰富的信息图与示意图,并支持通过 Google Search 进行事实校验与实时数据可视化(如天气、体育等);其二,显著提升直接在图像内渲染文本的能力,长段文字、不同字体与语言的排版更为清晰可读;其三,提供更精细的专业级编辑控制,可对镜头角度、景深、焦点、色彩分级与光照(如昼夜转换、景深虚化)进行局部与全局调整。

图源:谷歌

图源:谷歌

在复杂合成与一致性方面,Nano Banana Pro 支持最多 14 张参考图混合生成,并可在输出中维持最多 5 位人物 的外观一致性,适用于品牌资产、多角色构图与产品场景等专业场景。与此前上限 1024×1024 的 Nano Banana 相比,新模型可输出 2K/4K,并在「Thinking」模式下进行多步推理生成。

在产品与生态集成上,谷歌已将 Nano Banana Pro 融入 Gemini app 的「Create images」入口,同时面向 Workspace 推出在 Google Slides 与 Google Vids 的图像生成与美化能力,支持一键将内容转化为专业信息图或视觉化页面;面向研究与学习场景,NotebookLM 可生成高质量信息图与整套演示文稿;开发者与企业可通过 Gemini API、Google AI Studio 与 Vertex AI 接入,谷歌新 IDE Antigravity 与视频工具 Flow 也将接入该模型。

溯源与合规方面,谷歌为所有生成内容嵌入 SynthID 数字水印,并在 Gemini app 中上线检测功能,用户可上传图像查询是否由谷歌模型生成或修改;同时引入 C2PA 元数据以增强跨平台内容凭证标注。为满足专业创作,谷歌对 AI Ultra 订阅与 Google AI Studio 的生成结果移除可见水印,但保留不可见 SynthID 水印。

价格与性能权衡方面,Nano Banana Pro 在 API/AI Studio 的定价为:1080p/2K 图像约 0.139 美元/张,4K 图像 0.24 美元/张,较原 Nano Banana 的 0.039 美元/1024px 有明显提升,且生成速度略慢,体现出「高质量、强控制、可合规模块化」的定位。

微软、英伟达将向 Anthropic 投资最高 150 亿美元

微软、英伟达与 Anthropic 宣布达成新的战略合作:英伟达与微软将分别向 Anthropic 投资最高 100 亿美元与 50 亿美元。这一安排使 Anthropic 的估值被推至约 3500 亿美元,较 9 月的 1830 亿美元大幅跃升。Anthropic 则将在微软 Azure 上大规模扩展其 Claude 模型,并承诺采购 300 亿美元的 Azure 计算能力,同时合同中预留最高 1 吉瓦的增量算力。

图源:微软

合作的技术层面同样引人注目。Anthropic 将采用英伟达的 Grace Blackwell 与下一代 Vera Rubin 架构,双方首次建立深度工程协作,面向 Anthropic 工作负载优化未来芯片架构与模型性能、效率与总体拥有成本(TCO)。微软方面同时扩展与 Anthropic 的现有合作:在 Microsoft Foundry 中向企业客户开放 Claude Sonnet 4.5、Claude Opus 4.1 与 Claude Haiku 4.5 等前沿模型,并继续在 Copilot 系列中提供 Claude。这也使 Claude 成为目前唯一同时可在 Microsoft、Amazon、Google 三大公有云上获取的前沿模型。

在算力与基础设施方面,Anthropic 的最高 1 吉瓦计算承诺将由英伟达的 Grace Blackwell 与 Vera Rubin 系统提供支撑;微软则在 Azure 内构建并交付这些由英伟达 GPU/CPU 架构驱动的大规模集群。尽管如此,Amazon Web Services 仍将继续担任 Anthropic 的主要云提供商与训练合作伙伴,表明其多云策略是在扩展可用性与商业覆盖的同时,维持与 AWS 的核心训练关系。

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

前方智能专栏: https://www.tuoluo.cn/columns/author1911845/

本文网址: https://www.tuoluo.cn/article/detail-10126958.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

相关文章