OpenAI、谷歌、可灵、豆包相继发布模型；Hugging Face 收购机器人初创公司；英伟达 RTX 5060 系列显卡上市

前方智能原创 2025-04-21 11:07 热度 31540

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

IP归属：广东

OpenAI 近日宣布，计划于 2025 年 4 月 30 日起在 ChatGPT 中全面停止使用其于两年前推出的 AI 模型 GPT-4，并由其最新的默认模型 GPT-4o 完全取代。OpenAI 在一份更新日志中表示，经过多项评估，GPT-4o 在写作、编码和科学技术等多个方面均持续优于 GPT-4。此外，GPT-4o 在指令遵循、问题解决和对话流畅性方面也得到了进一步的提升，使其成为 GPT-4 的自然继任者。不过，GPT-4 将继续通过 OpenAI 的 API 提供使用。

图源：Getty Images

GPT-4 于 2023 年 3 月首次在 ChatGPT 和微软的 Copilot 聊天机器人中推出，其多个版本具备多模态能力，能够理解图像和文本。OpenAI 的 CEO Sam Altman 曾透露，GPT-4 的训练成本超过 1 亿美元。在此之前，OpenAI 于 2023 年 11 月推出了速度更快、成本更低的 GPT-4 Turbo 模型。值得注意的是，GPT-4 也是 OpenAI 与包括《纽约时报》在内的多家出版商之间版权纠纷的核心模型之一，出版商指控 OpenAI 未经许可便使用其数据训练 GPT-4。

SK 海力士超越三星，跃居 DRAM 营收榜首

根据 Counterpoint Research 的 Memory Tracker 数据显示，SK 海力士首次超越三星电子，以 36% 的营收份额领跑全球 DRAM 市场。尤其值得一提的是，该公司在关键的高带宽内存 (HBM) 领域占据了高达 70% 的市场份额。

图源：Counterpoint Research

Counterpoint Research 高级分析师 Jeongku Choi 表示：“对于 SK 海力士而言，这是一个里程碑式的成就，他们成功地向持续展现出对 HBM 内存无限需求的市场交付了 DRAM 产品。专业 HBM DRAM 芯片的制造一直非常复杂，而那些早期就掌握了技术的公司已经获得了丰厚的回报。”

Counterpoint Research 预计 2025 年第二季度 DRAM 市场的细分增长和供应商份额将与第一季度类似。研究总监 MS Hwang 指出：“目前全球关注的焦点是关税的影响，因此问题在于：HBM DRAM 将会发生什么变化？至少在短期内，由于人工智能需求的持续强劲，该细分市场不太可能受到任何贸易冲击的影响。更重要的是，HBM 的最终产品是人工智能服务器，而人工智能服务器本质上是无国界的。”

昆仑万维开源7B和32B最强数学代码推理模型，

对齐DeepSeek-R1

日前，昆仑万维天工团队宣布推出了全新升级的Skywork- OR1 (Open Reasoner 1)系列模型。

该系列模型在昆仑万维首款中文逻辑推理大模型Skywork-o1基础上迭代优化，实现了同等参数规模下业界领先的推理性能，进一步突破了大模型在逻辑理解与复杂任务求解方面的能力瓶颈。

据悉，此次开源涵盖三款高性能模型，包括：

Skywork-OR1-Math-7B：聚焦数学领域的专项模型，同时也具有较强的代码能力。

Skywork-OR1-7B-Preview：融合数学与代码能力、兼具通用性与专业性的通用模型。

Skywork-OR1-32B-Preview：面向更高复杂度任务、具备更强推理能力的旗舰版本。

在数学推理任务上，Skywork-OR1系列均实现了同参数规模下的最优表现，其中针对数学场景深度优化的专项模型Skywork-OR1-Math-7B更是远超当前主流7B级别模型。Skywork-OR1-32B-Preview在所有benchmark上均实现了对通义QwQ-32B的超越，并在更难的AIME25上基本与DeepSeek-R1持平。

在竞赛编程任务中，Skywork-OR1-7B-Preview与Skywork-OR1-32B-Preview在LiveCodeBench数据集上均取得了同等参数规模下的最优性能，其中，Skywork-OR1-32B-Preview代码生成与问题求解能力已接近DeepSeek-R1。

图源：昆仑万维

昆仑万维表示，Skywork-OR1系列采用业界最高透明度的开源策略，将全面开放、免费使用，以完全开源的形式回馈开发者社区。

目前，昆仑万维已全面开源Skywork-OR1模型权重、训练数据集和完整训练代码，所有资源均已上传至GitHub和Huggingface平台，配套的技术博客已发布于Notion平台。此外，昆仑万维还将在两周内发布两个模型的正式版本，并推出更为系统详尽的技术报告。

云鲸智能获一亿美元融资，加速开发其首款家庭具身智能产品

近日，云鲸智能宣布完成1亿美元融资，本轮融资由腾讯投资与北京机器人产业发展投资基金联合领投，科幻基金与明势创投加码跟投，资金将重点用于云鲸首款家庭具身智能产品的开发，预期将在2年内发布。此外，云鲸已正式启动Pre-IPO轮融资，开启上市前最后冲刺，资本化进程全面提速。

图源：网络

据悉，云鲸智能成立于2016年，是立足家用机器人领域、致力于研发革命性科技产品的公司，专注打造高性能智能家居清洁机器人。2024年，云鲸智能市占率不断攀升，营收同比增长超130%，海外市场同比增长近700%，在双十二夺得国内扫地机市场占有率第一，是全球 “智能清洁机器人头部企业”。

自2017年成立以来，云鲸智能已完成10轮融资，金额达数十亿元，投资方包括字节跳动、红杉资本、高瓴创投、腾讯投资等知名机构，公司去年11月刚刚完成上一轮数亿元D轮融资融资，投资方为深圳和无锡两大国资。

OpenAI 发布 GPT-4.1 系列 AI 模型，将逐步淘汰 GPT-4.5

OpenAI 近日发布了全新的 GPT-4.1 系列语言模型，包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 三款模型，并通过其应用程序编程接口 (API) 向开发者开放。

其中，旗舰模型 GPT-4.1 在代码生成方面表现出“显著优于”其前代产品的能力。这三款模型均支持高达 100 万 tokens 的上下文窗口，使其能够处理大型文件，例如 GitHub 代码库。

图源：OpenAI

OpenAI 指出，GPT-4.1 在从对话中提取信息方面比其前代产品提升了 10.5%，这使其在处理复杂的编程任务时更加有效。此外，GPT-4.1 经过优化，仅输出更改后的代码行，从而降低了开发者的使用成本。为了进一步降低成本，OpenAI 将提示缓存折扣从 50% 提高到 75%。

OpenAI 还强调，GPT-4.1 在生成用户界面方面有所改进，并减少了不必要的代码输出，从而节省了软件团队筛选模型输出的时间。

GPT-4.1 mini 是一款更高效的模型，在降低延迟和成本的同时，性能与 GPT-4o 相当。 GPT-4.1 nano 则定位于处理较为简单的任务，例如文档分类和代码自动补全，它具有更低的延迟和成本。

值得注意的是，OpenAI 计划逐步淘汰 GPT-4.5 预览版，并不会在 ChatGPT 中提供 GPT-4.1 模型，而是选择继续优化 ChatGPT 中使用的 GPT-4o 模型。

OpenAI 此次发布的新模型，在性能、上下文处理能力上均有所提升，旨在为开发者提供更强大、更经济高效的 AI 工具，同时也加剧了 AI 领域的竞争。

Hugging Face 收购机器人初创公司 Pollen Robotics

Hugging Face 近日宣布收购法国人形机器人初创公司 Pollen Robotics，具体收购金额未公开。《连线》杂志报道称，Hugging Face 计划销售 Pollen Robotics 的人形机器人 Reachy 2，并允许开发者下载和改进其代码。

图源：X

Pollen Robotics 由 Matthieu Lapeyre 和 Pierre Rouanet 于 2016 年创立，旨在将价格合理的人形机器人带入家庭。据 Crunchbase 数据显示，该公司在被收购前已从包括 Bpifrance 在内的投资者那里筹集了 250 万欧元（约合 283 万美元）。

此次收购标志着 Hugging Face 在机器人领域的进一步扩张，此前 Pollen Robotics 就与 Hugging Face 保持着密切合作。去年，Hugging Face 与 Pollen Robotics 合作开发了开源机器人 “Le Robot”，该机器人旨在执行各种家务。Hugging Face 还成立了一个由前特斯拉 Optimus 项目机器人工程师 Remi Cadene 领导的机器人团队。

Hugging Face 首席执行官 Clément Delangue 表示，对于在工作和家庭中执行物理任务的物理对象而言，信任和透明度至关重要，因此机器人技术尽可能开源非常重要。Pollen Robotics 联合创始人兼首席执行官 Matthieu Lapeyre 认为，与 Hugging Face 合作有望推动人形机器人的普及。

Open Bionics推出全球首款无线仿生机器手，

脱离穿戴者后仍能继续工作

日前，Open Bionics宣布推出世界上第一款无线仿生手“Hero”。

Hero仿生手由Open Bionics历时四年研发，主要功能包括35公斤举重能力、360度手腕旋转。设备通过名为MyoPods的无线肌电图电极进行控制，这些电极安置在截肢者手臂上，能够精准读取肌肉信号，并将其转化为控制仿生手指运动的指令。

图源：网络

Hero仿生手的特别之处在于，其在脱离穿戴者后仍能工作。根据Open Bionics的说法，Hero仿生手具备独特的 “爬行” 功能，用户可以摘下仿生手，通过无线传感器控制它在地面爬行，随后再爬回身边。

据悉，Hero仿生手将包含Hero RGD和Hero PRO两款产品，将提供可更换的磁性外壳。同时，Open Bionics还与漫威、星球大战和迪士尼等知名IP合作，推出官方主题设计的仿生机械臂。

此次新品发布正值Open Bionics成立十周年，该公司自2014年成立以来一直专注于利用3D打印技术生产仿生手，目前已服务全球超1000名用户。

华为云推出CloudMatrix 384超节点，或将彻底终结算力焦虑

在日前举办的华为云生态大会2025上，华为公司常务董事、华为云计算CEO张平安公布了华为在AI基础设施架构的突破性进展，推出CloudMatrix 384超节点，并已在芜湖数据中心规模上线。

据财联社消息，未来CloudMatrix超节点可以构建超过万片的大集群来提供算力，华为内部人士称其为核弹级的产品，或将彻底终结算力焦虑。

据悉，CloudMatrix 384具备高密、高速、高效的特点，通过全面的架构创新，在算力、互联带宽、内存带宽方面实现全面领先，实现了从服务器级到矩阵级的资源供给模式转变。

图源：网络

2024年3月，英伟达率先发布了NVL72超节点，可以把72张训练卡组成一个超节点，为万亿参数的大型语言模型推理提供了30倍实时速度提升。而这次发布的华为CloudMatrix 384则更进一步，以384张昇腾算力卡组成一个超节点，在目前已商用的超节点中单体规模最大。

华为CloudMatrix 384在规模、性能和可靠性上对标英伟达NVL72，基于CloudMatrix的昇腾AI云服务，大模型训练作业可稳定运行40天，互联带宽断点恢复在10秒级别。在互联带宽上，超节点网络交换机采用6812个400G光模块，实现2.8Tbps卡间互联带宽。

根据华为公布的数据，CloudMatrix 384可实现算力规模达300PFlops，相比英伟达NVL72的 180PFlops提升67%。

不过，在单位算力功耗方面，国产芯片仍比英伟达高得多，更高的功耗对于服务器散热要求也更高，机房规模会更大，导致整体成本上升。不过，有芯片业内人士表示，“即使在功耗更大的情况下，能做NVL72的水平也相当不容易了，体现了华为研发能力很强。”

美国收紧 H20 芯片出口，英伟达或将损失 55 亿美元

最新消息显示，美国特朗普政府再次收紧对华技术出口限制，此次矛头直指英伟达专为中国市场设计的 H20 AI 芯片。根据英伟达周二提交的监管文件，美国政府告知英伟达，出口 H20 芯片至中国（包括香港）及其他受关注地区，未来将需要获得许可，且该许可要求“无限期”有效。

图源：Getty Images

此举预计会导致英伟达在其第一财季面临高达 55 亿美元的损失，这笔费用主要与 H20 产品的库存、采购承诺及相关储备有关。消息一出，英伟达股价在盘后交易中大幅下跌超过 6%。

据悉，美国政府此举旨在阻止这些高性能芯片被用于中国的超级计算机。此前，美国前总统拜登也曾实施过对华 AI 芯片出口的限制，英伟达为此专门设计了性能有所降低的 H20 芯片以符合规定。然而，特朗普政府似乎认为，即使是这款“降级版”芯片，其性能仍然足以对美国的国家安全构成潜在威胁。

英伟达发布 RTX 5060 系列显卡，今日正式上市

英伟达于 4 月 15 日发布了其 RTX 5060 系列显卡，其中 RTX 5060 Ti 将于 4 月 16 日上市，8GB 版本的建议零售价为 379 美元（国内售价 3199 元），而拥有 16GB 显存的版本售价为 429 美元（国内售价 3599 元），标准的 RTX 5060 将于 5 月推出，售价 299 美元（国内售价 2499 元），但仅配备 8GB 显存。

图源：英伟达

性能方面，RTX 5060 系列与上一代 RTX 4060 系列的 GPU 相比，原始性能提升约 20%，但在支持 DLSS MFG 等性能加速技术的游戏中，性能提升更为显著。英伟达表示，RTX 5060 Ti 在开启完整光线追踪和 1440p 分辨率下运行《黑神话：悟空》时，帧率可达 102 FPS，而 4060 Ti 在相同设置下仅为 46 FPS。

然而，延迟方面似乎没有改善。对比图显示，5060 Ti 的输入延迟仅略低于 4060 Ti。

图源：英伟达

RTX 5060 系列的定价看起来较为合理，但 8GB 显存的版本可能并不实用。16GB 的 RTX 5060 Ti 性价比更高，因此更受推荐。然而，零售商的实际售价可能高于建议零售价，且关税等因素也可能影响最终价格。

OpenAI 计划推出社交平台，或与图片生成功能深度整合

多家媒体报道称，人工智能公司 OpenAI 正在开发一款社交平台，目前还处于早期阶段。据称，OpenAI 已经构建了一个内部原型平台，但消息人士指出，OpenAI 最终仍有可能放弃进入社交媒体市场。

图源：Getty Images

该原型据报道拥有一个“专注于 ChatGPT 图像生成”工具的界面。上个月，OpenAI 对该工具发布了一项重大更新，显著提升了其输出质量和指令遵循能力，引发了一股用户创作图像的潮流。

据分析，这款潜在的社交平台可能是 OpenAI 为了将其 ChatGPT 免费用户的受欢迎程度转化为收入的一种尝试。今年二月中旬，ChatGPT 的每周活跃用户数已达到 4 亿，此后，随着图像生成工具的更新，这一数字大幅增加。OpenAI 首席执行官 Sam Altman 此前透露，在该更新发布后的一小时内，有超过 100 万新用户注册了 ChatGPT。

如果 OpenAI 能够成功推广其社交平台，并吸引大量 ChatGPT 用户，那么通过向这些用户展示广告，可能会开辟新的收入来源。

鉴于报道中的社交平台可能侧重于 ChatGPT 的图像生成工具，它可能会被定位为 Instagram 的替代品。

智谱启动AI六小龙首个IPO，同时开源多个模型

日前，智谱AI正式向中国证监会北京证监局提交上市辅导备案，由中金公司担任辅导机构。作为国内 “大模型六小虎” 中首家启动IPO的企业，智谱AI计划于2025年10月完成辅导，最快2026年登陆A股。

公开资料显示，智谱无控股股东，实际控制人为唐杰、刘德兵。唐杰直接持有智谱7.4081%股权。刘德兵直接持有智谱华章0.2554%股权，并通过持股平台合计控制智谱17.3966%表决权。

据悉，智谱AI成立于2019年，由清华大学计算机系的技术成果转化而来，致力于打造新一代认知智能大模型。公司合作研发了中英双语千亿级超大规模预训练模型GLM-130B，并基于此推出对话模型ChatGLM，开源单卡版模型ChatGLM-6B。同时，团队还打造了AIGC模型及产品矩阵，包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型 CogView等。

值得一提的是，在提交上市辅导备案的同时，智谱还宣布开源其32B/9B系列GLM模型，包括基座、推理和沉思三类模型，且全部采用MIT许可协议。此外，智谱还启用了全新域名z.ai，后续将作为智谱最新模型的交互体验入口。

图源：网络

可灵AI 2.0正式发布，新增多模态编辑、音效生成等功能

日前，可灵AI在北京中关村国际创新中心举行「灵感成真」2.0模型发布会，面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。

图源：快手

据悉，可灵2.0模型在动态质量、语义响应、画面美学等维度，保持全球领先，在指令遵循、电影质感及艺术风格表现等方面也实现了显著提升。

具体来看，可灵2.0全面升级了训练和推理策略，尤其是强化了对于复杂运动主体交互滤镜、构图术语等专业的表达和理解响应。在功能上，可灵2.0新增视频多模态编辑和AI音效生成等功能，不仅能够通过输入图片/文字对对生成的视频内容实现元素的增加、删减、替换，还能根据影像内容结合文字prompt，生成适配的音效片段。

此外，可灵2.0还上线实用的图像可控编辑功能，如局部重绘和扩图，支持图片元素的增加、修改与修复。

可灵AI自上线开放测试以来，已快速迭代二十多个版本。目前，可灵AI已形成包含App、Web端（中、英文版）、快手站内小程序等在内的多端跨平台产品矩阵，可灵2.0版本发布后已正式上线，即日起全球用户均可体验使用。

18.8万元起售，与“甲亢哥”斗舞的众擎机器人正式上架电商平台

近日，此前在社交媒体上与国际知名网红“甲亢哥”一起斗舞的众擎机器人ENGINEAI PM01已经开始上线电商平台售卖，售价18.8万元。

据悉，PM01是众擎迄今为止最灵活的轻量级、高动态、全开放通用人形机器人，除了可应用在家庭陪伴、文旅场景、乐园导览等服务领域，还能为高校与科研机构提供实验设备。凭借高精度传感器和智能控制算法，PM01不仅实现了动态平衡和步态自适应调整，还能够流畅完成前空翻等高难度动作。

图源：网络

此外，众擎还推出了另一款双足机器人产品——众擎ENGINEAI SA01，售价为4.2万元。SA01是一款高拓展性的开源通用双足智能体，可展现较为良好的直膝行走能力。

根据电商平台的信息，虽然两款机器人产品均已开售，但PM01预计要到今年6月24日后才有现货，而SA01则在4月17日后即可发货。

OpenAI 发布 o3 与 o4-mini 模型，

以及 Codex CLI 开源终端工具

2025 年 4 月 17 日，OpenAI 宣布推出其迄今为止最强大的推理模型 o3 以及更小更高效的 o4-mini，引发广泛关注。这两款模型具备完整的工具链访问能力，能够自主调用 ChatGPT 中的网页搜索、Python 编程、图像分析与生成等功能，标志着 OpenAI 在多模态推理与自主任务执行能力上的重大突破。

图源：OpenAI

o3 模型在多个权威基准测试中取得领先成绩，包括 SWE-bench、Codeforces 和 MMMU，展现出在编程、数学、科学与视觉理解等方面的卓越推理能力。相比前代 o1，o3 在复杂现实任务中的重大错误率减少了 20%。o4-mini 虽然体积更小，但在 AIME 2024 与 2025 数学竞赛中表现出色，甚至在某些任务上超过了 o3，适用于高频率、低延迟的推理场景。

两款模型均具备“图像思维”能力，不仅能理解图像，还能在推理过程中对图像进行缩放、旋转等操作，支持用户上传白板照片、手绘草图等进行深入分析。这一能力被多家媒体称为视觉感知领域的“质变”。

与此同时，OpenAI 还同步发布了名为 Codex CLI 的开源终端工具，支持开发者将 AI 与本地代码库和计算任务集成，进一步拓展 AI 在软件开发流程中的实用性。该工具已开放源代码，并配套推出 100 万美元的 API 使用额度资助计划，以鼓励开发者社区的创新应用。

在定价方面，ChatGPT 订阅用户可以免费使用 o3 和 o4-mini。对于通过 API 集成这些模型的开发者，o3 的定价为每百万输入 tokens 10 美元，每百万输出 tokens 40 美元，缓存输入的折扣价为每百万 2.5 美元。这相较于 o1 每百万输入/输出 tokens 15/60 美元的定价结构有显著降低。更经济的 o4-mini 的定价为每百万输入 tokens 1.10 美元，每百万输出 tokens 4.40 美元，缓存输入的定价为每百万 0.275 美元，与 o3-mini 的定价结构保持一致。

OpenAI 拟 30 亿美元收购 Windsurf

2025 年 4 月 17 日消息，OpenAI 正在洽谈以约 30 亿美元收购 AI 编程工具 Windsurf（前身为 Codeium），此举可能成为其迄今为止最大规模的收购案。Windsurf 是一家专注于 AI 编程助手的初创公司，能够为开发者生成代码、解释代码逻辑，并支持多种主流代码编辑器插件。此次交易若达成，OpenAI 将更直接地与 GitHub Copilot、Anthropic 的 Claude、Anysphere 的 Cursor 等竞品展开正面竞争。

图源：Getty Images

据多家媒体报道，Windsurf 去年由 General Catalyst 领投完成 1.5 亿美元融资，估值达 12.5 亿美元，目前正在以 30 亿美元估值寻求新一轮融资。OpenAI 此次出手，不仅是对 Windsurf 技术的认可，也反映出其在 AI 编程领域加速布局的战略意图。

此外，OpenAI 还推出了 Codex CLI，一款面向终端开发者的开源编码代理工具，旨在将 AI 深度融入本地开发流程。这一举措与其收购 Windsurf 的计划相呼应，意在构建完整的 AI 编程生态闭环。

随着 ChatGPT 用户数不断增长，OpenAI 也在持续扩张其产品边界。此次收购与新模型发布，共同标志着 OpenAI 正从通用对话模型迈向更垂直、更专业的 AI 应用场景，尤其是在开发者工具这一关键领域。

阿里通义万相开源业内首个首尾帧生视频模型

日前，阿里通义万相宣布开源业界首个百亿参数规模的首尾帧生视频模型Wan2.1-FLF2V-14B，可根据用户提供指定的开始和结束图片，生成一段衔接首尾画面的720p高清视频。

图源：网络

基于现有的Wan2.1文生视频基础模型架构，通义万相首尾帧生视频模型进一步引入了额外的条件控制机制，通过该机制可实现流畅且精准的首尾帧变换。

在推理阶段，为了在有限内存资源的条件下支持高清视频推理，通义万相首尾帧生视频模型分别采用了模型切分策略以及序列并行策略，在确保推理效果无损的前提下，显著缩短了推理时间。

基于该模型，用户可完成更复杂、更个性化的视频生成任务，可以实现同一主体的特效变化、不同场景的运镜控制等视频生成。

目前，阿里首尾帧生视频模型已经上线通义万相官网并可直接免费体验，或在Github、Hugging Face、魔搭社区下载模型进行本地部署。

谷歌发布 Gemini 2.5 Flash 预览版

2025 年 4 月 17 日，谷歌宣布推出 Gemini 2.5 Flash 的早期预览版本，该模型通过 Gemini API 在 Google AI Studio 和 Vertex AI 上提供。作为 2.0 Flash 的升级版，Gemini 2.5 Flash 在保持速度和低成本的同时，显著提升了推理能力。

Gemini 2.5 Flash 的一个重要创新是其完全混合的推理模型架构，开发者可以选择开启或关闭模型的“思考”过程，并能设置“思考预算”，从而在质量、成本和延迟之间找到最佳平衡点。即使在关闭思考功能的情况下，该模型也能保持 2.0 Flash 的快速响应速度，并提升性能。

图源：谷歌

谷歌强调，Gemini 2.5 Flash 在成本和模型尺寸方面都具有优势。其引入的“思考预算”功能允许开发者精细控制模型在思考过程中使用的最大 token 数量。较高的预算能提升模型质量，但可能会增加成本和延迟；较低的预算则有助于降低成本和加快响应速度。模型本身也经过训练，能够根据任务的复杂性自动决定所需的思考量。

对于简单的查询，开发者可以将思考预算设置为 0，以实现最低的成本和延迟，同时仍能获得优于 2.0 Flash 的性能。开发者也可以通过 API 参数或 Google AI Studio 和 Vertex AI 中的滑块设置特定的 token 预算。2.5 Flash 的思考预算范围为 0 到 24576 个 token。

行业分析认为，Gemini 2.5 Flash 引入的“思考预算”机制，为企业和开发者提供了前所未有的灵活性，使其能够根据实际应用场景的需求，在模型性能和成本之间进行精细调整，这标志着生成式 AI 技术的商业化进入了一个新的阶段。

豆包上线1.5深度思考模型，并发布Agent解决方案

近日，火山引擎在FORCE LINK AI创新巡展・杭州站，发布了豆包1.5深度思考模型，同时推出智能体相关成果。

此次发布的豆包1.5深度思考模型包含大语言模型Doubao-1.5-thinking-pro和具备多模态能力的视觉版Doubao-1.5-thinking-pro-vision两个版本，前者推理能力更强，后者支持视觉推理，模型在多个基准测试中媲美甚至超越DeepSeek-R1、QWQ-32B、OpenAI o1等模型；在创意写作等非推理任务中，模型也展示出优秀的泛化能力。

图源：豆包

除深度思考模型外，此次升级的豆包文生图模型3.0，在文字排版、图像生成效果及图片分辨率上大幅提升，可输出2K高清图片。

同时，火山引擎还发布了OS Agent解决方案，通过整合可以实现屏幕视觉理解、逻辑推理、界面元素定位和操作的GUI Agent 大模型——豆包 1.5·UI-TARS模型，实现了对传统自动化工具依赖预设规则的突破。目前，豆包1.5·UI-TARS模型已在火山方舟平台上线。

OpenAI 与软银考虑在英国复刻 Stargate 项目

据《金融时报》报道，由 OpenAI 和软银领衔的 5000 亿美元美国数据中心项目 Stargate，正在考虑未来在英国进行投资，以扩展其支持强大 AI 模型的全球基础设施。

Stargate 项目旨在建设大型基础设施，以推动美国 AI 产业发展。该项目计划筹集 1000 亿美元用于 AI 基础设施项目，并在未来四年内将投资总额增加到 5000 亿美元。目前，Stargate 正在美国得克萨斯州阿比林建设一个数据中心，并考察美国 16 个州的选址。

图源：Getty Images

该项目最初将专注于美国本土，首要任务是“落实建设”。虽然重点仍然在美国基础设施建设上，但如果项目成功，将考虑在英国进行投资，作为未来国际扩张的一部分。

英国首相基尔·斯塔默政府近期大力推动对英国蓬勃发展的 AI 产业的投资，包括一项提升能源获取的计划，这一举措，激发了该项目的兴趣，这也使得英国成为 Stargate 项目的首选地之一。一位参与 Stargate 资金分配的人士表示：“这可能是一个真正鼓励投资的好机会。我们希望去计算资源丰富的地方。”

除了英国，德国和法国也是 OpenAI 的候选地。

消费级AI机器人公司玄源科技完成近亿元Pre-A轮融资

近日，国内消费级AI机器人企业X-ORIGIN-AI（玄源科技）宣布完成近亿元Pre-A轮融资，由国内知名投资机构东方富海领投，金鼎资本与联想之星跟投，仁辰资本担任财务顾问。本轮融资距离X-ORIGIN-AI的天使轮融资仅有不到一季度时间，此前的数千万元天使轮由阿尔法公社领投，多名产业投资人跟投。