OpenAI 正考虑起诉微软反垄断、反竞争
近日,据《华尔街日报》的独家报道,OpenAI 与微软之间的合作关系正面临前所未有的紧张局势。知情人士透露,OpenAI 高管已在内部讨论对微软采取“核选项”——即指控微软在双方合作过程中存在反竞争行为,并可能向美国联邦监管机构提出反垄断投诉。这一举措或将引发对双方数十亿美元合作条款的全面审查,甚至对整个科技行业的 AI 生态造成深远影响。
图源:Getty Images
OpenAI 自 2019 年获得微软巨额投资后,双方建立了紧密的技术和商业合作。微软不仅获得了 OpenAI 技术的优先使用权,还独家通过 Azure 云平台分销 OpenAI 的 AI 产品。然而,随着 OpenAI 寻求由非营利性机构向营利性公司转型,并计划上市融资,微软的态度成为能否顺利转型的关键。微软对 OpenAI 转型的迟疑与控制,已导致 OpenAI 高层强烈不满。
双方矛盾的焦点还包括 OpenAI 以 30 亿美元收购 AI 代码初创公司 Windsurf。根据协议,微软有权访问 OpenAI 的全部知识产权,但 OpenAI 担心微软将利用 Windsurf 的技术强化自身的 GitHub Copilot,与 OpenAI 形成直接竞争。此外,微软希望在 OpenAI 转型后的新实体中获得更高股份,这一诉求同样遭到 OpenAI 抵制。
业内分析认为,若 OpenAI 正式提起反垄断诉讼,不仅可能导致与微软六年合作关系的破裂,还将加剧全球监管机构对科技巨头 AI 投资和合作的关注。与此同时,OpenAI 也在积极寻求与其他云服务商合作,以减少对微软的依赖,争取更大的业务自主权和市场空间。
中国工程师携带实体硬盘赴海外训练大模型,规避美芯片禁令
根据多家外媒报道,为规避美国对华 AI 芯片出口限制,中国部分 AI 企业正采取“飞行硬盘”方式,将大量训练数据以实体硬盘形式带出境,在海外租用具备英伟达高性能芯片的数据中心进行 AI 模型训练。
图源:Shutterstock
据悉,今年 3 月,四名中国工程师从北京飞往马来西亚,每人携带一个行李箱,箱内装有 15 块硬盘,每块容量达 80TB,总计 4.8PB 数据。这些数据主要用于训练大规模 AI 模型。由于通过互联网跨境传输如此庞大的数据太过耗时,工程师们选择以“人肉带盘”方式快速转移数据。
这些工程师抵达马来西亚后,前往当地一家数据中心,企业在此租用了约 300 台搭载英伟达 AI 芯片的服务器,完成模型训练后再将成果带回国内。据知情人士透露,此次行动筹备数月,工程师在出发前已对数据集和训练程序进行优化,以减少境外调整需求。
美国自 2022 年起不断加码对华 AI 芯片出口管制,限制英伟达等科技巨头向中国出口高端 AI 芯片。面对封锁,中国 AI 企业一方面加快自主芯片研发,另一方面通过第三国转运硬件、携带数据出境等方式“曲线救国”。东南亚已成为中国企业海外训练 AI 模型的重要目的地。
英伟达 CEO黄仁勋近日也公开表示,美国出口管制政策效果有限,反而刺激了中国在 AI 芯片领域加速自主创新。
MiniMax 开源全球首个大规模混合架构推理模型 M1
6 月 17 日,MiniMax 公司宣布正式开源其最新大模型——MiniMax-M1。这一模型被誉为全球首个开放权重的大规模混合注意力推理模型,在生产力复杂场景中表现突出,成为开源领域的全新标杆。MiniMax-M1 不仅超越了国内闭源模型,在多项能力上也接近海外领先产品,并保持业内最高性价比。
图源:MiniMax
MiniMax-M1 采用混合专家架构(MoE)与自主研发的闪电注意力机制(Lightning Attention)相结合,总参数量高达 4560 亿,每个 token 激活 459 亿参数。模型原生支持 100 万 token 的超长上下文输入,是 DeepSeek R1 的 8 倍,并支持最长 8 万 token 的推理输出。得益于高效的架构设计,MiniMax-M1 在处理长文本和复杂推理任务时,算力消耗仅为 DeepSeek R1 的 25%-30%。
在大规模强化学习训练方面,MiniMax 创新性地提出了 CISPO 算法,通过裁剪重要性采样权重显著提升训练效率。官方数据显示,MiniMax-M1 的强化训练阶段仅用 512 块 H800 GPU 三周完成,租赁成本仅为 53.74 万美元,远低于行业主流水平。
性能评测显示,MiniMax-M1 在软件工程、长上下文理解、工具使用等生产力场景中表现优异。在SWE-bench 验证基准上,MiniMax-M1-80k 得分 56.0%,在长上下文 MRCR 任务中全球排名第二,仅次于 Gemini 2.5 Pro,并在部分维度超越 OpenAI o3 和 Claude 4 Opus。
MiniMax-M1 已在 GitHub 和Hugging Face等平台开放下载,提供 40K 和 80K 两种推理预算版本。用户可在 MiniMax APP 和 Web 端不限量免费体验,同时 API 服务以极具竞争力的价格向开发者开放。MiniMax 方面表示,M1 的发布仅是“MiniMax Week”的开端,后续还将有更多重磅产品陆续亮相。
Cursor 新增每月 200 美元 Ultra 订阅计划
6 月 17 日,AI 编码工具Cursor的开发公司 Anysphere 正式推出全新高端订阅服务——Ultra 计划,定价每月 200 美元,专为“超级用户”与企业团队打造。Ultra 计划相比原有的 Pro 版,AI 模型调用额度提升 20 倍,并为用户提供来自 OpenAI、Anthropic、Google DeepMind 及 xAI 的最新模型支持,同时享有新功能优先体验权。
图源:Cursor
据官方介绍,此次 Ultra 计划的推出,得益于 Anysphere 与多家顶级 AI 模型提供商达成的多年合作协议。公司 CEO Michael Truell 表示,企业级团队已成为 Cursor 增长的核心动力,当整个工程团队共享同一 AI 工作环境时,生产效率能大幅提升。
Cursor 目前年化经常性收入(ARR)已突破 5 亿美元,客户涵盖 Nvidia、Uber、Adobe 等全球知名企业。自今年 4 月以来,Cursor ARR 增长了 2 亿美元,展现出强劲的市场需求。
随着 AI 编码工具竞争日趋白热化,Cursor 所依赖的多家模型供应商也在加速布局自有产品。OpenAI 近期斥资 30 亿美元收购 Cursor 竞争对手 Windsurf,而 Anthropic 则持续完善 Claude Code 编码工具,并限制 Windsurf 对 Claude 模型的直接访问。与此同时,Anysphere 也在加大自研 AI 模型投入,5 月份发布了可跨文件理解代码变更的 “Tab” 模型。
亚马逊 CEO 警告:生成式 AI 会推动企业裁员
6 月 18 日,亚马逊首席执行官安迪·贾西(Andy Jassy)在一封致员工的备忘录中明确表示,随着公司大规模采用生成式 AI 工具和智能代理,未来几年亚马逊的企业员工数量将会缩减。贾西指出,AI 技术将改变现有的工作模式,公司将需要更少的人从事部分当前岗位,同时也会创造出新的工作类型。他坦言,目前尚难预测最终影响,但预计短期内企业员工总数将下降。
图源:Amazon
贾西呼吁员工积极学习和掌握 AI 工具,勇于尝试用更精简的团队完成更多任务。他强调,拥抱变化、熟悉 AI、助力公司提升 AI 能力的员工,将在未来获得更大的发展空间。
自 2022 年以来,亚马逊已裁员超过 2.7 万人,今年也在多个部门进行了新一轮裁员。截至今年 3 月底,亚马逊全球员工总数达 156 万人,其中包括大量仓储和临时工。
贾西透露,亚马逊目前正在开发和应用超过 1000 项生成式 AI 服务和应用,AI 已被广泛用于物流、库存管理、需求预测和仓库机器人等领域。公司还计划在未来十年内投入逾千亿美元扩建数据中心,为 AI 发展提供算力支持。
谷歌发布 Gemini 2.5 系列模型正式版,并推出轻量级模型 Flash-Lite
6 月 17 日,谷歌宣布其 Gemini 2.5 系列 AI 模型迎来重要更新,正式将 Gemini 2.5 Pro 与 Gemini 2.5 Flash 推向生产环境,并推出了全新入门级模型 Gemini 2.5 Flash-Lite,进一步完善其企业级 AI 产品线,正面挑战 OpenAI 的企业市场地位。
图源:谷歌
此次升级中,Gemini 2.5 Pro 被定位为谷歌最强大的大模型,具备复杂推理、高级代码生成和多模态理解能力,支持最高 100 万 token 上下文,适合处理庞大代码库、长文档等高难度任务。Gemini 2.5 Flash 则在性能与效率之间取得平衡,适用于大规模文档摘要、响应式对话等场景。两者均已结束预览,现已稳定可用,企业可放心用于关键业务。
图源:谷歌
新发布的 Gemini 2.5 Flash-Lite 是该系列中最快、最具成本效益的模型,专为翻译、分类等高吞吐、低延迟任务设计。官方数据显示,Flash-Lite 在编码、数学、科学、推理及多模态基准测试中全面超越前代产品。定价方面,Flash-Lite 输入 token 仅需 0.10 美元/百万,输出 token 0.40 美元/百万,远低于 Pro 与 Flash,极大降低了企业的 AI 应用门槛。
值得关注的是,谷歌此次同步调整了 Flash 的定价,输入 token 价格从 0.15 美元上调至 0.30 美元/百万,输出 token 则从 3.50 美元下调至 2.50 美元/百万,并取消了“思考模式”与“非思考模式”的价格区分,简化了开发者的成本预估。
Gemini 2.5 系列模型均具备“思考”能力,开发者可灵活设置模型推理深度,优化准确率与成本。Snap、SmartBear、Connective Health 等企业已在实际生产中应用 Gemini 2.5 模型,验证了其稳定性与先进性。
xAI 每月烧 10 亿美元,正推进 43 亿美元新一轮融资
埃隆·马斯克旗下的人工智能公司 xAI 正在积极推进 43 亿美元新一轮股权融资,紧接着由摩根士丹利牵头的 50 亿美元债务融资。据披露,xAI 自 2023 年成立以来已消耗掉募集资金 140 亿美元中的大部分,截至今年 3 月底,账面仅剩 40 亿美元现金,公司预计 2025 年全年资金消耗将高达 130 亿美元,平均每月“烧钱”超过 10 亿美元。
图源:Getty Images
xAI 以开发 AI 聊天机器人 Grok 闻名,当前正与 OpenAI、Anthropic、Google 等巨头展开激烈竞争。巨额的资金消耗主要用于大规模算力基础设施和高端 AI 芯片采购。尽管如此,xAI 今年营收预计仅为 5 亿美元,明年有望增长至 20 亿美元以上,远低于 OpenAI 的 127 亿美元。公司方面乐观预测,2027 年有望实现盈利。
马斯克近期将 xAI 与社交媒体平台 X 合并,试图借助 X 平台的海量数据和资源提升 AI 研发效率。此次融资所得将主要用于加速 AI 技术迭代和数据中心建设。最新一轮融资后,xAI 估值已显著提升,预计 2025 年一季度末达到 800 亿美元,较 2024 年底的 510 亿美元大幅跃升。
Midjourney 推出首个 AI 视频生成模型 V1
6 月 19 日,知名 AI 图像生成公司 Midjourney 正式发布其首个 AI 视频生成模型 V1,标志着公司从图像迈向视频生成的新阶段。V1 模型支持用户上传图片或使用 Midjourney 生成的图像,自动或通过文本描述生成四段五秒的短视频,并可多次延长,最长支持 21 秒视频输出。目前该功能仅在 Discord 平台网页端开放,订阅基础套餐(10 美元/月)即可体验,高阶套餐用户可享无限生成服务。
图源:Midjourney
V1 模型提供自动与手动动画两种方式,支持“高运动”与“低运动”场景自定义,满足多样化创意需求。Midjourney CEO David Holz 表示,V1 是公司迈向“实时开放世界模拟”终极目标的重要一步,未来还将推动 3D 渲染与实时 AI 模型的开发。
定价方面,视频生成费用约为图像生成的 8 倍。Midjourney 表示将根据用户反馈调整后续定价策略。值得注意的是,V1 发布前夕,Midjourney 因涉嫌侵犯好莱坞影视角色版权被迪士尼和环球影业起诉,引发行业关注。尽管如此,V1 的发布被认为为 AI 视频内容创作提供了更便捷、低门槛的全新选择。
MiniMax 发布新一代视频生成模型海螺 02
6 月 18 日,人工智能公司 MiniMax 正式发布其最新视频生成模型 Hailuo 02(海螺 02),Hailuo 02 以原生 1080P 高清输出、顶级指令遵循能力和极致物理表现成为当前全球领先的 AI 视频生成工具之一。在 Artificial Analysis 全球视频模型排行榜中,Hailuo 02 已超越 Google Veo 3,位列第二,仅次于字节跳动 Seedance 1.0。
图源:MiniMax
Hailuo 02 最大的技术突破在于采用了创新的NCR(Noise-aware Compute Redistribution,噪声感知计算重分配)架构,使模型训练与推理效率提升至上一代的 2.5 倍,总参数量扩大至三倍,训练数据量提升四倍,显著增强了复杂场景下的指令理解和物理模拟能力。实际测试中,Hailuo 02 能够生成高难度体操等复杂动作视频,这在全球同类产品中尚属首例。
自 2024 年 8 月 Hailuo 视频产品上线以来,MiniMax 已助力全球创作者生成超过 3.7 亿条视频。Hailuo 02 的推出,不仅进一步降低了高清视频内容创作门槛,还以极具竞争力的价格为创作者带来更高质量的视觉体验。目前平台支持 768p 6 秒、768p 10 秒和 1080p 6 秒等多种规格,未来还将持续优化生成速度、稳定性,并探索更多高阶功能。
史无前例:苹果、谷歌、Meta 泄漏 160 亿条账号密码数据
6 月 19 日,网络安全平台 Cybernews 披露,全球范围内发生一起有史以来最大规模的数据泄露事件,涉及苹果、谷歌、Facebook、Telegram、GitHub 及部分政府服务等主流平台,共计约 160 亿条账号密码被曝光。此次泄露的数据主要来源于信息窃取类木马(infostealer)恶意软件,研究人员在 30 个未加密的云存储和数据库中发现了这些结构化、可直接用于攻击的账号密码数据。
图源:Cybernews
这些数据集并非历史旧案的重复曝光,绝大多数为首次现身,且数据结构清晰,便于黑客直接导入自动化攻击工具,极大提升了账号接管、身份盗用和精准网络钓鱼的风险。安全专家指出,企业和个人若未开启多重认证,仅凭密码防护将极易被攻破。即便数据集之间存在部分重复,泄露规模和“新鲜度”依然极具威胁。
值得注意的是,2024 年初曾有“史上最大数据泄露”事件曝光,涉及 260 亿条记录,但多为过往已知数据。本次事件则以大量新近采集的账号密码为主,攻击者可利用其对金融、社交、企业等各类在线平台发起大规模攻击。
安全专家建议,用户应立即更换重要平台的密码,确保每个账户使用独立且强度高的密码,并务必开启多重认证。同时,需定期检查设备是否感染恶意软件,避免敏感信息持续被窃取。大规模数据泄露已成为网络安全常态,提升安全防护意识和技术手段已刻不容缓。
谷歌使用 YouTube 视频训练 Gemini、Veo 等 AI 模型
据多家外媒 6 月 19 日报道,谷歌已确认正在利用其庞大的 YouTube 视频库对旗下 Gemini 及 Veo 等人工智能模型进行训练。YouTube 平台目前拥有约 200 亿条视频,平均每天新增 2000 万条。谷歌方面表示,虽然仅使用其中一部分视频进行训练,但外界普遍认为,这一做法已涉及数十亿分钟的内容,远超其他竞品 AI 模型的数据规模。
图源:Google DeepMind
谷歌方面强调,使用 YouTube 内容旨在提升产品体验,并称一直以来都在利用平台内容改进服务。公司发言人称,已为创作者提供一定的形象和肖像保护措施,但创作者无法阻止谷歌将其视频用于自家 AI 模型训练。部分专家指出,谷歌此举可能引发知识产权争议,许多创作者和媒体公司此前并不知情,甚至未被告知其内容会被用于训练生成式 AI。
有第三方机构通过检测工具发现,谷歌 Veo 3 生成的视频与部分 YouTube 原创视频存在高度相似,甚至音频重合度超过 90 分。尽管部分创作者对 AI 工具持开放态度,认为是“友好竞争”,但也有不少人担心自己的内容被“无偿”用于训练,未来或面临被 AI 替代的风险。
目前,谷歌已在部分 AI 产品中加入版权免责条款,并与部分经纪公司合作,协助知名创作者维权。但业内人士认为,相关保护措施尚不完善,AI 生成内容的版权与肖像争议或将持续发酵。
达成五年合作协议,Pixel 10 芯片订单转投台积电
6 月 19 日消息,谷歌即将在今年发布的旗舰手机 Pixel 10 系列将首次搭载由台积电代工的 Tensor G5 芯片,这一决定令长期合作的三星方面感到震惊。过去数代 Pixel 机型的 Tensor 芯片均由三星负责生产,但随着 3 纳米工艺良率持续低迷以及产品稳定性不足,谷歌最终选择将芯片制造权交给台积电。业内消息称,台积电的 3 纳米制程良率高达 90%,而三星仅约 50%,这一差距成为谷歌“转单”主因。
图源:Google
据韩媒 The Bell 报道,三星半导体事业部已召开战略会议,重点讨论如何提升晶圆代工竞争力,并对谷歌订单流失展开深度剖析。此次事件不仅令三星芯片业务遭受重创,也暴露出其在先进工艺、设计资源及客户需求响应等多方面的短板。业内人士指出,谷歌的多样化性能与功能需求不断提升,三星在半导体设计资产和软件配合方面难以完全满足。
资料显示,谷歌与台积电已签署为期五年的合作协议,未来 Pixel 10 至 Pixel 14 系列的 Tensor 芯片都将由台积电独家制造。尽管如此,Pixel 10 仍将继续采用三星制造的部分元件(如 Exynos 5G 调制解调器)。
目前,三星正加紧提升 3 纳米良率,并寻求通过技术改进和管理优化,力争在全球晶圆代工市场重获竞争力。市场数据显示,2025 年第一季度,三星晶圆代工市占率已降至 7.7%,与台积电的 67.6% 形成鲜明对比。业内普遍认为,谷歌“转单”事件将加剧三星内部改革压力,未来能否成功翻身仍有待观察。