亚马逊追加 40 亿美元投资 Anthropic
亚马逊于 11 月 22 日宣布向人工智能公司 Anthropic 追加投资 40 亿美元,使其总投资额达到 80 亿美元。作为此轮投资的一部分,亚马逊云计算服务(AWS)将成为 Anthropic 的"主要云计算和训练合作伙伴"。
图源:Anthropic
根据合作协议,Anthropic 将使用亚马逊自主研发的 Trainium 和 Inferentia 芯片来训练和部署其大型 AI 模型。双方还将在硬件研发层面展开深度合作,Anthropic 将与亚马逊旗下芯片设计部门 Annapurna Labs 共同开发下一代 Trainium 加速器。
这笔投资凸显了亚马逊在 AI 领域与微软和谷歌展开激烈竞争的战略意图,值得注意的是,谷歌在去年已向 Anthropic 投资了 20 亿美元。
Anthropic 首席执行官 Dario Amodei 表示,过去一年通过 Amazon Bedrock 平台,已有数万客户在使用其 Claude 系列模型。知名企业如辉瑞制药使用 Claude 模型加速医学研究,欧洲议会则应用其技术构建了文档分析系统,可处理 210 万份官方文件。
据报道,亚马逊还计划用 Anthropic 的模型替代 Alexa 语音助手现有的内部模型。不过由于安全性和延迟问题,该项目推出时间可能推迟到 2025 年。
这一系列大手笔投资反映了 AI 发展的现状,专注于 AI 研发的公司如 OpenAI 和 Anthropic 都需要持续获得资金支持以维持运营,预计未来科技巨头对 AI 领域的巨额投资仍将持续。
英伟达发布全新 AI 音频模型 Fugatto
英伟达近日推出了一款名为 Fugatto(全称为 Foundational Generative Audio Transformer Opus 1)的 AI 音频模型。这款模型不仅能通过文字提示生成音乐和音效,还能对现有音频进行修改和转换,创造出前所未有的声音组合。
图源:英伟达
据英伟达介绍,Fugatto 具备多项独特功能,比如可以将钢琴演奏的音乐转换为人声演唱,能够调整语音的口音和情绪,甚至可以创造出"尖叫的萨克斯"或"犬吠般的小号声"等超现实音效。该模型采用了创新的 ComposableART 技术,能够将训练过程中分别出现的音频特征进行组合,从而产生全新的声音效果。
在技术层面,研究团队使用了来自全球多个开源数据集的约 2000 万个音频样本进行训练,形成了一个拥有 25 亿参数的大规模模型。该项目由来自印度、巴西、中国、约旦和韩国等多个国家的研究人员共同开发,这种多元化的团队构成也使得模型在处理多语言和多重口音方面表现出色。
英伟达应用深度学习研究副总裁 Bryan Catanzaro 表示,生成式 AI 技术将为音乐、游戏和普通创作者带来全新的创作可能性。不过,考虑到生成式技术可能带来的潜在风险,英伟达目前尚未计划对外发布这项技术。
Anthropic开源AI系统与数据集连接新标准
日前,Anthropic开源了一种将AI系统连接到数据系统的新标准:模型上下文协议(MCP)。
MCP允许包括Anthropic模型在内的任何AI模型从业务工具、软件、内容存储库或者是应用程序开发环境中提取数据以完成任务。
图源:网络
根据Anthropic的说法,随着行业在模型功能方面投入了大量资金,AI模型实现了推理和质量的快速进步。然而,即使是最复杂的模型也受到数据隔离的限制,每个新数据源都需要自定义实施,使得真正连接的系统难以扩展。
现在,MCP通过一种协议解决了这个问题,该协议使开发人员能够在数据源和AI驱动的应用程序(例如聊天机器人)之间建立双向连接。开发人员可以通过MCP服务器公开数据,并构建MCP客户端(例如应用程序和工作流),客户端可以根据命令连接到服务器。
“开发人员现在可以根据标准协议进行系统构建,而不用为每个数据源维护单独的连接器,随着生态系统的成熟,AI系统在不同工具和数据集之间切换时将保持上下文,用更可持续的架构取代当今的碎片化集成。”
Anthropic称,Google Drive、Slack和GitHub等企业系统已经获得了预构建的MCP服务器,包括Block和Apollo在内的公司已经将MCP集成到其系统中,而包括Replit、Codeium和Sourcegraph在内的开发工具公司正在将MCP支持添加到旗下平台中。
目前,Anthropic的Claude Enterprise计划订阅者可以通过MCP服务器将Claude聊天机器人连接到公司内部系统。后续,Anthropic还将提供用于部署整个组织服务的生产MCP服务器工具包。
IMAX 将使用 AI 翻译技术,加速影视内容本地化
IMAX 于近日宣布与迪拜 AI 初创公司 Camb.ai 达成合作,将利用 AI 语音模型对其原创内容(包括纪录片)进行本地化翻译,这一举措旨在应对全球内容消费增长及非英语内容需求上升的趋势。
图源:Camb.ai
据普华永道报告显示,2023 年娱乐和媒体行业增长 5%,规模达到 2.8 万亿美元。预计未来五年将以近 4% 的年复合增长率增长至 3.4 万亿美元。值得注意的是,在英语市场(包括美国、英国、澳大利亚和加拿大)中,非英语内容的需求正在快速增长。Netflix 报告称,过去三年在英国的非英语内容观看量增长了 90%。
Camb.ai 提供的 AI 解决方案包括用于语音转文本翻译的 Boli 模型和用于语音模拟的 Mars 模型。该公司的 DubStudio 平台支持 140 种语言,其中包括许多数据资源稀缺的小语种。该技术已在澳大利亚网球公开赛、欧洲体育和美国职业足球大联盟等体育赛事中得到应用。
IMAX 全球总裁 Mark Welton 表示,公司将分阶段推出 AI 翻译服务,首先从数据资源丰富的主流语种开始。虽然具体节省成本的数据未披露,但他指出 AI 部署将帮助降低翻译成本。这一合作目前处于初期阶段,双方将继续探索技术潜力,推动业务发展。
OpenAI 视频生成工具 Sora 遭泄露
OpenAI 的文本生成视频工具 Sora 于 11 月 26 日遭到泄露。一群自称为 "PR-Puppets" 的早期测试者在 AI 开发平台 Hugging Face 上发布了这款尚未公开的工具,以此抗议 OpenAI 对创作者的不公平对待。
图源:Hugging Face
泄露版本的 Sora 能够根据文本描述生成最长 10 秒、分辨率高达 1080p 的视频。泄露者在公开信中表示,作为估值超过 1500 亿美元的公司,OpenAI 在开发过程中让数百名艺术家提供无偿劳动,包括错误测试、反馈和实验性工作。他们认为,早期访问计划实际上更像是一场公关活动,而非真正关注创意表达和技术改进。
泄露者还披露,OpenAI 对 Sora 的使用施加了严格限制,所有输出内容在公开分享前都需要获得公司批准,且只有少数创作者的作品会被筛选展示。在泄漏发生三小时后,OpenAI 暂时关闭了所有艺术家的早期访问权限。
对此,OpenAI 发言人回应称,Sora 仍处于"研究预览"阶段,公司正在努力平衡创造力和安全措施。他们表示,数百名参与 alpha 测试的艺术家帮助塑造了 Sora 的发展,参与完全自愿,无需提供反馈,公司将继续通过资助、活动等方式支持这些艺术家。
Claude AI推出写作风格定制功能
Anthropic正在为Claude AI添加一项新功能,该功能将使用户能够更好地控制聊天机器人生成定制风格的写作任务。据悉,此次更新旨在优化聊天机器人的回复,使生成的文字更自然、更适合电子邮件等特定应用场景。
新功能可供所有Claude AI用户使用,用户可以通过训练模型以匹配个人的写作风格,或从三种预设选项中选择系统提供的预制语气和文字细节级别,包括生成“清晰且精致文本”的Formal样式、“简短且直抒其意”的Concise样式、“包含更多细节”的Explanatory模式。
若用户需要生成自定义样式,则需要将示例的文档上传至Claude,以帮助Claude模仿并匹配文档的协作风格。
图源:Claude
值得注意的是,风格化写作功能并非Claude独有,此前,ChatGPT和Gemini都推出过类似的功能,例如Gemini可以快速调整Gmail草稿的语气或细节,而Apple Intelligence中的“书写工具”功能也提供了类似的写作样式预置。
Inflection 放弃开发下一代 AI 模型
Inflection 新任 CEO Sean White 近日在接受媒体采访时表示,公司将不再与其他科技巨头竞争开发下一代 AI 模型,而是专注于为企业客户提供 AI 工具和服务。这一战略转型发生在该公司此前与微软达成 6.5 亿美元的技术授权和人才收购协议之后。
图源:Inflection
作为战略调整的一部分,Inflection AI 在过去两个月内已收购了三家 AI 初创公司,包括专注于员工邮箱管理的 Jelled.AI、提供 AI 数据分析工具的 BoostKPI,以及欧洲自动化咨询公司 Boundaryless。White 表示,目前市面上的 AI 模型已足以满足大多数企业需求,公司将更注重实用性而非继续推进前沿 AI 研究。
值得注意的是,Inflection AI 目前仍在使用自有模型,但不排除未来使用其他公司的 AI 模型。该公司的竞争优势之一在于可以提供本地部署方案,这对于重视数据安全的企业客户具有特殊吸引力。
据报道,FTC 正在调查微软对 Inflection 的部分收购交易,以评估该交易是否会削弱市场竞争。此前,Inflection AI 已开始限制其面向消费者的 AI 聊天机器人 Pi 的使用量,进一步凸显了公司向企业服务转型的决心。
OpenAI 获软银15亿美元新投资
据外媒报道,软银集团将启动一项要约收购,从OpenAI员工手中收购该公司价值15亿美元的股票。
图源:网络
此次交易由软银首席执行官兼创始人孙正义推动,意在进一步增持OpenAI的股份。此前,孙正义已在OpenAI的上一轮融资中投入了5亿美元。
报道还指出,OpenAI的现任及前任员工均有机会在12月24日前参与此次募资活动。值得注意的是,此次招标与OpenAI转型为营利性企业的计划并无直接关联。
交易双方中,OpenAI已在今年早些时候完成66亿美元融资,公司估值一度高达约1570亿美元。
而软银已多次明确表示将大力加码AI领域投资,该公司除了通过愿景基金投资了包括Glean、Perplexity和Poolside等多家AI初创公司外,还有意启动自己的AI项目。
自动驾驶公司小马智行在纳斯达克成功上市
国内自动驾驶汽车初创公司小马智行(Pony AI)于 2024 年 11 月 27 日在纳斯达克证券交易所首次公开募股中筹集了 4.13 亿美元。
图源:小马智行
小马智行的发行价为每股 13 美元,首日开盘价为 15 美元,较发行价上涨 15%,盘中最高触及 15.48 美元,但收盘时回落至 12 美元,较发行价下跌 7.7%。
小马智行成立于 2016 年,目前在中国北京、上海、广州和深圳等城市运营超过 250 辆自动驾驶出租车和 190 辆自动驾驶卡车。公司与丰田、三一等知名企业建立了战略合作伙伴关系,并获得了沙特阿拉伯 Neom 公司、红杉中国等机构的投资支持。
此次 IPO 由高盛、美银证券、德意志银行、华泰证券和老虎证券担任承销商。小马智行的上市标志着继智加科技和极氪之后,又一家中国汽车科技企业成功在美国资本市场亮相。
马斯克宣布 xAI 将成立 AI 游戏工作室
特斯拉及 X 平台 CEO 埃隆·马斯克近日宣布,其 AI 公司 xAI 将进军游戏行业,成立一家 AI 游戏工作室。
图源:X
马斯克表示,当前太多游戏工作室被大型企业控制,xAI 将通过成立 AI 游戏工作室来 "让游戏再次伟大" (make games great again)。
目前,马斯克尚未透露这家游戏工作室的具体运营框架、计划开发的游戏类型,以及将如何整合人工智能技术。作为一位游戏爱好者,马斯克经常在社交媒体上分享他玩《暗黑破坏神 4》等游戏的经历,但他在游戏开发和工作室运营方面的经验仍不得而知。
业内人士对马斯克进军游戏行业的计划也表示怀疑,指出即使是亚马逊和谷歌这样的科技巨头,也在游戏开发和发行方面遇到了重重困难。
亚马逊即将推出新的AI视频模型
据外媒报道,亚马逊正在开发一款新的生成式人工智能模型Olympus。
图源:网络
早在去年11月,就有消息传出亚马逊正在花费数百万美元训练一个具有2万亿参数的名为Olympus的模型,旨在减少对Anthropic的依赖。
新模型除了文本之外,还可以处理图像和视频内容,报道称,Olympus将能够理解图像和视频中的场景,并通过简单的文本提示帮助用户搜索特定场景。
知情人士透露,亚马逊可能最早于下周在AWS年度客户大会上宣布推出Olympus。