近期,科技行业迎来两则重磅消息:ChatGPT开发商 OpenAI 计划进军浏览器市场,以及美国司法部提出强制 Google 出售 Chrome 浏览器的反垄断方案。这两个看似独立的事件,有可能会引发科技行业的变革。
Chrome 长达 12 年的市场统治
美国司法部在与 Google 长达三年的反垄断诉讼中,于 2024 年 11 月提出了一系列整改措施。其中最引人注目的是要求 Google 出售 Chrome 浏览器业务。目前,Chrome 在美国浏览器市场占有率为 57.4%。
图源:Statcounter
将目光望向全球市场,Chrome 的市场占有率更是达到了惊人的 66.7%,排名第二的 Safari 仅有 18%,就更不用说只有个位数市占率的 Edge、Firefox 等对手了。
图源:Statcounter
如果将时间线拉长一些,翻看更早一点的数据,那 Chrome 自 2012 年 5 月超越 IE 浏览器开始,已经在浏览器市占率第一的位置占据了长达 12 年之久,可以说 Chrome 已经牢牢控制住了浏览器市场。
图源:Statcounter
由于 Chrome 是最受欢迎的浏览器,再加上 Chrome 与 Google 的其他服务(如搜索、邮箱等)紧密集成,用户在使用 Chrome 时更倾向于使用默认的 Google 搜索等服务。这种习惯使得 Google 能够维持其搜索引擎的高使用率,从而增强其广告收入和市场影响力,当然这也就引来了反垄断调查。
美国司法部除此要求 Google 出售 Chrome 浏览器业务,整改方案还包括:终止与苹果等公司的默认搜索引擎合作协议、向竞争对手开放搜索索引数据、限制 Google 在未来 5-10 年内投资搜索、广告技术和 AI 领域的竞争对手。
图源:Google
毫无疑问,Google 自然是对这一方案表达了强烈反对,其全球事务总裁兼首席法务官 Kent Walker 称这些建议"令人震惊"且"极端"。他表示,这些变革不仅会影响 Google 搜索业务,还会破坏用户日常使用的其他产品,并可能损害用户隐私和安全。
美国司法部下发的完整版文件可在此查看:
OpenAI:从搜索到浏览器的进击
在这一背景下,OpenAI 考虑开发自己的网络浏览器就显得格外引人注目。据报道,OpenAI 已经与多家网站和应用开发商就搜索功能展开洽谈。这也跟 OpenAI 此前推出的 ChatGPT with Search 搜索功能形成了呼应,表示他们有可能正在打算构建一个完整的搜索和浏览生态。
图源:OpenAI
OpenAI 在这个月的月初推出 ChatGPT with Search 搜索功能,有别于之前的 ChatGPT,搜索功能可以直接为用户提供实时的网络搜索服务,包括新闻、体育、股票和天气等信息,而不是基于过去的训练数据给出答案。
ChatGPT with Search 被集成在了现有的 ChatGPT 界面中,只需要点击对话框旁边新增的搜索小按钮,用户就可以用自然语言提问,并得到经过整理的连贯答案,有别于 Google 和 Bing 等传统搜索引擎提供的链接列表。
前段时间 OpenAI 曾透露,ChatGPT 聊天机器人目前每周有超过 2.5 亿用户使用,这也意味着有相当多的用户群体已经养成了没事就问问 ChatGPT 的习惯,而在 ChatGPT 旁边新增一个小按钮就能使用的 ChatGPT with Search 搜索功能,这对 OpenAI 来说只是一个小小的举措,甚至可以说毫无成本,但却有可能改变这 2.5 亿周活跃用户使用搜索引擎的习惯,极有可能会撼动 Google 的搜索地位。
在今年 7 月 OpenAI 刚公开 ChatGPT with Search 时(当时还叫 SearchGPT),有传言称这会是一个独立的搜索引擎,但如今看来,将两者集成在一起确实是更好的选择,对用户来说,基本不用改变原本使用 ChatGPT 时的习惯。
除了布局搜索引擎,OpenAI 在近期还买下了chat.com这个域名,在这之前 ChatGPT 的域名一直是chatgpt.com,从使用方便的角度来看chat.com是一个比google.com更加短、更容易输入的域名。
图源:Chrome Web Store
有了更短的域名,有了搜索引擎,接下来要做的自然就是要抢占入口,让更多人使用了。现在 OpenAI 也不是没有尝试抢占浏览器的默认搜索引擎的位置,比如他们就推出了一个 ChatGPT search 的浏览器扩展,这个扩展的作用只有一个,就是将 Chrome 浏览器的默认搜索引擎换成 ChatGPT。
图源:Chrome Web Store
仅仅依附于 Chrome,成为众多可选搜索引擎中的一个肯定不能满足 OpenAI 的野心,而且仅仅只是成为默认搜索引擎也并不能释放出 ChatGPT 的全部实力。
让浏览器成为 AI 能力的最佳载体
普通用户对 ChatGPT 的认知可能觉得它只是一个 AI 聊天机器人,现在也具备了一定的搜索引擎功能,但 ChatGPT 以及背后的大模型在开发者的眼中,它们的上限远不止如此,OpenAI 所提供的 API 接口具有更高的“可玩性”。
自从 OpenAI 开始向开发者提供大模型的 API 以来,如今围绕 API 实现的应用场景已经非常丰富了,许多知名公司通过调用 OpenAI API 开发了各种软件和服务。
图源:Duolingo
比如知名的学习软件 Duolingo 在 2023 年就推出了 Duolingo Max,这是一项基于 OpenAI 的 GPT 模型所打造的 AI 学习功能,通过 AI 可以生成专门针对用户水平的学习内容和对话练习来提升用户体验。
图源:Duolingo
开发了 IntelliJ IDEA 的知名的软件开发公司JetBrains为旗下的开发工具推出了 AI Assistant 功能,这是一款将 OpenAI 的 API 集成到 Jetbrains IDE 产品中的新功能。开发人员可以让 AI 来编写测试、用自然语言编写提示、获得代码建议、自动生成文档和提交信息、解释代码并重构代码片段。
图源:JetBrains
浏览器上的翻译工具「沉浸式翻译」则是在我们熟知的微软翻译、谷歌翻译等常见翻译工具的基础之上,接入了 OpenAI、Claude、Gemini 和DeepL等 AI 大模型,用户通过 API 就可以调用这些大模型,获得比传统翻译工具更好的效果。
图源:网络
除了上面这三个的例子,AI 模型在自然语言处理和对话、文本摘要和提取关键信息、数据分析和统计、逻辑推理和问题解决、邮件和文档起草、会议记录整理等方方面面都具备不俗的表现,那等到 OpenAI 官方亲自开发浏览器的时候,上述这些功能都可以直接与浏览器深度绑定,释放出大模型的所有能力,带来原生的 AI 体验。
AI 代理成为新战场
现在以 ChatGPT、Claude、Gemini 为首的 AI 聊天机器人主要设计是用于与人类进行交互,提供信息、回答问题或执行简单的任务,通常是一问一答,没有自主性。AI 代理则是一种自主系统,可以感知其环境、做出决策并采取行动以实现特定目标,通常可以处理复杂任务并与环境交互,如自动化流程和优化决策。
比如 Anthropic 在上个月推出的 Computer Use 就是一个 AI 代理,也是其 AI 模型 Claude 3.5 Sonnet 的一项新功能,这个功能可以模拟人类操作计算机,让 AI 执行一系列任务,包括查看屏幕、移动光标、点击按钮和输入文本,从而实现自动化处理重复性任务。
另一家 AI 巨头谷歌则是正在开发一个内部代号为「Project Jarvis」的 AI 代理,这个功能由谷歌的 Gemini 语言模型提供支持,同样可以实现解释屏幕截图、点击按钮和输入文本的功能,比如根据用户指令自动执行在线购物、研究和预订航班等。
根据媒体报道,OpenAI 目前也正在研发代号为 “Operator” 的 AI 代理,最早可能在明年 1 月发布一款。
图源:Anthropic
就以 Anthropic 推出的 Computer Use 为例,它的工作原理基本可以划分为以下几个步骤:
-
启动阶段:用户配置 Claude 以执行特定任务,如执行操作或处理文件;
-
决策阶段:Claude 评估可用工具,并决定如何执行用户指令;
-
执行阶段:AI 根据指令进行屏幕截图、分析状态,并返回操作命令;
-
反馈阶段:根据执行结果,Claude 可以进行必要的调整或修正;
但在实际应用中也面临很多挑战,比如 Computer Use 在执行每个操作时,都需要通过截屏反馈给 AI,但图片相比单纯的文本数据量更大,AI 分析图片也比处理文本更花时间,最终会导致响应时间较长,而且每次操作都涉及大量 token 消耗,增加了使用成本。
这时候,再回到 OpenAI 计划开发浏览器这件事情上,了解浏览器是如何渲染网页的用户应该知道,网页渲染涉及多个步骤,主要包括解析 HTML、构建 DOM 树、CSSOM 树以及渲染树。
HTML 文档、HTML 文档的内部表示形式、所有需要被绘制的可见元素,以及最终在屏幕上呈现的实际内容浏览器是一清二楚,在这样的情况下,很多原本需要通过屏幕截图才能实现的功能都可以省掉截图这个步骤,AI 在处理用户的指令时,速度更快、成本也低。
OpenAI 挖角 Google,Chrome 核心人物陆续加入
OpenAI 想要开发浏览器的计划并非空穴来风,两位曾在谷歌 Chrome 团队的大佬在今年都已陆续跳槽到了 OpenAI。
图源:Linkedin
其中 Ben Goodger 在 2005 年就加入了谷歌,已在谷歌任职了近 20 年时间。他是谷歌的副总裁,也是 Chrome 团队的创始成员之一。在加入谷歌之前,他还曾是 Firefox 浏览器的首席开发者,可以说他就是一路见证着浏览器的发展,在浏览器开发方面有着深厚的背景。
图源:Linkedin
另一位近期加入 OpenAI 的 Darin Fisher 在谷歌任职时间同样不短,超过了 16 年时间,他曾是 Chrome 浏览器的工程副总裁,目前 Chrome 浏览器的 Privacy Sandbox 核心功能就是出自他之手。
有了这两位对 Chrome 浏览器有着深厚影响的工程师加入,可能会对未来的 AI 与浏览器结合产生重大影响。
市场影响与未来展望
尽管不少人对反垄断措施的实际效果持怀疑态度,认为用户已经养成使用 Chrome 和 Google 搜索的习惯难以改变,但竞争对手则对这些措施表示乐观。DuckDuckGo首席执行官 Gabriel Weinberg 表示,这些措施将释放搜索市场潜力,带来新一轮创新浪潮,为新进入者创造机会。
从技术发展趋势来看,未来搜索市场的竞争可能并非传统搜索引擎之间的较量,而是向类似 ChatGPT 这样的交互式信息获取方式转变。这也解释了为什么 OpenAI 选择在此时布局浏览器市场:通过将 AI 能力与浏览器深度整合,可能带来全新的网络使用体验。
不过这一进程仍面临诸多不确定性,比如对 Google 进行的司法审理可能会一直持续到 2027 年才有最终结论,而且特朗普新政府对科技巨头的态度也可能影响案件走向。特朗普此前表示,对 Google 实施过于严厉的限制可能会削弱美国在科技竞争中的优势。
无论如何,随着 AI 技术的快速发展和监管环境的变化,搜索和浏览器市场的竞争格局正在发生深刻变革。OpenAI 的加入可能加速这一进程,为用户带来更多选择和创新服务。