大厂混战AI眼镜,Rokid获谷歌“官方认可”,交出标杆答卷

IP归属:广东

文章AI导读

一键萃取文章精髓,核心观点即刻呈现

文/VR陀螺

近日,Google Cloud Next 2026 上在拉斯维加斯成功举办。谷歌在大会上集中强调了从生成式 AI 向代理式 AI 的迁移,并把 Gemini Enterprise Agent Platform、Agentic Data Cloud、8 代 TPU 等能力作为核心看点。

为凸显 Gemini 在多终端适配与多模态交互上的落地潜力,谷歌在会场上展示了一款极具代表性的前沿硬件——由中国厂商乐奇 Rokid 打造的 AI 眼镜 Rokid Glasses(乐奇AI眼镜海外版)。

据悉,Rokid Glasses 是全球首款接入 Gemini 的 AI 眼镜。这款硬件并非简单的 AI 接口挂载,而是实现了 Gemini 与硬件生态的深度耦合。它将图像识别、音频交互与端云协同的能力高度集成于眼镜这一高频穿戴形态中,足以让谷歌把它当作一个能被展示、被验证、被传播的落地案例。

49g轻量化AI+AR眼镜,Gemini 落地终端的“最优解”

Rokid Glasses,普通 AI 眼镜的进阶版。

与市面上仅具备音频交互、拍照记录功能的轻量级 AI 眼镜不同,Rokid Glasses 是一款具备信息显示能力的 AI+AR 眼镜。其采用了“一拖二”的 Micro-LED+衍射光波导方案,支持最高 1500nits 亮度的单绿色信息显示,且整机重量仅为 49g。

这一显示能力对 Gemini 的落地至关重要。真正强大的多模态模型,不仅需要理解复杂的自然语言指令,还要能读懂视觉画面,并将计算结果直接反馈至用户的视野中。相比纯音频眼镜的语音输出,带有 AR 显示的硬件更贴近 AI 大模型理想的落地形态。毕竟,在人类的感官系统中,视觉是接收信息的第一渠道。

市场验证也是一层原因。去年,Rokid Glasses 登陆海外众筹平台 Kickstarter,最终筹资金额突破 400 万美元,一举刷新全球 AI/AR 眼镜品类的众筹纪录。今年,乐奇Rokid AI 眼镜正式登陆日本市场开售,销售额突破 4 亿日元,成为日本 Makuake 平台眼镜品类销售额最快破亿的硬件。

Omdia 报告显示,2025 年 AI 眼镜出货量达 870 万台,同比增长 322%。其中,在“带显示的 AI+AR 眼镜”分类中,乐奇 Rokid 市场占比达到第一。

这意味着谷歌选它,不只是选了一个能演示 Gemini 的外壳,而是选了一个已经在真实市场里跑通销售、产品和用户的载体。

此外,值得注意的是,谷歌与乐奇 Rokid 一直保持着较为密切的合作。在今年早些时候举办的 Rokid 生态大会暨 Spatial Joy 2025 全球 AR&AI 开发大赛上,谷歌云是其官方赛事合作伙伴;在面向海外用户的 Rokid Station2 上,Rokid 也与 Google 合作,将 Android TV 带上了智能眼镜这一新形态。

谷歌和 Rokid 核心逻辑在于对“生态能力”的实力互认。谷歌作为全球最大的开源生态缔造者之一,深知终端竞争的尽头必然是生态之战。而 Rokid 自成立以来,始终深耕 AR 与 AI 软硬件开放生态的建设,这种底层的“开放基因”与谷歌的战略诉求不谋而合。相比于许多刚跨界入局或试图建立封闭围墙的硬件厂商,Rokid 凭借多年积累,已经构筑了极具先发优势的开发者壁垒与平台包容性。这种生态聚合能力,正是谷歌在挑选大模型终端载体时最为看重的特质之一。

所以,从某种程度上来看,谷歌在本次大会上展示 Rokid Glasses 并非一次临时的拼盘,而是长期合作的必然结果。通过乐奇 Rokid 这个已经在全球市场跑通的硬件,谷歌试图向外界证明 Gemini 从云端模型到终端场景的落地能力,而 Rokid Glasses 正是这一标杆性产品。

AI 眼镜,典型的“代理式AI”硬件

硬件形态上的优势之外,Rokid Glasses 之所以能成为 Gemini 的产品案例,另一层核心原因在于,其产品演进路线与本次大会想要突出的代理式 AI 战略不谋而合。

Next’26 的关键词不是单纯的 AI,而是 Agent。谷歌在大会上把 Gemini Enterprise 描述为能构建、编排、治理和优化智能体的平台,并把 Agent Studio、Long-Running Agents、Memory Bank 等能力摆上台面。

这意味着 AI 的竞争重点,已经在从简单回答问题转向完成复杂任务。而眼镜这种设备,天然适合承接任务流的起点和终点。

Rokid Glasses 的产品逻辑正好贴近这个方向。语音唤醒之后,眼镜可以调用 AI 大模型理解需求,再去完成导航、拍摄、翻译、提醒等动作。整个过程就不再是简单的 AI 问答,而是“指令—执行—反馈”的闭环。

如一句“导航去乐奇 Rokid 公司”,AI 眼镜可能只要 5 秒左右就能给出完整路线。但是背后是一条极其复杂的 AI Agent 与硬件结合的技术路径——首先,通过 STT(语音转文本) 与大模型进行语义对齐,识别用户的导航意图;随后,AI 需要调用平台内的地图能力接口,抓取用户坐标,并结合“Rokid”等关键词完成目的地检索;最后,需要将适用于 AI 眼镜的导航画面显示到用户的 AI 眼镜上,并同步进行语音指引。

这也是为什么 AI 眼镜比手机更像 Agent 硬件的原因,手机适合输入和观看,眼镜更适合高效率把信息嵌入场景,减少切换成本。

据透露,乐奇 Rokid 与 Google Cloud 正展开全面合作,涵盖端侧与云端 AI 的深度协同。对于用户而言,最直观的体验跃升莫过于 Gemini Live 等功能的接入。基于 Rokid Glasses 特有的硬件形态,彻底释放了 Gemini Live 实时语音与视觉交互的真正潜力。

如果依托谷歌应用生态将此类能力向 AI 眼镜延伸,用户未来便能通过眼镜直接读取 Gmail、查看日程、调用 Drive 中的资料,甚至将拍摄的画面自动整理归档至云盘。这些场景并非天马行空的设想,而是 AI Agent 可以轻易做到基础能力,就看未来乐奇 Rokid 与 Google Cloud 的合作会到怎样的一个深度。

乐奇 Rokid 目前已经用硬件形态把多模态 AI 从抽象词汇变成了可以佩戴、可以工作、可以一起生活的一体化设备。换句话说,谷歌在大会上展示它,并不只是认可一款产品,而是在用它解释一个判断:AI 眼镜可能是 Agent 时代最自然的入口设备之一。

互联网大厂与手机巨头入局,AI眼镜的下一个赛点正在加速

AI 眼镜的市场竞争正在逐步升温。陀螺研究院预测,伴随着供应链技术的迭代,更多大玩家的入场,全球 AI 眼镜市场正在快速扩张,2026 年 AI 眼镜的出货量将达到 1900 万台。

从市场竞争维度看,科技大厂入局的优势显而易见:强大的 AI 底座、超级 APP 生态、品牌影响力以及现有的第一方硬件生态等。但大厂也面临着“生态越强,边界越窄”的围墙花园困境。相比之下,乐奇 Rokid 等独立 AI 眼镜品牌的竞争力在于不通过单一平台绑定用户,而是以更开放的姿态,尽可能将多元化的功能集成于单一设备,将选择权交还给用户。

比如,其 AI 大模型框架面向海外开放了 ChatGPT 5、Gemini 、DeepSeek和 Qwen,而国内用户也有豆包、DeepSeek、智谱清言、千问等选择。不同 AI 大模型的回答方式、口吻和工具调用能力各有不同,用户可以按需自由切换选用。

乐奇 Rokid 的开放不止于模型选择。今年二月,乐奇 Rokid 灵珠平台正式上线“自定义智能体”功能,允许开发者和极客用户通过标准的 SSE(Server-Sent Events)接口,将 Rokid Glasses 接入自定义后端,例如 OpenClaw 开源框架,以及用户私有部署的 DeepSeek R1、Qwen3、Kimi K2.5 等主流大模型。

通过此次谷歌大会释放的市场信号不难看出,中国 AI 眼镜厂商早已跨越了单纯的“硬件制造”阶段,具备了构建一整套软硬协同、真正可落地的 AI Agent 系统工程能力,并成功打造出可供 Gemini 验证的代表性标杆硬件。

值得一提的是,业界有传闻称乐奇 Rokid 或将于今年底推出全彩显示方向迭代的新款眼镜。如果消息属实,接下来,乐奇 Rokid 很可能继续把“Gemini 标杆硬件”这张牌打得更实。

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

VR陀螺专栏: https://www.tuoluo.cn/columns/author1286744/

本文网址: https://www.tuoluo.cn/article/detail-10128525.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。