大厂混战AI眼镜，Rokid获谷歌“官方认可”，交出标杆答卷

VR陀螺原创 2026-04-28 16:59 热度 332

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

IP归属：广东

文章AI导读

一键萃取文章精髓，核心观点即刻呈现

# 梳理该事件的完整脉络

# 该文章有哪些有意思的观点或数据

# 大家对该事件的态度表现如何？

文/VR陀螺

近日，Google Cloud Next 2026 上在拉斯维加斯成功举办。谷歌在大会上集中强调了从生成式 AI 向代理式 AI 的迁移，并把 Gemini Enterprise Agent Platform、Agentic Data Cloud、8 代 TPU 等能力作为核心看点。

为凸显 Gemini 在多终端适配与多模态交互上的落地潜力，谷歌在会场上展示了一款极具代表性的前沿硬件——由中国厂商乐奇 Rokid 打造的 AI 眼镜 Rokid Glasses（乐奇AI眼镜海外版）。

据悉，Rokid Glasses 是全球首款接入 Gemini 的 AI 眼镜。这款硬件并非简单的 AI 接口挂载，而是实现了 Gemini 与硬件生态的深度耦合。它将图像识别、音频交互与端云协同的能力高度集成于眼镜这一高频穿戴形态中，足以让谷歌把它当作一个能被展示、被验证、被传播的落地案例。

49g轻量化AI+AR眼镜，Gemini 落地终端的“最优解”

Rokid Glasses，普通 AI 眼镜的进阶版。

与市面上仅具备音频交互、拍照记录功能的轻量级 AI 眼镜不同，Rokid Glasses 是一款具备信息显示能力的 AI+AR 眼镜。其采用了“一拖二”的 Micro-LED+衍射光波导方案，支持最高 1500nits 亮度的单绿色信息显示，且整机重量仅为 49g。

这一显示能力对 Gemini 的落地至关重要。真正强大的多模态模型，不仅需要理解复杂的自然语言指令，还要能读懂视觉画面，并将计算结果直接反馈至用户的视野中。相比纯音频眼镜的语音输出，带有 AR 显示的硬件更贴近 AI 大模型理想的落地形态。毕竟，在人类的感官系统中，视觉是接收信息的第一渠道。

市场验证也是一层原因。去年，Rokid Glasses 登陆海外众筹平台 Kickstarter，最终筹资金额突破 400 万美元，一举刷新全球 AI/AR 眼镜品类的众筹纪录。今年，乐奇Rokid AI 眼镜正式登陆日本市场开售，销售额突破 4 亿日元，成为日本 Makuake 平台眼镜品类销售额最快破亿的硬件。

Omdia 报告显示，2025 年 AI 眼镜出货量达 870 万台，同比增长 322%。其中，在“带显示的 AI+AR 眼镜”分类中，乐奇 Rokid 市场占比达到第一。

这意味着谷歌选它，不只是选了一个能演示 Gemini 的外壳，而是选了一个已经在真实市场里跑通销售、产品和用户的载体。

此外，值得注意的是，谷歌与乐奇 Rokid 一直保持着较为密切的合作。在今年早些时候举办的 Rokid 生态大会暨 Spatial Joy 2025 全球 AR&AI 开发大赛上，谷歌云是其官方赛事合作伙伴；在面向海外用户的 Rokid Station2 上，Rokid 也与 Google 合作，将 Android TV 带上了智能眼镜这一新形态。

谷歌和 Rokid 核心逻辑在于对“生态能力”的实力互认。谷歌作为全球最大的开源生态缔造者之一，深知终端竞争的尽头必然是生态之战。而 Rokid 自成立以来，始终深耕 AR 与 AI 软硬件开放生态的建设，这种底层的“开放基因”与谷歌的战略诉求不谋而合。相比于许多刚跨界入局或试图建立封闭围墙的硬件厂商，Rokid 凭借多年积累，已经构筑了极具先发优势的开发者壁垒与平台包容性。这种生态聚合能力，正是谷歌在挑选大模型终端载体时最为看重的特质之一。

所以，从某种程度上来看，谷歌在本次大会上展示 Rokid Glasses 并非一次临时的拼盘，而是长期合作的必然结果。通过乐奇 Rokid 这个已经在全球市场跑通的硬件，谷歌试图向外界证明 Gemini 从云端模型到终端场景的落地能力，而 Rokid Glasses 正是这一标杆性产品。

AI 眼镜，典型的“代理式AI”硬件

硬件形态上的优势之外，Rokid Glasses 之所以能成为 Gemini 的产品案例，另一层核心原因在于，其产品演进路线与本次大会想要突出的代理式 AI 战略不谋而合。

Next’26 的关键词不是单纯的 AI，而是 Agent。谷歌在大会上把 Gemini Enterprise 描述为能构建、编排、治理和优化智能体的平台，并把 Agent Studio、Long-Running Agents、Memory Bank 等能力摆上台面。

这意味着 AI 的竞争重点，已经在从简单回答问题转向完成复杂任务。而眼镜这种设备，天然适合承接任务流的起点和终点。

Rokid Glasses 的产品逻辑正好贴近这个方向。语音唤醒之后，眼镜可以调用 AI 大模型理解需求，再去完成导航、拍摄、翻译、提醒等动作。整个过程就不再是简单的 AI 问答，而是“指令—执行—反馈”的闭环。

如一句“导航去乐奇 Rokid 公司”，AI 眼镜可能只要 5 秒左右就能给出完整路线。但是背后是一条极其复杂的 AI Agent 与硬件结合的技术路径——首先，通过 STT（语音转文本）与大模型进行语义对齐，识别用户的导航意图；随后，AI 需要调用平台内的地图能力接口，抓取用户坐标，并结合“Rokid”等关键词完成目的地检索；最后，需要将适用于 AI 眼镜的导航画面显示到用户的 AI 眼镜上，并同步进行语音指引。

这也是为什么 AI 眼镜比手机更像 Agent 硬件的原因，手机适合输入和观看，眼镜更适合高效率把信息嵌入场景，减少切换成本。

据透露，乐奇 Rokid 与 Google Cloud 正展开全面合作，涵盖端侧与云端 AI 的深度协同。对于用户而言，最直观的体验跃升莫过于 Gemini Live 等功能的接入。基于 Rokid Glasses 特有的硬件形态，彻底释放了 Gemini Live 实时语音与视觉交互的真正潜力。

如果依托谷歌应用生态将此类能力向 AI 眼镜延伸，用户未来便能通过眼镜直接读取 Gmail、查看日程、调用 Drive 中的资料，甚至将拍摄的画面自动整理归档至云盘。这些场景并非天马行空的设想，而是 AI Agent 可以轻易做到基础能力，就看未来乐奇 Rokid 与 Google Cloud 的合作会到怎样的一个深度。

乐奇 Rokid 目前已经用硬件形态把多模态 AI 从抽象词汇变成了可以佩戴、可以工作、可以一起生活的一体化设备。换句话说，谷歌在大会上展示它，并不只是认可一款产品，而是在用它解释一个判断：AI 眼镜可能是 Agent 时代最自然的入口设备之一。

互联网大厂与手机巨头入局，AI眼镜的下一个赛点正在加速

AI 眼镜的市场竞争正在逐步升温。陀螺研究院预测，伴随着供应链技术的迭代，更多大玩家的入场，全球 AI 眼镜市场正在快速扩张，2026 年 AI 眼镜的出货量将达到 1900 万台。

从市场竞争维度看，科技大厂入局的优势显而易见：强大的 AI 底座、超级 APP 生态、品牌影响力以及现有的第一方硬件生态等。但大厂也面临着“生态越强，边界越窄”的围墙花园困境。相比之下，乐奇 Rokid 等独立 AI 眼镜品牌的竞争力在于不通过单一平台绑定用户，而是以更开放的姿态，尽可能将多元化的功能集成于单一设备，将选择权交还给用户。

比如，其 AI 大模型框架面向海外开放了 ChatGPT 5、Gemini 、DeepSeek和 Qwen，而国内用户也有豆包、DeepSeek、智谱清言、千问等选择。不同 AI 大模型的回答方式、口吻和工具调用能力各有不同，用户可以按需自由切换选用。

乐奇 Rokid 的开放不止于模型选择。今年二月，乐奇 Rokid 灵珠平台正式上线“自定义智能体”功能，允许开发者和极客用户通过标准的 SSE（Server-Sent Events）接口，将 Rokid Glasses 接入自定义后端，例如 OpenClaw 开源框架，以及用户私有部署的 DeepSeek R1、Qwen3、Kimi K2.5 等主流大模型。

通过此次谷歌大会释放的市场信号不难看出，中国 AI 眼镜厂商早已跨越了单纯的“硬件制造”阶段，具备了构建一整套软硬协同、真正可落地的 AI Agent 系统工程能力，并成功打造出可供 Gemini 验证的代表性标杆硬件。

值得一提的是，业界有传闻称乐奇 Rokid 或将于今年底推出全彩显示方向迭代的新款眼镜。如果消息属实，接下来，乐奇 Rokid 很可能继续把“Gemini 标杆硬件”这张牌打得更实。

陀螺科技现已开放专栏入驻，详情请见入驻指南： https://www.tuoluo.cn/article/detail-27547.html

VR陀螺专栏： https://www.tuoluo.cn/columns/author1286744/

本文网址： https://www.tuoluo.cn/article/detail-10128525.html

免责声明：
1、本文版权归原作者所有，仅代表作者本人观点，不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为，侵权责任将由作者本人承担。

上一篇：智度集团称陆宏达在海外事件不存在刑事责任，旗下智度股份近年增收不增利

下一篇：业绩触底反弹，大模型已经开始在海康威视创造真实贡献