作者|鱼丸
编辑|星奈
媒体|AI大模型工场
十多年前,《钢铁侠》里托尼・史塔克依托贾维斯操控智能系统,让无数人憧憬起可语音交互、随心操控设备的智能助手。
而如今,腾讯把类似贾维斯的AI,直接装进了电脑桌面。最近,腾讯正式上线操作系统级AI助手Marvis马维斯,定位是国内首个支持自然语言全流程操控电脑的AI Agent。它能理解指令、调用应用、处理文件、整理信息、甚至还能辅助总结桌面。
“我们是为你24小时在线的电子牛马"这个页面上的文字也很“腾讯风”,一下子就拉近了产品和用户的距离,也让“AI Agent”这个略显技术化的概念变得更接地气。
视觉上,Marvis 采用黑色小马形象,搭配不同颜色的”围脖“:能帮你整理文件、阅读总结、操控电脑、打开 App、搜索全网信息。每个小马都对应一种能力,像一支分工明确的“牛马”。
这款产品之所以值得关注,不光是多了一个桌面AI管家,更关键在于背后的研发团队——腾讯应用宝团队。
这支团队继承了十几年与英特尔、微软等软硬件厂商的合作关系和跨端引擎技术。长期深耕Windows底层生态,做过数亿用户都在用的系统优化、驱动管理、安全防护类工具,了解普通用户日常在系统设置、文件整理、多软件切换上,会浪费大量时间。
所以团队直接攻坚系统级接口调用、多智能体协同,以及本地隐私运行架构。从读懂Windows底层配置逻辑,到实现语义理解 + 指令执行,再到支持断网也能用的本地AI运算,Marvis的各项功能,都带着这支团队多年PC工具研发的底子。
它不是又一个只会聊天写内容的机器人,而是想让整台电脑都能直接语音对话、自动执行操作。
今天我们就来上手实测一下,这个桌面AI助手到底能不能帮人省心干活,看看这支老牌PC团队做出来的AI助手究竟实力如何!
用6个Agent,打造专属于你的电子牛马
相信最近在面对各类AI助手的层出不穷,已经让很多人对这类产品的期待慢慢趋于平淡了。
市面上同类产品虽多,大多都逃不开两种定位,要么主打日常对话闲聊,要么侧重全网信息检索,真正能直接操控电脑、完成全流程实操任务的产品少之又少,用户高效办公的实际需求,始终没能得到妥善满足。
而Marvis与其他AI助手的不同之处就在于,它的核心能力不是对话,而是深入打通 Windows 系统底层,依托自然语言实现电脑全流程自主操控,早已跳出传统对话机器人的局限,更像是入驻系统内部的实操执行者。
在这个“Marvis办公室”里,那只戴着红围脖的小马是主Agent(类似项目经理),它负责全盘统筹,理解需求并拆解任务,然后派遣其他专项小马去干活。
File Agent是数字资产管家,处理文件搜索、阅读、编辑生成、格式转换等;
Computer Agent是Windows系统运维专员,负责电脑底层配置与自动化运维,系统设置、硬件检测等操作;
App Agent是应用操作专员,可以调用电脑上的App与Exe应用;Browser Agent是网页交互专员,可以接管网页,进行网页交互与数据抓取;
Search Agent是搜索专家,擅长网络搜索与信息聚合,能快速从公开资源中定位答案并给出关键引用。
有趣的是,如果某些任务不需要特定小马参与,它们也不会傻站着,而是会去旁边找同事唠嗑八卦,甚至去厕所摸鱼——这种拟人化的资源调度,让自动化变得更加生动。
先来测一个日常办公常见场景case:帮我找出这个文件夹里跟Q4市场投放数据有关的文件,把关键数据汇总成一张表。
可以看到,我的文件夹其实挺乱的,Word、Excel、PPT、PDF什么都有,我自己看了都头疼。结果对它来说完全不是问题。
可以看到它先是扫描了全部文件,自动跳过纯图片和无法打开的损坏文件,然后对剩余文档语义检索,锁定与“Q4”“投放”“数据”等关键词相关的内容。甚至在发现多版Excel中存在数据冲突时,通过时间戳交叉比对,剔除了旧版数据,最终提取出投放总额、渠道分布等核心指标,交付给我一张数据汇总表,并标注了数据的出处文件。
全程无需手动打开任何办公软件,没有复杂的提示词工程,它自己就搞定了全部任务。
但这只是基础操作,Marvis真正的杀手锏在于跨应用的复杂工作流。比如身为内容创作者的我,最头疼的就属“内容多平台分发”。
而现下我只需要下达指令:“把这篇关于AI助手效率的文章,分别发布到小红书、B站和微博。”
这时候,红围脖小马(Marvis)立刻进入“监工”模式。它并没有亲自动手,而是派遣了“Computer Agent”这只小马去操作浏览器。
你可以看到,屏幕上瞬间弹出了三个浏览器窗口,分别对应三个平台的后台。最神奇的是,Marvis理解不同平台的表单差异——小红书叫“笔记标题”,B站叫“稿件标题”,微博叫“文章标题”。
它指挥Agent精准地将同一份内容填入对应的字段,连标签和分类都自动匹配好了。
而在这一顿操作猛如虎的同时,不需要处理文件的“File Agent”小马,正悠闲地在旁边的跑步机上“摸鱼”;甚至如果任务更简单,你还能看到有小马溜达到厕所里去“带薪如厕”。
这种智能的任务分配和闲置资源管理,让整个过程既高效又充满趣味。
面对各种各样的文件,如果是人工,就要先打开Excel逐份录入,再编写计算公式,复核异常值,制作图表,撰写报告......整套走下来,少说要两小时,还不算中间有环节出错返工的时间。
而Marvis则是你下达任务,它执行交付。等候的几分钟里,你大可以离开工位,处理别的事务。
提取文件只是Marvis的能力之一,它能做的远不止于此。比如它还可以帮你检查你的电脑状态是否健康。
先扫描磁盘、驱动,然后又查了高内存进程,提醒我C盘占用太高,建议清理或迁移。每项后面都跟着打开按钮,可以直接跳转到任务管理器。
再比如,设计一个网页。我给它一些图片和信息,让它根据这些给我一个咖啡馆开业设计网站。
它先解析了文字信息,提取出店名、位置、主打卖点、开业时间和活动信息作为页面内容框架。然后调用浏览器生成了一个响应式页面,顶部用了一张咖啡特写做背景图,上面浮动店名和开业时间;中间是功能介绍。整个页面暖棕色系,字体干净。最重要的是移动端也可以适配。
即使电脑不在身边也能远程操控,下载移动端APP,就能跟桌面端互联,记录也是同步的。
咱们再继续看看Marvis对移动端的接管,它不再只是让你“用手机下指令”,而是把手机变成了随身携带的“数字遥控器”与“进度监控台”。
输入:“查看我电脑桌面上论文库文件夹中相关的最新PDF文献。提取每篇的标题、核心方法、实验结论与摘要要点,整理成手机端可读的速览清单。”
几分钟后,手机这边就可以看到任务已经完成的提示。点开即见一份卡片式速览报告,而所有源文件保留在电脑原路径,手机端仅缓存轻量索引与摘要文本。
即使电脑不在身边也能远程操控,下载移动端APP,就能跟桌面端互联,记录也是同步的。你在外出差或通勤路上,依然可以像坐在工位前一样,随时给红围脖小马派活、盯进度、做决策。手机不再是信息的被动接收器,而是指挥数字员工军团的前线指挥所。
这些场景拼在一起,其实已经能说明AI的下半场已经开始从聊天转向干活了。你不用再充当自己和电脑之间的操作媒介,只需要说出需求,剩下的执行部分由它直接穿透系统去完成。
腾讯加速布局桌面Agent,背后是大模型与产品矩阵双重支撑
桌面Agent实际使用效果,七分看系统架构,三分靠大模型能力。若是模型理解和执行能力偏弱,很容易出现指令执行偏差,体验大打折扣。
其实,Marvis稳定流畅的操作表现,离不开腾讯混元大模型的支撑。
此前腾讯混元团队推出Hy3 preview模型,整体参数295B,激活参数21B,支持 256K超长上下文。这也是混元完成架构与底层设施重构后,推出的首款新版模型,由腾讯首席AI科学家姚顺雨带队研发。
这款模型在复杂推理、指令执行、代码生成以及智能体适配等方面都完成了优化升级。上线两周内,整体调用量相比上代提升明显,代码与智能体场景调用数据涨幅突出,市场认可度不俗。模型在Agent能力上的稳步提升,也让Marvis的指令执行靠谱度有了更好保障。
值得一提的是,姚顺雨本身深耕AI Agent领域,是智能体主流ReAct框架的提出者。而由他主导模型迭代与桌面智能助手研发,也能看出腾讯在相关技术和人才布局上,有着明确的规划与积淀。
当然,Marvis并非腾讯布局桌面Agent领域的首款产品。
早在今年3 月,腾讯就已接连推出多款相关产品,电脑管家团队打造的 QClaw,支持通过微信下发指令,实现电脑远程操控;紧随其后,腾讯云 CodeBuddy 团队上线 WorkBuddy,定位面向企业场景的桌面智能工作台,深耕商务办公生态;如今 Marvis 正式登场,主打深度嵌入Windows 底层,瞄准操作系统级全域操控能力。
同一条赛道接连落地三款不同定位产品,也能看出腾讯在桌面 Agent 领域清晰的布局思路。三款产品各司其职,覆盖不同使用场景,彼此并非功能重复,而是形成完整的产品梯队。
三者有着十分明确的定位差异。QClaw 偏向轻量化实用需求,依托电脑管家原有系统权限搭建而成,以简易远程操控为核心,部署便捷、上手门槛低。不过受远程指令传输形式限制,难以完成高复杂度连续操作,跨软件联动能力相对有限。
WorkBuddy 聚焦企业办公市场,面向职场办公人群,深度联动腾讯全系办公工具,主打办公生态内高效协同,适配企业日常办公流程,合规性与团队适配性更强。但它更多依托应用层接口运作,很难深入触及电脑系统底层权限。
Marvis则是在此基础上完成能力升级,主打原生系统深度适配,直接对接Windows 底层接口,可自主完成文件管理、进程调控、窗口操作等各类系统级动作,无需依赖第三方应用开放权限。更强的底层操控能力,也让它具备了更全面的自动化执行实力,同时在技术研发与安全规范上有着更高标准。
密集推出多款产品,不难看出腾讯AI布局思路的转变,从以往单一团队攻坚,转变为多团队分头探索、多点位同步发力。不同业务团队依托自身原有优势打造产品,覆盖大众日常使用、企业商务办公、底层技术探索多个方向,依靠内部多元尝试,摸索桌面Agent 最贴合市场的发展形态。
当然,桌面Agent还处在早期阶段,复杂任务的稳定性、权限边界、安全隐私和用户信任,都还需要持续验证。但可以确定的是,AI 助手的竞争已经不再停留在“谁更会聊天”,而是进入到“谁更能干活”的阶段。
从这个角度看,Marvis 更像是腾讯在桌面 AI 时代投下的一枚关键棋子。
相信很快,当我们打开电脑,不再需要在一堆软件、文件夹和设置菜单之间来回切换,只要说出需求,就能自动替你执行。那个时候,真正的“电子牛马”,或许才刚刚开始上岗。
数据支持天眼查,大模型独家合作账号









