能写能画还能练口语,腾讯新出的生成式AI应用让打工人直呼赚到了

IP归属:广东

紧跟阿里巴巴、百度之后,BAT大厂的最后一家公司终于也上线了自研的AI大模型C端产品。

5月30日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。

此前,阿里巴巴和百度旗下面向消费者端的AI大模型产品通义千问和文心一言已推出,腾讯元宝的上线补足了国内互联网三巨头在AI产品上的最后一块拼图。

早在上一次的腾讯云发布会,腾讯混元就宣布了2个新产品的上线计划,其中之一正是AI助手APP“腾讯元宝”。

对比测试阶段小程序版本,我们发现,腾讯元宝正式上线后将重心更多地聚焦在工作场景。

从界面设计上看,元宝APP主界面看得出来是经典的AI问答聊天机器人风格,热点资讯板块总结了每日新闻,点开后还能显示新闻来源,只不过来源一般都为腾讯新闻,毕竟是自家产品。

在主界面底部,除了有文字、语音、图片、文档等多模态输入形态的输入框外,还有AI搜索、AI作图、文档总结、网页总结等多个功能入口,主打的就是一个让打工人“点开即用”。

而为了检验元宝是否真的能成为打工人的好帮手,我们在使用过程中也给它设置了几道关卡,看元宝最终能否顺利通关。

关卡一:提案大纲撰写

提案、文章大纲撰写可能是生成式AI聊天机器人在工作领域表现最好的功能之一,AI更擅长给出意想不到的思考方向。

就像真实的工作流程一样,我们向元宝提问:“请给我拟定一个生成式AI技术开放日活动的提案大纲”,元宝直接给出了一份包含活动主题、活动议程、宣传推广等环节的答卷,甚至还贴心地提醒你注意预算和活动总结。

作为大模型的基础功能,元宝的文字生成能力合格。

关卡二:新闻获取

前面说到,元宝主界面已经有热点资讯板块总结了每日新闻,那么,当我们询问对热点事件的看法时,元宝又会如何应对?

可以看到,元宝的资料整合逻辑是先搜索全网关于“谷歌大模型幻觉”等关键词的相关信息,并根据这些信息最终生成对该事件的看法,但总的来看,元宝对热点事件的看法基本都是基于搜索到的文章观点,元宝自己并没有提出新的见解,只能算勉强合格。

不过,本着“兼听则明”的原则,元宝在生成内容的末尾还提供了相关内容推荐,整理了事件相关的微信公众号推文,对于入驻公众号平台的媒体来说,这或许可以成为以后重要的流量来源之一。

 

关卡三:文档总结

快速总结文档信息,对于工作、学习中的快速信息整合处理有着重要的意义。特别是在阅读英文文献时,要求大模型不仅能准确翻译文档,还要能抓取文档重要信息。

在实际体验中,我们向元宝发送了scenescript方法的技术文件,并要求元宝翻译总结分析文档内容。

可以看到,元宝不仅准确识别出了晦涩的技术名词,还总结出了scenescript结构化语言命令、训练数据集、网络架构、性能评估等重要信息,让我们无痛速览了一篇英文文献。

同时,如果觉得元宝总结的信息过于概述,还可以要求它详细分析,元宝便会提供更为详细的内容分析总结。

此外,元宝还能够一次性解析多个微信公众号链接、网址,以及PDF、word、txt等多种格式的文档,并支持超长的上下文窗口,这一点在实际使用中也十分便捷。对于需要经常翻译、阅读英文文献的人来说,可谓神器。

因此,在文档总结分析这一关,元宝表现优秀。

关卡四:AI作图

AI作图同样也是现在聊天机器人的标配功能了。

当我们输入“画一幅熊猫宇航员的写实图像”时,元宝为我们生成了一张照片。

可以看到,生成的画面基本符合输入提示,且生成速度很快,基本都在2-3秒左右。

但随着对AI作图功能的的继续尝试,我们发现元宝对图像风格的把握似乎还不够全面。

当我们想要水墨风格的熊猫宇航员时,元宝输出的图像更接近美漫风格,同时,生成的熊猫胸口、手臂上的圆形图标一眼幻视NASA,侵权风险大大提升。

同时,当我们想要“戴着Vision Pro的熊猫”时,元宝直接原地宕机,选择输出一张平平无奇的熊猫证件照。

全程看下来,元宝的图像生成功能能用但不好用,在生成一些常见元素时,元宝表现优秀,但在提示词中出现不那么常规的元素时,元宝选择直接摆烂,因此,我们认为元宝的AI作图还有待加强。

总结:合格,但比较平庸

在四项打工人常用的AI功能挑战中,元宝一项优秀、一项合格、两项一般,总体算是一个合格的聊天机器人,但相比其他常见的竞品并没有很多亮点。

或许是为了增加元宝的功能性,腾讯在主界面之外还新增了“发现”窗口,用于拓展智能体功能。

在这一界面中,用户可以自己创建智能体。只要输入智能体名称,元宝甚至能直接AI生成智能体头像、设定描述、简介、开场白等信息,再通过选择音色、权限范围设置后就可以直接上线,整个过程可以说没有一点门槛。

值得注意的是,在音色设置界面,用户还可以在录制一段语音后直接生成自己的声音,算是直接给智能体打上自己的声音水印了。

而从目前元宝已经上线的智能体来看,智能体数量较少,而且很多智能体都集中在翻译、文案生成、图片生成上,缺乏新意。对于打工人来说,目前比较新颖的智能体或许只有“语言翻译工作室”提供的“口语陪练”,支持语音输入还能检测语法和发音,有潜力成为下班之后点开即用的的口语练习新对象。

根据腾讯方面的说法,元宝支持用户根据个性化需求,快速创建个人专属的智能体,赋予角色设定,结合腾讯生态场景,也让AI自动生成智能体相关信息,并复刻自己的音色。

未来,元宝还将陆续推出腾讯新闻哥、《庆余年》主题等特色智能体,丰富元宝生态。

总的来看,元宝该有的功能都有了,而且表现都挺不错,只不过作为国内AI助手领域的后来者,元宝并没有能和通义千问、文心一言等做出区分。

这一点或许与腾讯的后来者心态有关,对于腾讯来说,来得早不如来得巧,在AI领域开始去伪求真之时,满目追求赶进度和标新立异是不可取的,只有在不断学习的过程中完善产品通路和用户体验,产品才活得下去。

图源:网络

就像腾讯混元大模型负责人刘煜宏在腾讯元宝上线发布会上说的,“腾讯做大模型不争一时之先。就算是晚了三个月晚了半年,拉长来看,也不是太重要的事情。”国内的AI赛道挤满了参赛者,晚入局者只能另辟蹊径,我们期待看到在拉长战线后,元宝能像其背后的腾讯一样,在互联网领域争得一席之地。

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

前方智能专栏: https://www.tuoluo.cn/columns/author1911845/

本文网址: https://www.tuoluo.cn/article/detail-10112951.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

相关文章