作者|Valentina
编辑|星奈
媒体|AI大模型工场
盼望着盼望着,万众期盼的,祖国母亲的生日——国庆节,终于来临了。这个国庆,我们既要为我们热爱的祖国母亲献上最真挚的祝福,也要好好休息放松一下,犒劳一年来努力奋斗的自己。
国庆假期怎么休息放松?调休太复杂?景点人太多?宅家够无聊?
别担心!这个国庆假期AI来相伴,充当你的“最强大脑”、“出行导游”、“宅家搭子”,让你放心玩儿,轻松玩儿!
那么,究竟谁是国庆节最贴心的AI大模型伙伴?阿里通义、腾讯元宝、字节豆包、百度文心一言、智谱清言,前来竞选。
十月如果有颜色,那一定是中国红。谁能让十月的这抹中国红燃烧的更火热?一起来看看吧!
一、这个调休有点儿火热——AI计算国庆调休
前不久,2024年中秋和国庆的放假调休安排登上热搜,并引发热议
这一串数字直勾勾地砸下来,是不是瞬间花缭乱?不仅你懵了,广大网友也集体抓狂,纷纷调侃道:“上一个把简单数字搞这么复杂的,还是大促凑满减!”
为了捋清楚调休表,我们派出“超高智商”选手——AI大模型上场。能够轻松处理文本生成、逻辑推理和数据的AI大模型,能不能算对这次的调休安排呢?
问题如下:
“2024年中秋和国庆即将到来,以下是从9月9日(周一)到10月13日的放假调休安排:上6休3,上3休2,上5休1,上2休7,再上5休1。请帮我计算,扣除原本的周末休息,我因调休到底多休了几天?”
正确答案为:4天。
通义千问答案:7天
元宝答案:4天
文心一言答案:2天
豆包答案:4天
智谱清言答案:4天
本轮逻辑角逐大赛结果超出预期,有三款AI大模型:元宝、豆包、智谱清言,得到了正确答案。
其中,元宝、豆包的思路皆为:计算该时间段内原本周末天数,再用调休后放假天数减去原本周末天数,得到调休后多出来的休息日。思路简洁且答案满分,即使是“数学差生”也能轻松看明白!点赞👍。
智谱清言则选取了代码计算,咔咔一串40行的代码,最后也得到了准确答案。小编表示看不懂,但觉得很牛!
文心一言、通义千问在本轮落了下风,一顿“分段统计”操作猛如虎,最后纷纷给出了错误答案。天呐!多么希望通义千问的错误答案:多出7天假期,能是真的!
二、这个假期有点儿火热——AI“种草”&“避雷”官
国庆节作为中国的长假之一,是许多人出游的绝佳时机,但这也意味着热门景点往往会人满为患。为了让大家更好地避开人潮,享受宁静而独特的旅行体验,AI集体化身小众景点“种草官”,为大家搜罗来自全国各地的小众“宝藏景点”。
问题如下:
帮我推荐国庆节去也不拥挤的小众旅行景点,并给出推荐理由。
豆包:
文心一言:
元宝:
豆包、元宝、文心一言详细整理了小众景点信息,并附上了外部链接、图片等更多了解渠道,帮助大家快速get景点风貌,细节拉满;且推荐的地点也够小众,值得珍藏。
通义千问:
智谱清言:
通义千问、智谱清言提供的信息相对更简洁,但给了更多、更丰富的地点选择。But,通义千问推荐的福建土楼,智谱清言推荐平潭岛、洛阳、腾冲,这几个景点似乎不够小众啊。信息检索归纳能力上,貌似还是豆包、元宝、文心一言更上一层楼。
除了“种草”以外,在网络营销宣传铺天盖地的今天,规划国庆节期间出游行程时,还需要考虑到诸多因素,以避免可能的“雷区”。为了帮助大家更好的“排雷”,AI大模型们又摇身一变,成为“避雷官”,贴心附上国庆出游小tips及注意事项。
问题如下:
帮我“避雷”一下国庆节期间的出游目的地,并给出理由
豆包:
文心一言:
通义千问:
智谱清言:
元宝:
本轮除了元宝同学没能理解“避雷”的含义,当成了推荐,其余AI大模型们都表现出色。智谱清言、豆包罗列出了国庆期间建议避开的景点,满足了提问需求;通义千问、文心一言则积极主动发挥,对买票渠道、访问具体时间等容易“踩雷”的其它方面进行了全方位的概括总结。为大家的国庆假期轻松出游保驾护航,AI们是认真的!
三、这个宅家有点儿火热——国庆宅家AI新玩法
在上一轮收集旅行信息中,AI大模型们几乎都表现出色,为大家的国庆出游计划争先献上锦囊妙计。
那么,决定宅家的你,又该怎么用AI聊以慰藉?
别担心!试试这些国庆宅家AI新玩法,即使卧在沙发,也能和AI擦出别样火花!
(这个部分前两part可以等国庆节要到了,看各家有没有出什么国庆节专题或者智能体,修改替代!最后part留了一个视频通话的板块但是没有测评,我觉得这个部分可以留到国庆期间,用国庆的场景测)
朋友圈“文曲星”:
国庆节想要在朋友圈为祖国母亲献上祝福,但苦于文笔不佳?AI智囊团们献上最佳国庆祝福,让你也能够在朋友圈当上一次“文曲星”。祝福语是AI写的,但我对祖国母亲的感激与祈福,却是真挚的!
prompt:为祖国母亲献上几条国庆祝福,文笔优美,气势磅礴
豆包:
元宝:
文心一言:
朋友圈“小画家”:
别的AI擅长写文案,通义万相则能够画出画面精美的国庆海报,为你的文案再搭配丰富的画面,成为国庆期间朋友圈里最亮眼的“显眼包”。
通义万相:
prompt:帮我生成国庆海报,扁平插画, 荧光色
Prompt:帮我生成国庆海报,画面中有长城、彩带、白鸽,柔和色彩, 水彩
只需要简单的prompt提示词,通义万相就能够得到风格迥异、质量优良的海报,让人不得不感叹,画图还得是用通义!
在祖国母亲昂首挺胸、大步迈进75周岁华诞之际,国产AI大模型们也展现出前所未有的朝气,用自己独特的技术献上自己最诚挚的礼物,为祖国母亲科技强国添砖加瓦。
在本次国庆节AI测评中,各个国产AI大模型展现出了自己独特的优势。元宝、豆包、通义千问逻辑运算能力很强,能够解决复杂问题;文心一言的中文能力一如既往的流畅稳定;智谱清言也在AI视频通话上领先碾压国内外大模型。
与此同时,国内AI大模型也展现出了“卷应用”的趋势。从一年半前的大模型混战,到今年5月的价格战,大模型们性能不断提升,成本持续下降,多家拥有深厚技术背景的大模型公司正推动AI技术在多个领域的广泛应用。例如,通义千问不仅作为大语言模型开放,更在电商领域实现智能客服与个性化推荐;文心一言则聚焦于内容创作与教育服务,为媒体、广告行业提供高效文案支持,同时在教育领域成为学生的智能学习伙伴;智谱AI在打造完整对标Open AI的模型产品的基础上,通过提供 API 和云端私有化部署方案等方式,在科研领域为科研人员提供文献检索和分析服务。
如今,大模型行业的焦点已从模型本身转向应用落地。无论是有雄厚背景的大模型公司,还是新兴的初创企业,都在拼命卷应用,目标直指打造爆款。从市场需求角度来看,随着人工智能技术的发展,各行业对智能化解决方案的需求日益增长。大模型只有通过在实际应用中落地,才能满足不同领域的具体需求,开拓更广阔的市场空间;从技术发展角度而言,当大模型技术逐渐趋于成熟,性能和成本达到一定水平后,进一步的技术突破难度加大。此时,将技术转化为实际应用,通过不断优化应用场景和用户体验,能够为技术的持续发展提供新的动力;从商业竞争角度考虑,大模型公司需要通过打造有竞争力的应用来实现商业价值。在激烈的市场竞争中,拥有爆款应用的公司将更有可能获得用户认可、吸引投资,并在行业中占据优势地位。
在欢乐渡过国庆佳节后,AI大模型们又将继续怎么继续卷应用,又将渡过怎样激烈的竞争,未来的事就留给未来思考吧。