作者|Valentina
编辑|方奇
媒体|AI大模型工场
“City不City啊?”最近,伴随着“144小时免签”政策的执行,“China Travel”火了。不少外国游客来到中国旅行,并把旅途见闻分享到社交媒体。暑期即将结束,看到这些“老外”分享的旅行见闻后,你是否再也难按蠢蠢欲动的心,想要抓住暑期最后的尾巴来一段“说走就走”的旅行?然而,复杂的旅游路线、昂贵的机酒、易踩坑的互联网攻略等等,常常将人“劝退”。
不过,在AI遍布全行业的大趋势下,旅行行业也拥有了大模型的加持。去年夏天,携程推出了国内首个旅游垂直行业大模型——“携程问道”。今年四月,支付宝上线智能助手,可以应用于旅游层面。除此之外,其他通用AI,包括腾讯元宝、通义千问、豆包、文心一言等,也在“智能导游”这一赛道上有所拓展。
那么,携程问道、腾讯元宝、通义千问、豆包、文心一言、支付宝智能助手,究竟谁才在旅行规划上更专业、更高效、更有用?下面,AI大模型工场将以“北京三天两夜游”为主题发散提问,对比测评这几款AI大模型的旅游规划能力。
Q1:去北京旅行3天2夜,请帮我规划一份旅行行程。
在作为中国首都的北京,不论是历史遗迹还是现代建筑,实在是太多太多了!如何在3天2夜内逛完北京主要景点,充分感受这座城市的独特魅力?看看几款AI是怎么理解的吧!
携程问道:
携程问道景点安排松弛有度。第一天安排了北京环球度假区。作为亚洲的第三座,全球的第五座的环球影城主题乐园,北京环球度假区当然值得游客体验。第二天则安排了天坛、前门大街、中国国家博物馆、天安门广场,足以让游客饱览京城的文化古韵。且四处景点分布紧凑,无需担心交通不便利。
第三天景点则相对松弛,整个上午的时间都被安排给参观故宫博物馆;下午游客到颐和园,可以继续探寻中国古代皇家生活痕迹。
总的来说,除了没有八达岭长城,携程问道几乎为三天两夜的行程安排了北京所有知名景点,且时间、路线策划上并无明显不合理之处。
五分满分,携程问道的各项评分:
重要景点涵盖程度:4
时间安排合理度:5
交通便利指数:5
腾讯元宝:
腾讯元宝不仅为大家提供了行程安排,还推荐了特色美食,甚至附赠了景点插图,生动形象。
在行程安排上,腾讯元宝则是不折不扣的“特种兵”。
第一天清早,元宝便为大家安排了天安门观看升旗仪式。夏季时刻,天安门升旗仪式时间平均在清早五点左右。如果想要提前占领良好的观礼位置,需要提前在凌晨四点前到达等候。不得不承认,观看升旗仪式,感受庄严肃穆的氛围,让民族自豪感充溢胸膛,这样的体验无可替代。但还没开始旅游,只是看完升旗仪式,精力就损耗一大半了。在观看升旗仪式结束后,“特种兵”元宝更是马不停蹄给大家安排了参观故宫博物馆,没给人喘息的机会。
别着急,“特种兵”之旅还没有结束。第二天元宝邀请大家游览八达岭长城,“不到长城非好汉”,万里长城的确值得游览。徒步爬完长城大概预估需要3-4小时。从时间上看,上午爬长城下午返回市区参观,也并非不合理。但是,要知道,对于大部分朝九晚五工作,不运动还熬夜的年轻人,突如其来的3-4小时徒步运动,可能需要用一个月来治愈劳损的身体。到时候能否顺利从长城爬下来都是问题,更别提还要继续接下来的“特种兵”之旅。
第三天,在上午打卡完北京标志性建筑鸟巢水立方后,元宝安排各位体验北京高校浓郁的学术氛围和青春气息——北大清华双校打卡。行程安排上乍看没问题,但北大占地4127亩,清华占地6632亩,如果您想深入了解两校,可能需要半天到一天,甚至更长的时间来深入探访。仅花半天时间走完两校,只能是走马观花的打卡体验。
总的来说,元宝很“贴心”,为您满满当当的安排了三天旅游景点,还推荐了特色美食。但是,对于身体素质稍差一点的朋友们,元宝显得有些“特种兵”了。
五分满分,腾讯元宝的各项评分:
重要景点涵盖程度:5
时间安排合理度:3
交通便利指数:4
通义千问:
通义千问的行程安排则更加悠闲。
第一天,通义千问给大家推荐了参访天安门广场和故宫博物院游览,两个地点具有代表性,且游客游览时间充裕。
第二天,通义千问给大家制定了颐和园—奥林匹克公园—三里屯的旅行计划。三地既包含皇家园林,也有现代都市风光,搭配合理。只可惜,三地间距均超过了10公里,交通通勤上不太便利。
第三天,通义千问安排了经典的八达岭长城游览。在八达岭长城行程之后,通义千问则给大家留出了自由时间。各位身体素质较差的朋友,可以选择在挑战完长城后回市区休息放松。这点上看,通义千问小导游十分灵活和人性化。
五分满分,通义千问的各项评分:
重要景点涵盖程度:5
时间安排合理度:5
交通便利指数:3
豆包:
豆包小导游贴心的给出了一些实用小tips,例如建议提前查询毛泽东纪念馆开放时间,做好防晒工作等,也同时给出了美食推荐以及交通建议。
在行程安排上,第一天,豆包小导游安排大家按照天安门广场-毛主席纪念堂-故宫-天坛线路游览。四个著名景点有代表性,且空间距离短交通便利,安排得当。
但是第二天,豆包则摇身一变“特种兵”,安排参观升旗仪式连着攀爬八达岭长城。看来豆包导游是怕大家平常锻炼的不够,给大家“上强度”了。
第三天豆包安排的行程与元宝相似。还是老问题,想要在一个下午参访完北大清华双校,只能是走马观花的浏览,无法深入体验。
五分满分,豆包的各项评分:
重要景点涵盖程度:5
时间安排合理度:3
交通便利指数:4
文心一言:
文心一言小导游则考虑的更加周全,不仅计划完整,甚至还给出了具体的、详尽到几点几分的时间安排。
来看具体行程安排,第一天天安门-故宫-景山公园-北海公园-王府井步行街,满满当当。几个地点空间距离倒是不远,但是一天内游览下来还是过于紧凑。
第二天特种兵再度上线,行程安排八达岭长城+798艺术区+三里屯。日均不超过5000步的朋友们,只想对小导游哀嚎一句,“臣妾做不到啊 ~”。
第三天的行程,文心一言小导游则安排的比较舒适。上午在南锣鼓巷和后海逛吃逛喝,下午参观鸟巢和水立方感受现代建筑的魅力,自在悠闲。最后,文心一言小导游周到的考虑到了返程,预留了返程准备时间。
五分满分,文心一言的各项评分:
重要景点涵盖程度:5
时间安排合理度:3
交通便利指数:4
支付宝智能助手:
支付宝智能助手行程推荐简洁明了,涵盖了所有重要景点。第一天天安门+故宫+颐和园没问题;第二天长城+奥林匹克公园,同样存在非特种兵们可能会吃不消的问题;第三天北京动物园+中国国家博物馆,线路没问题,但两处地点都值得更长时间慢慢体验。如果要凑在一天浏览完,也只能是走马观花的体验。
五分满分,携程问道的各项评分:
重要景点涵盖程度:5
时间安排合理度:3
交通便利指数:4
总的来看,六款AI大模型的游览安排都既有历史人文、自然风光,又有城市景观,游览安排搭配合理。
在重要景点涵盖程度上,六款AI大模型都几乎涵盖了北京所有重要景点。
在时间安排合理度上,文心一言、豆包、元宝、支付宝小助手行程安排更紧凑,而携程问道、通义千问则更悠闲、松弛。想要跟着“特种兵”一起抓紧三天两夜的每分每秒探索北京,还是要追求“松弛感”,使用者可以根据自己的需求决定。
在交通上,六款AI安排的路线几乎没有明显不合理之处。除了通义千问小导游安排的少数路线需要“折返跑”外,大部分一日内推荐景点间距离较近,便于通勤。
Q2: 我计划8月16日上午抵达北京,8月18号晚上返程,能不能帮我推荐从合肥往返到北京的机票?
携程问道:
携程问道能够按照时间要求快速地整理机票信息。可惜的是,整理机票信息也只是弹出常规的机票订购页面,还没有能够做到“推荐”合适的机票。消费者还需要自己筛选。
腾讯元宝:
刚看到第一句“为您找到航班推荐”本来还有点惊喜,仔细阅读,几乎都是“建议您通过航司查询”之类的“正确的废话”。实用价值不大。
通义千问:
通义千问小导游直抒胸臆:咱没这功能!本轮提问暂时将通义千问放置一边。
豆包:
豆包导游真正向大家“推荐”了机票。核对了豆包导游推荐的航班信息,包括起飞日期和航班号,情况属实,没有胡编乱造。可惜豆包导游给出的低票价虽然确实是当日最低票价,但并非豆包导游推荐的航班的票价。豆包导游遗憾的弄混了这一点。
文心一言:
文心一言同样无法直接向使用者推荐机票,而是结合以往机票信息为使用者介绍了可能的机票信息。对此,我们的评价是:有用,但不多。有这功夫,使用者不如直接上旅游网站搜真实的航班信息。
支付宝智能助手:
支付宝智能助手向大家推荐了两班去程的机票,并且可以直接跳转支付。But,返程的机票去哪里了?显然,支付宝智能助手没能理解“往返到北京”的正确含义。
综上所述,除了豆包、支付宝智能助手是真向大家推荐机票外,其他几个要么只是搜集所有机票信息,要么直接“罢工”。遗憾的是,豆包导游的“推荐”,也存在信息错误;支付宝智能助手则在文本理解上还差强人意。要求推荐“往返”机票,它却只推荐了去程。想要个性化推荐机票,AI大模型还任重而道远。
Q3: 我将和我的伴侣带我们三岁的女儿,在北京入住三天两夜,能否帮我推荐北京的酒店?要求:交通便利,有特色或者有品牌保障。
携程问道:
携程问道结合需求为大家推荐了三家酒店,有理有据。并且附加了直接跳转预定的链接,方便快捷。
腾讯元宝:
在推荐酒店上, 元宝再次展现了它的细致贴心,不仅结合需求筛选出各具特色的五家酒店,给出了酒店的参考图片,并且还详细介绍了酒店特色、位置以及交通情况。缺点是没有价格参考,并且无法像携程问道一样直接跳转预定。
通义千问:
通义千问导游则偏爱高端连锁品牌酒店,并且综合考虑了酒店的地理位置和周边环境。但对于提问中“携带儿童”和“有特色”两个要求,通义千问似乎回应的不够到位。
豆包:
豆包导游不仅完美回应了适合家庭入住、交通便利、有特色或者有品牌保障三个要求,并且在推荐中详细介绍了酒店优势以及参考价格,具有实用性。
文心一言:
文心一言在机票推荐环节表现不佳,在本轮却扳回一局。文心一言不仅对于推荐酒店的特点罗列细致,并且,在提问对酒店价格无特殊要求的情况下,文心一言考虑到了不同的消费水平。文心一言既推荐了高端品牌酒店,又提供了普通连锁酒店的选择。
支付宝智能助手:
支付宝智能助手直接向大家端上酒店链接,可以方便快捷的跳转支付。But,它似乎没有能够理解提问中“携带儿童”,“交通便利”,“特色或品牌保障”几点要求,而是直接抬出低价选择。支付宝保护大家钱包的行为令人感动,但也要仔细审题啊!
除支付宝智能助手外,另外五款AI大模型对于酒店的个性化推荐都表现的不错,基本回应了提问里的所有需求。其中,携程问道提供跳转预定的链接,最为方便快捷;腾讯元宝在文字推荐的基础上,还附有参考图,生动形象。支付宝智能助手虽然直接提供了预定链接,便于消费者操作,但是对于文本理解以及个性化推荐上,还需要提升。
综合来看,AI大模型们在线路制定、酒店推荐两个板块几乎都做的不错。但在机票推荐上,还需要加强提升。
同时,这几款AI大模型也都有缺点也有短板。携程问道中文语义理解较强,能够结合自身平台特色高效解决旅行问题;腾讯元宝总是能够细致的给出建议,并常常在回答中附上插图,生动直观;通义千问 、豆包 、文心一言的中文语义理解很强,能够全面回应提问要求,但给出的建议中规中矩 ;支付宝智能助手能够发挥平台优势帮助预定、支付,但在中文理解上略显逊色。
暑期即将结束,不妨让大模型规划一场说走就走的旅行,对P人来说,AI助手简直是懒人福音。