“攜程問(wèn)道”問(wèn)不明白道

1 評(píng)論 2590 瀏覽 0 收藏 12 分鐘

在人工智能的浪潮下,AI旅游的概念逐漸走進(jìn)了人們的視野。作為在線旅游服務(wù)的巨頭,攜程推出了自己的AI旅游大模型——攜程問(wèn)道,旨在通過(guò)先進(jìn)的AI技術(shù)為旅客提供個(gè)性化的旅游規(guī)劃和建議。然而,AI旅游真的能夠滿足用戶對(duì)于精準(zhǔn)和個(gè)性化的需求嗎?

想靠AI旅游的朋友,終究還是沒(méi)有在攜程上問(wèn)明白道。

我有個(gè)犟種朋友,喜歡各類(lèi)科技花活,每次網(wǎng)上有新東西他都要試試。這個(gè)十一他要嘗試的是靠旅游行業(yè)垂直大模型——攜程問(wèn)道,實(shí)現(xiàn)AI旅游。

我告訴他,AI旅游這事現(xiàn)在不靠譜。

整個(gè)大模型行業(yè)目前公認(rèn)的事實(shí)是,AI大模型在發(fā)散性的內(nèi)容上可能會(huì)超出預(yù)期,但在實(shí)際規(guī)劃和落地的任務(wù)上,基本只能處于copilot的角色,人力還是主導(dǎo)。問(wèn)吃喝、本地游玩、出規(guī)劃,還不如大眾點(diǎn)評(píng)、小紅書(shū)高效。

甚至不如問(wèn)我。

因?yàn)橛脩粼谒^的靠AI旅游這件事上,需要的是一個(gè)AI Agent(AI智能體/助理/助手)。而AI Agent要求的是精確性,但目前AI大模型的發(fā)散性大于精確性,因此AI旅游在當(dāng)下還是一個(gè)悖論。

比如說(shuō)想在上海玩,AI會(huì)搜索歷史數(shù)據(jù)和信息,告訴你外灘、石庫(kù)門(mén)、武康路、東方明珠、豫園、淮海路你都值得逛逛。但如果需要一個(gè)符合自己喜好的專(zhuān)屬行程,AI提供不了。你只能在AI提供的信息資料里做二次的人工篩選。

如果你想玩的更local一點(diǎn),比如想找一家有品位的精釀吧,演繹水平高的劇本殺店,小姐姐多套路少的夜店,AI更推薦不出來(lái)。也就是說(shuō),攜程問(wèn)道目前成不了AI Agent。

但顯然,我的犟種朋友不想聽(tīng)我嗶嗶賴賴。

于是我們直接進(jìn)入測(cè)試,讓攜程問(wèn)道出一個(gè)10月2號(hào)—10月6號(hào)在上海的行程規(guī)劃。結(jié)果攜程問(wèn)道只幫我們把行程規(guī)劃到了10月4號(hào),10月5號(hào)和10月6號(hào)的行程它讓我們自己發(fā)揮。嗯……我上一個(gè)00后實(shí)習(xí)生,是領(lǐng)導(dǎo)家親戚,也差不多是這個(gè)味兒。

我們又問(wèn)了下武康路到底有點(diǎn)什么獨(dú)特魅力,究竟能玩點(diǎn)啥?得出的結(jié)論是Citywalk。然后我們告訴攜程問(wèn)道,如果不想在上海Citywalk,是否有更好的行程推薦。

結(jié)果攜程問(wèn)道把之前推給我們的行程又重復(fù)了一遍。

好吧,黔驢技窮。

最后我們告訴攜程問(wèn)道,想住在中山公園附近,讓他推薦幾家酒店??赡苡捎跊](méi)有精確的告訴它是上海中山公園,所以攜程問(wèn)道給我推薦了天南地北,各個(gè)地方中山公園附近的酒店。這就很迷,咱們和攜程問(wèn)道聊了半天,不一直都在聊上海旅游的事么?這點(diǎn)前后文語(yǔ)義的識(shí)別也這么困難么?

大模型行業(yè)里有個(gè)詞叫“AI幻覺(jué)”,即人工智能系統(tǒng)(自然語(yǔ)言處理模型)生成的內(nèi)容與真實(shí)數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象。

說(shuō)白了就是,用戶問(wèn)前門(mén)樓子,AI答胯骨軸子。

短短三四個(gè)問(wèn)題,我們看到攜程問(wèn)道一直沉浸在AI幻覺(jué)中,離需要準(zhǔn)確性的AI Agent還有不少距離。誠(chéng)然,造成AI幻覺(jué)的的原因有很多,從數(shù)據(jù)質(zhì)量差到算法缺陷,再到缺乏接地和過(guò)度擬合,都會(huì)導(dǎo)致AI幻覺(jué)。

然而,所有這些原因的核心是:AI 模型的輸出取決于它們的輸入,或它們?yōu)樘幚硭鲚斎攵O(shè)計(jì)的方式。歸根結(jié)底,AI 模型無(wú)法自我推理、研究或事實(shí)核查。因此,需要準(zhǔn)確性的AI Agent,在當(dāng)下還無(wú)法完美實(shí)現(xiàn)。

理想狀態(tài)下的AI Agent是,大多數(shù)時(shí)候你只需給它一個(gè)最終你想要達(dá)成的目標(biāo),它能直接交付結(jié)果,過(guò)程你啥都不用管。

康奈爾大學(xué)、華盛頓大學(xué)和滑鐵盧大學(xué)以及非營(yíng)利研究機(jī)構(gòu)AI2的研究人員,最近進(jìn)行了一項(xiàng)研究,測(cè)試了GPT-4o、Meta的Llama370B、Mistral的Mixtral 8x22B、Cohere的Command R+,以及調(diào)用API的模型,比如Perplexity的Sonar Large(基于Llama)、Google的Gemini 1.5 Pro和 Anthropic的Claude 3 Opus等多個(gè)開(kāi)源模型,

實(shí)驗(yàn)證明,各家模型產(chǎn)生的AI幻覺(jué)半斤八兩。在答案來(lái)源不是維基百科的情況下,每個(gè)模型的平均回答事實(shí)性都較低。當(dāng)然,從另一個(gè)維度看,沒(méi)有AI幻覺(jué),大模型就沒(méi)有發(fā)展可言。

但在目前這種AI幻覺(jué)泛濫的環(huán)境下,用戶想要一個(gè)規(guī)劃行程的Agent,或是某個(gè)行業(yè)的最新資訊和報(bào)告,幻覺(jué)就是致命缺陷。很明顯在這種情況下,以AI Agent為目標(biāo)的AI旅游大模型,目前基本都是悖論。最多只是一個(gè)網(wǎng)絡(luò)素材整合工具。

這種窘態(tài)不止出現(xiàn)在攜程問(wèn)道身上。字節(jié)的豆包、百度的文心一言等等,在AI旅游的表現(xiàn)上都挺一般。尤其是在理解復(fù)雜用戶需求和提供精準(zhǔn)個(gè)性化服務(wù)方面。要么行程過(guò)于空洞,不知無(wú)謂。要么AI幻覺(jué)爆發(fā),自己加戲太多,甚至一些AI模型連門(mén)票價(jià)格都會(huì)報(bào)錯(cuò)。

目前行業(yè)的共識(shí)是,基于大模型的發(fā)散性產(chǎn)生的AI幻覺(jué)是沒(méi)法解決的,所以必須要通過(guò)恰當(dāng)?shù)奈⒄{(diào)形成行業(yè)專(zhuān)用的深模型。但當(dāng)下,即使在ChatGpt的GPTs應(yīng)用或是字節(jié)的Coze平臺(tái),也很少有真正可用的,更好解決問(wèn)題的Agent。

如果AI Agent無(wú)法基于用戶目標(biāo)形成個(gè)性化推薦,AI旅游大模型又當(dāng)如何?攜程問(wèn)道目前在這上面抖了一個(gè)小聰明,即提供了一個(gè)涵蓋酒店、景點(diǎn)、餐飲及夜生活等多維度的“攜程口碑榜”,供用戶出游參考。

也就是攜程集團(tuán)聯(lián)合創(chuàng)始人梁建章所謂的:利用攜程自己長(zhǎng)年積累的數(shù)據(jù)和榜單,為用戶做推薦。直白點(diǎn)說(shuō)就是,這些東西攜程的用戶玩了都說(shuō)好,相信你也會(huì)覺(jué)得好。至于個(gè)性化,暫且不聊。

比如,我們問(wèn)“上海最好的酒店是哪家?”

攜程問(wèn)道基于“上海豪華酒店榜”得出結(jié)論,前灘香格里拉大酒店是上海最好的酒店。

略讓人驚訝,因?yàn)檫@酒店我住過(guò)。不差,只不過(guò)馬桶有點(diǎn)智能了,智能到半夜會(huì)自己工作。很卷,但瑕不掩瑜??梢f(shuō)在一眾奢華酒店云集的上海,前灘香格里拉是TOP1,這個(gè)確實(shí)有點(diǎn)出乎意料。

于是我讓他問(wèn)問(wèn)這個(gè)“上海豪華酒店榜”是什么機(jī)構(gòu)評(píng)定的,基于什么標(biāo)準(zhǔn)評(píng)定的?結(jié)果得出了一個(gè)比較好笑的結(jié)論。

實(shí)際上這個(gè)“上海豪華酒店榜”,就是攜程自己推出的“攜程口碑榜”其中一部分,會(huì)根據(jù)口碑、銷(xiāo)量等幾個(gè)維度來(lái)篩選,還有一些下榜規(guī)則。不過(guò)攜程點(diǎn)評(píng)現(xiàn)在避免不了人工干預(yù)成分在,且目前來(lái)看,下榜規(guī)則執(zhí)行的也并不嚴(yán)格。

比如9月份剛被曝出來(lái)“1天2次6700元”事件的長(zhǎng)春高新益田福朋喜來(lái)登,目前仍在“長(zhǎng)春豪華酒店榜”名列第14,并沒(méi)有下榜。

實(shí)際上在整個(gè)AI服務(wù)流程中,攜程并沒(méi)有體現(xiàn)出來(lái)其所謂的,“通用AI大模型所沒(méi)有的旅游產(chǎn)品資源庫(kù)優(yōu)勢(shì)”。這份“攜程口碑榜”也從一開(kāi)始就彌漫著一股濃郁的商業(yè)氣息,看不出與大眾點(diǎn)評(píng)必吃榜、必玩榜有什么明顯的產(chǎn)品差異。

換句話說(shuō),即便今天沒(méi)有AI大模型,也不影響攜程推出一份“攜程口碑榜”。兩者之間沒(méi)有任何因果關(guān)系,以及強(qiáng)關(guān)聯(lián)性。

事實(shí)上,對(duì)于AI旅游大模型來(lái)說(shuō),真的可用的Agent一定不是簡(jiǎn)單模塊組合可實(shí)現(xiàn)的,如果有,也只是曇花一現(xiàn)。AI大模型催生了Prompt Engineer的工作角色,AI Agent理應(yīng)催生Flow Engineer一類(lèi)崗位,需要一批兼具產(chǎn)品和編程思維能力的角色。

但在攜程的公開(kāi)招聘中,目前沒(méi)有看到明顯具有Flow Engineer性質(zhì)的崗位。

而在所有可公開(kāi)查詢到的信息中,攜程距離AI Agent最近的一次,則是今年二季度財(cái)報(bào)的時(shí)候,攜程集團(tuán)聯(lián)合創(chuàng)始人、董事局主席梁建章,CEO孫潔、CFO王肖璠等公司高管,首次以AI Agent形象,在財(cái)報(bào)會(huì)議上與投資人交流。

但很明顯,此AI Agent并非AI大模型行業(yè)的AI Agent,說(shuō)穿了不過(guò)是類(lèi)似數(shù)字人的奇技淫巧。

作者 | Tniniuo 編輯 | 藍(lán)蘭
本文由人人都是產(chǎn)品經(jīng)理作者【聞旅】,微信公眾號(hào):【聞旅】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 怎么看不到這個(gè)攜程問(wèn)道的入口

    來(lái)自廣東 回復(fù)