大廠必爭(zhēng)之地!AI搜索產(chǎn)品萬(wàn)字長(zhǎng)文分析
多年以前,百度、谷歌等就在開始做智能搜索,但彼時(shí)的智能搜索只是對(duì)搜索結(jié)果的簡(jiǎn)單整理歸納,效果并不如人意。當(dāng)前AI爆火,在AI的加持下,搜索會(huì)不會(huì)更強(qiáng)大一些呢?其實(shí)并不是,至少當(dāng)前AI搜索的使用方式,并不理想。比如說(shuō),正文作者分享的這些案例。
本文會(huì)從一個(gè)360AI搜索的負(fù)面案例切入,討論三個(gè)大問(wèn)題:
1、為什么AI搜索產(chǎn)品成了共識(shí)
2、AI搜索產(chǎn)品的演進(jìn)方向猜測(cè)
3、AI搜索產(chǎn)品的核心體驗(yàn)及影響因素
全文約15000字,看不完記得收藏~~
—-正文分割線—-
最近在使用360AI搜索的時(shí)候遇到一個(gè)比較嚴(yán)重的產(chǎn)品設(shè)計(jì)問(wèn)題,非常影響體驗(yàn)。
在360AI搜索首頁(yè),和普通搜索產(chǎn)品類似,有信息流和今日熱搜兩個(gè)模塊。
昨天偶然看到一條熱搜是【工資四千月工作300h】,這個(gè)標(biāo)題確實(shí)很吸引人,所以作者打開了這條熱搜想看看詳細(xì)信息,結(jié)果打開的頁(yè)面內(nèi)容是這樣的:
標(biāo)題和內(nèi)容完全對(duì)不上!
原因也簡(jiǎn)單,360AI搜索使用了大模型能力對(duì)輸入的信息進(jìn)行了處理,而不是點(diǎn)擊這條熱搜新聞直接打開一個(gè)鏈接。
按照傳統(tǒng)的搜索引擎的做法一般是把關(guān)鍵詞“月薪4000工作300小時(shí)”匹配到各個(gè)新聞網(wǎng)站,然后用戶打開新聞網(wǎng)站查看詳細(xì)內(nèi)容。
360這里應(yīng)該是只把熱點(diǎn)新聞的標(biāo)題傳給模型處理工作流了,結(jié)果出現(xiàn)了這么個(gè)驢頭不對(duì)馬嘴的結(jié)果。(可能是出于節(jié)約成本的做法,傳標(biāo)題和傳全部正文消耗的token可能是百倍,不過(guò)后續(xù)的測(cè)試好像又推翻了這個(gè)猜測(cè))
這里面的體驗(yàn)問(wèn)題不止一個(gè),挨個(gè)分析一下:
1、新聞信息是否適合用大模型處理后呈現(xiàn)?
用大模型處理新聞信息優(yōu)點(diǎn)非常明顯,能夠在短時(shí)間內(nèi)對(duì)大量新聞內(nèi)容進(jìn)行總結(jié)和提取關(guān)鍵點(diǎn),節(jié)省用戶的時(shí)間。對(duì)企業(yè)來(lái)說(shuō)也能減少對(duì)人工編輯和記者的依賴,降低成本。
但問(wèn)題是:用戶讀新聞時(shí)一定需要節(jié)省時(shí)間嗎?類比一下看網(wǎng)絡(luò)小說(shuō)可能更容易理解,某著名網(wǎng)文凡人修仙傳也可以用一句話總結(jié)出來(lái):韓立(主角)經(jīng)過(guò)千年修行終于渡劫成功飛升仙界,全書完。這里的小說(shuō)完全可以類比具有娛樂(lè)屬性的新聞,不巧的是在所有新聞的被閱讀量占比中,娛樂(lè)新聞遠(yuǎn)多于嚴(yán)肅新聞。
當(dāng)內(nèi)容的細(xì)節(jié)被模型處理后丟失時(shí),內(nèi)容是否還能引起用戶消費(fèi)的興趣是一個(gè)比較重要的問(wèn)題。還以360AI搜索來(lái)說(shuō),處理前后的新聞分別是這樣的:
入口:
處理后:
處理前:
https://www.thepaper.cn/newsDetail_forward_27930855(原文較長(zhǎng),感興趣朋友用這個(gè)鏈接看看,也可以直接看下面的結(jié)論)
以作者閱讀處理前后的新聞的主觀感受來(lái)說(shuō),閱讀原文體驗(yàn)更好,原因大概在于幾點(diǎn):
1)文風(fēng):不同類型的新聞肯定會(huì)使用不同的文風(fēng),這種新聞和政務(wù)新聞和UC震驚部的新聞肯定文風(fēng)都不一樣,但現(xiàn)在的AI搜索產(chǎn)品顯然還沒(méi)有做到根據(jù)不同新聞?lì)愋褪褂貌煌奈娘L(fēng)來(lái)形成最后直面用戶的內(nèi)容,因此文風(fēng)一定程度上影響了閱讀體驗(yàn)。
2)多媒體信息:原文中存在不少動(dòng)圖,有的鏈接中還有視頻,但經(jīng)過(guò)模型處理的新聞只有文字,多種媒體類型的信息對(duì)閱讀的影響很大,在信息協(xié)同接收、情感傳遞、情緒影響等方面都會(huì)影響閱讀體驗(yàn)。
現(xiàn)在有的AI搜索產(chǎn)品已經(jīng)可以做到讀多種媒體信息,但很顯然還沒(méi)有任何一款產(chǎn)品能做到輸出多模態(tài)信息(準(zhǔn)確的說(shuō)是可以但很貴,某視頻生成模型的生成5秒的視頻成本在1.5元左右)。
3)信息與場(chǎng)景的匹配錯(cuò)位:用戶可能是在午休時(shí)間悠閑的刷著網(wǎng)頁(yè),但看到的確實(shí)更偏向工作內(nèi)容的結(jié)構(gòu)化信息,情感投射一下就錯(cuò)位了,這種體驗(yàn)可能用戶講不清楚,但一定會(huì)明確的反應(yīng)在主觀感受上。
現(xiàn)在各家AI搜索產(chǎn)品都以結(jié)構(gòu)化的結(jié)果呈現(xiàn)方式作為賣點(diǎn),但信息的呈現(xiàn)方式一定需要與場(chǎng)景匹配,也并非所有場(chǎng)景用戶的目的都是節(jié)省時(shí)間。
據(jù)說(shuō)360AI搜索已經(jīng)能夠識(shí)別4000種用戶意圖,聽起來(lái)很多,但以其目前覆蓋的用戶量和用戶使用時(shí)涉及到的場(chǎng)景來(lái)說(shuō),依然需要時(shí)間進(jìn)行跨量級(jí)的意圖積累。畢竟讀新聞都可以再細(xì)分成多種意圖~
以上是對(duì)這個(gè)小案例的第一方面體驗(yàn)分析,寫的比較長(zhǎng)可能讀者朋友已經(jīng)忘了問(wèn)題本身,我們把話題拉回來(lái)一下,面對(duì)下圖的這個(gè)問(wèn)題,第2方面的體驗(yàn)問(wèn)題是什么?
2、是輸入信息無(wú)主語(yǔ)時(shí),模型是否應(yīng)該自主添加?
以上面的例子來(lái)說(shuō),用戶想看【工資4000月工作300小時(shí)】的新聞,結(jié)果幫用戶算了一下“您的時(shí)薪是13.33元/小時(shí)”,話說(shuō)這是咋判斷出來(lái)主體是用戶的?這個(gè)【您】字問(wèn)題太大了。
這個(gè)例子只是略微有些負(fù)面體驗(yàn),但萬(wàn)一哪天用戶打開的熱點(diǎn)新聞是“父親去世早全靠母親艱難撫養(yǎng)”怎么辦?到時(shí)候把主體默認(rèn)為用戶那負(fù)面體驗(yàn)可就太嚴(yán)重了。
即使不考慮這種極端的負(fù)面事件,例如“沖進(jìn)火場(chǎng)連救三人”這樣的新聞還是比較常見(jiàn)也比較容易上熱搜的。
長(zhǎng)此以往經(jīng)常被用戶看到主體與事件混亂的問(wèn)題,會(huì)影響用戶對(duì)整個(gè)產(chǎn)品所以提供信息的信任度,這對(duì)搜索產(chǎn)品太致命了。(目前用戶對(duì)AI搜索結(jié)果的信任也是個(gè)重要問(wèn)題,不過(guò)如何構(gòu)建信任這里不展開了,有機(jī)會(huì)再寫吧)
(這個(gè)問(wèn)題其實(shí)也呼應(yīng)第一點(diǎn))
以上是對(duì)360AI搜索的這個(gè)小案例的體驗(yàn)分析,其實(shí)其他AI搜索產(chǎn)品也有類似的問(wèn)題,此處并無(wú)貶低360的意思,據(jù)作者所知360AI搜索的增速、迭代速度都非常牛逼。體驗(yàn)上也遠(yuǎn)超360其他產(chǎn)品…..
因?yàn)樽髡呤亲鲇脩趔w驗(yàn)工作的,所以還是習(xí)慣從體驗(yàn)的角度評(píng)價(jià)產(chǎn)品。
一、為什么AI搜索產(chǎn)品成了共識(shí)
AI類產(chǎn)品這么多,為什么只有AI搜索各個(gè)大廠都在做?
目前在討論AI和產(chǎn)品時(shí),有一個(gè)比較明顯的結(jié)論:AI更多是作為新技術(shù)、新能力參與到產(chǎn)品中,而用戶的需求并未發(fā)生本質(zhì)變化,所以要考慮的是如何用新能力解決為舊需求帶來(lái)新體驗(yàn)。
在接近一年半之前,阿里原CEO張勇就提出:所有應(yīng)用都值得用AI重做一遍,當(dāng)時(shí)作者并未理解其含義,現(xiàn)在看來(lái)其實(shí)也有需求不變,變的是實(shí)現(xiàn)方式的意思在里面。
AI搜索產(chǎn)品能成為共識(shí),尤其是很多大廠的共識(shí),當(dāng)然要從市場(chǎng)規(guī)模 、用戶需求場(chǎng)景數(shù)量、發(fā)展?jié)摿Φ确矫婵紤]。只有這些指標(biāo)都足夠大,才能讓各個(gè)大廠忍不住動(dòng)心下場(chǎng)。
對(duì)于這些下場(chǎng)指標(biāo),看看谷歌、百度、360等公司答案就很明確了,不必多講,本文中作者主要想從用戶體驗(yàn)方面聊聊這個(gè)問(wèn)題。選擇這個(gè)角度的原因也正如上面所說(shuō),用戶需求基本不變時(shí),AI產(chǎn)品能取代傳統(tǒng)產(chǎn)品關(guān)鍵博弈點(diǎn)就是在用戶體驗(yàn)。
按作者的理解:功能只是代碼的結(jié)果,體驗(yàn)才是用戶的結(jié)果,是用戶視角下最直觀的指標(biāo),是用戶很主觀的決定繼續(xù)使用或離開的原因。
下面是AI搜索產(chǎn)品和傳統(tǒng)搜索產(chǎn)品的體驗(yàn)對(duì)比:
要對(duì)比傳統(tǒng)搜索和AI搜索,首先要回到用戶使用搜索產(chǎn)品的目的。
當(dāng)用戶使用時(shí),一定是帶有要解決的問(wèn)題過(guò)來(lái)的(好像是廢話,別急往后看),以完成一份產(chǎn)品分析為例,在傳統(tǒng)搜索產(chǎn)品中完整的鏈條大概是這樣:
根據(jù)用戶意圖復(fù)雜度的不同,一定會(huì)經(jīng)歷上述過(guò)程3-6個(gè)環(huán)節(jié),以及極端情況下無(wú)搜索結(jié)果,問(wèn)題無(wú)法解決的情況。
由于互聯(lián)網(wǎng)行業(yè)多年的蓬勃發(fā)展和積累,以及數(shù)量龐大的用戶參與內(nèi)容建設(shè)的過(guò)程中,無(wú)結(jié)果的情況比較少了,但在一些較垂直的領(lǐng)域依然是對(duì)體驗(yàn)影響較大的問(wèn)題,例如作者經(jīng)常搜索人因工程與交互設(shè)計(jì)交叉領(lǐng)域相關(guān)的問(wèn)題,很多時(shí)候都找不到答案。
就像用戶體驗(yàn)的基礎(chǔ)是能解決問(wèn)題一樣,搜索產(chǎn)品的體驗(yàn)基礎(chǔ)是有答案。
傳統(tǒng)的搜索產(chǎn)品,由于其原理是先收錄千億數(shù)量級(jí)的網(wǎng)頁(yè),當(dāng)用戶搜索時(shí)進(jìn)行匹配,所以只能在有答案的這部分場(chǎng)景下解決問(wèn)題,且只能在上述“需求從產(chǎn)生到解決的過(guò)程”中2-3個(gè)環(huán)節(jié)中發(fā)揮作用。
面對(duì)無(wú)結(jié)果的問(wèn)題,其實(shí)出現(xiàn)了不少優(yōu)秀的解法和產(chǎn)品。例如百度做了提問(wèn)產(chǎn)品,面對(duì)搜索結(jié)果需要用戶二次整合、答案質(zhì)量差等問(wèn)題,也有最佳答案、贊同數(shù)等設(shè)計(jì)。
甚至傳統(tǒng)搜索產(chǎn)品也很清楚自己只能解決上述完整流程中部分環(huán)節(jié),也在向【搜索結(jié)果直接解決問(wèn)題】這個(gè)方向努力,例如在百度中搜索“2024年法定假日”,搜索結(jié)果頁(yè)面的第一條信息就可以直接解決用戶的問(wèn)題:
這種方案已經(jīng)無(wú)需用戶從結(jié)果列表中做選擇再點(diǎn)擊打開,但是這種做法一是需要人工識(shí)別場(chǎng)景做特殊處理,二是只能直接解決簡(jiǎn)單需求。三是與一些廣告和商業(yè)化的場(chǎng)景天然有矛盾(例如搜索優(yōu)酷,可能第一個(gè)結(jié)果“必須”是愛(ài)奇藝),所以整體上對(duì)用戶體驗(yàn)的提升很有限。
AI搜索產(chǎn)品由于其原理是使用預(yù)訓(xùn)練的大模型生成內(nèi)容,所以在無(wú)結(jié)果這部分長(zhǎng)尾需求中體驗(yàn)很好 ,而AI搜索產(chǎn)品最大的優(yōu)勢(shì),則是在解決一個(gè)需求的完整流程中覆蓋了更多環(huán)節(jié),并用AI技術(shù)代替一部分人腦的工作,向All in one方向的體驗(yàn)邁進(jìn)了一步。
詳細(xì)列舉AI搜索產(chǎn)品的體驗(yàn)優(yōu)勢(shì)如下:
1)能夠跨媒體、跨模態(tài)得到信息
跨媒體、跨模態(tài)得到信息意味著答案更準(zhǔn)確、知識(shí)庫(kù)更全面、專業(yè)領(lǐng)域答案效果更好。
舉個(gè)例子,如果我想知道‘XX書店有沒(méi)有座位’,傳統(tǒng)搜索引擎想回到這個(gè)問(wèn)題,幾乎必須依靠人類用戶參與回答才行,但AI搜索如果找到了一張此書店的圖片,則可以使用OCR、ASR技術(shù)去讀圖得到信息,這張圖片可能在傳統(tǒng)搜索時(shí)期就已經(jīng)存在,但當(dāng)時(shí)圖片內(nèi)的信息無(wú)法被利用起來(lái),導(dǎo)致這個(gè)問(wèn)題只能由用戶進(jìn)行回答。這就是跨媒體得到信息輔助答案更準(zhǔn)確的簡(jiǎn)單案例。
在談?wù)揂I產(chǎn)品時(shí),經(jīng)常提到多模態(tài)的概念,作者發(fā)現(xiàn)很多人都把媒體類型和模態(tài)類型搞混了,這里稍微明確一下:
文字、圖片、視頻是不同的媒體類型,這些媒體中包含的信息都可以通過(guò)視覺(jué)模態(tài)由人類接收。
圖片、聲音、味道是不同的模態(tài)類型,其中的信息須通過(guò)視覺(jué)、聽覺(jué)、味覺(jué)等不同模態(tài)由人類接收。
模態(tài)在人機(jī)交互過(guò)程的嚴(yán)格定義是:信息傳遞的通道。
信息能夠在不同的媒體類型和模態(tài)類型之間相互轉(zhuǎn)換的意義體現(xiàn)在搜索過(guò)程的輸入與輸出環(huán)節(jié),也體現(xiàn)在知識(shí)總量的積累上。
例如上面提到的從圖片中獲取信息給予用戶答案的例子,同理的場(chǎng)景也可以是從音頻中得到得到答案提供給用戶,假如某AI搜索產(chǎn)品和喜馬拉雅這樣的音頻產(chǎn)品結(jié)合,就可以在喜馬拉雅龐大的音頻數(shù)據(jù)庫(kù)中得到無(wú)數(shù)專業(yè)領(lǐng)域的信息。
2)覆蓋的需求場(chǎng)景范圍更大
這一點(diǎn)要分兩方面理解,第一方面是普通用戶能使用自然語(yǔ)言描述要搜索的復(fù)雜問(wèn)題了,傳統(tǒng)搜索產(chǎn)品雖然也有高級(jí)模式,但易用性較差、用戶觸達(dá)率極低,如下圖是百度的高級(jí)搜索模式,大家覺(jué)得普通用戶有多少人用過(guò)?
作者自己曾經(jīng)參與的醫(yī)療產(chǎn)品中,也遇到過(guò)需要使用多字段條件判斷+維度關(guān)系+邏輯關(guān)系+多級(jí)括號(hào)來(lái)描述自然語(yǔ)言的例子,只能說(shuō)那個(gè)操作復(fù)雜度即使對(duì)專業(yè)交互設(shè)計(jì)師也非常費(fèi)勁,更別說(shuō)普通用戶了。
第二方面是基于大模型的各種能力,衍生出了新的使用場(chǎng)景,例如在360AI搜索中有大量用戶是使用該產(chǎn)品的生成能力、改寫能力來(lái)解決自己的需求。用戶對(duì)搜索產(chǎn)品的心智在隨著搜索產(chǎn)品能力邊界的擴(kuò)展而發(fā)生變化。
3)解決需求的鏈路變短,復(fù)雜度降低
AI搜索產(chǎn)品可以將多個(gè)網(wǎng)頁(yè)的內(nèi)容聚合、總結(jié)并以結(jié)構(gòu)化的方式呈現(xiàn)出來(lái),這在整體流程中這些環(huán)節(jié)中做到了提效
在這些環(huán)節(jié),AI 顯著的提升了傳統(tǒng)搜索產(chǎn)品中信息分散在各處的問(wèn)題,是AI搜索產(chǎn)品在當(dāng)前階段與傳統(tǒng)搜索產(chǎn)品最大的區(qū)別之一。同時(shí)也在一定程度上減少了廣告的干擾。
未來(lái)各家一定會(huì)在AI搜索產(chǎn)品中加入廣告,具體時(shí)間取決于AI搜索產(chǎn)品的增速,相對(duì)于通用Chatbot,AI搜索產(chǎn)品在輸入輸出環(huán)節(jié)消耗的token更多,同樣輸入一句“產(chǎn)品設(shè)計(jì)原則”,AI搜索產(chǎn)品需要先拿到多個(gè)網(wǎng)頁(yè)的內(nèi)容給到大模型,這個(gè)過(guò)程消耗的token可能是通用Chatbot的上百倍。面對(duì)這樣的成本,商業(yè)化是必然的結(jié)果。
在選擇網(wǎng)站-閱讀-更換網(wǎng)站-閱讀這些環(huán)節(jié)中,AI能力的加入顯著的使整個(gè)解決問(wèn)題過(guò)程的復(fù)雜度降低,用戶不再需要曲折的在各個(gè)網(wǎng)站之間跳轉(zhuǎn)、分辨、總結(jié)。這一點(diǎn)在腦力工作中的體驗(yàn)影響尤其大,能讓用戶更專注的完成工作。作者自己在寫作時(shí)就經(jīng)常因?yàn)橐橐粋€(gè)資料導(dǎo)致寫作思路中斷的問(wèn)題,就是因?yàn)椴橘Y料的過(guò)程曲折又冗長(zhǎng),還得和整整兩屏廣告斗智斗勇。
4)信息呈現(xiàn)方式更多樣化
現(xiàn)在很多AI搜索產(chǎn)品的結(jié)果中都使用了思維導(dǎo)圖來(lái)顯示內(nèi)容結(jié)構(gòu),有些還支持一鍵生成PPT,信息呈現(xiàn)方式的多樣化意味著在上述流程中的【二次加工】環(huán)節(jié)為用戶提供了更多支持。將完整流程中的更多環(huán)節(jié)的工作代替用戶完成了。
未來(lái)可能除思維導(dǎo)圖和PPT之外,常用的流程圖、拓?fù)鋱D、魚骨圖以及各種數(shù)據(jù)展示圖表可能都會(huì)根據(jù)意圖識(shí)別環(huán)節(jié)做出的判斷做匹配,或是支持以當(dāng)前結(jié)果生成不同圖示。
在本文開頭的360案例中也曾經(jīng)提到目前的答案基本是只有文字的,很多原文鏈接中的圖片、動(dòng)圖消失了,這非常影響閱讀體驗(yàn),未來(lái)當(dāng)模型的理解能力繼續(xù)提升后,應(yīng)該也可以根據(jù)意圖和內(nèi)容做交叉判斷選擇保留更多媒體類型的信息。
5)更友好的廣告體驗(yàn)
傳統(tǒng)搜索產(chǎn)品的廣告顯示位置周邊的界面樣式是由第三方網(wǎng)站站長(zhǎng)決定的,所以廣告樣式和內(nèi)容樣式可能存在較大差異,廣告很明顯就能被辨別出來(lái),突兀且生硬。
如下圖是微信公眾號(hào)文章中廣告(樣式不可控),和知乎官方廣告(樣式可控),大家看一下就能感受的到體驗(yàn)的差距。
而AI搜索產(chǎn)品的結(jié)果頁(yè)內(nèi)容是由自家的大模型生成的,內(nèi)容樣式也是自家完全可控可定制的,因此可以與廣告統(tǒng)一視覺(jué)樣式,帶來(lái)更好的轉(zhuǎn)化效果并降低對(duì)用戶的干擾。
6)結(jié)果更準(zhǔn)確、內(nèi)容質(zhì)量更高
這一點(diǎn)可以結(jié)合第1)點(diǎn)理解,傳統(tǒng)的搜索產(chǎn)品由于結(jié)果大部分由第三方網(wǎng)站提供,所以對(duì)內(nèi)容的準(zhǔn)確度無(wú)法控制,對(duì)內(nèi)容的質(zhì)量更加無(wú)法控制。
而AI搜索產(chǎn)品的原理決定了其結(jié)果更準(zhǔn)確,在用戶輸入搜索詞后,首先會(huì)由模型對(duì)問(wèn)題進(jìn)行改寫,例如搜索“2000元以下性能最強(qiáng)手機(jī)”,可能就會(huì)被改寫成“截止2024年7月,中國(guó)境內(nèi)銷售的2000元以下性能最強(qiáng)的手機(jī)”,由系統(tǒng)補(bǔ)全了用戶下意識(shí)知道但沒(méi)有寫明的那部分信息。問(wèn)題描述更準(zhǔn)確了,結(jié)果自然就更準(zhǔn)確了。
第二點(diǎn)原因則是現(xiàn)階段的AI搜索產(chǎn)品的結(jié)果并非單一來(lái)源,一般是經(jīng)過(guò)多個(gè)內(nèi)容來(lái)源聚合、對(duì)比、總結(jié)形成的,并且在選擇內(nèi)容來(lái)源的時(shí)候可能根據(jù)問(wèn)題類型選擇更靠譜的源頭,例如新聞?lì)愋畔⒖梢詠?lái)源于官媒、代碼類問(wèn)題可以來(lái)源于CSDN。(人真的會(huì)下意識(shí)省略那些默認(rèn)雙方都知道的信息,例如這段文字中的“第二點(diǎn)”這幾個(gè)字,其實(shí)我并沒(méi)有說(shuō)過(guò)“第一點(diǎn)”,但并不影響大家理解~)
同時(shí),基于節(jié)省token和反饋速度方面的考慮,并不會(huì)把所有檢索到的結(jié)果(例如10000篇)全部傳遞給模型處理,而是選擇其中的幾個(gè)(例如10篇)作為源信息,那么在選擇這1000中選擇10篇時(shí),可能就會(huì)按照來(lái)源網(wǎng)站、閱讀量、作者、互動(dòng)量、相關(guān)性等指標(biāo)進(jìn)行選擇。
最終從10000篇中篩選出了閱讀量更高、被贊同更多、來(lái)自某幾個(gè)知名專業(yè)人士的文章傳遞給了大模型,所以能夠在篩選過(guò)程中保障AI搜索產(chǎn)品的結(jié)果可能更加準(zhǔn)確、內(nèi)容質(zhì)量更高。
以上6點(diǎn)是AI搜索產(chǎn)品在用戶體驗(yàn)上的優(yōu)勢(shì),下面繼續(xù)聊聊作者猜測(cè)的AI搜索產(chǎn)品未來(lái)的演進(jìn)方向。
二、AI搜索產(chǎn)品的演進(jìn)方向
為了得到更靠譜的結(jié)論,依然從搜索的流程開始分析,傳統(tǒng)搜索產(chǎn)品的流程可以簡(jiǎn)單示意為:
結(jié)合AI后在各個(gè)環(huán)節(jié)可做的事情如下:
1)輸入階段:擴(kuò)充輸入方式
目前傳統(tǒng)搜索引擎基本支持了文字搜索和語(yǔ)音搜索,少數(shù)非廣域搜索產(chǎn)品還支持了以圖片搜索。
這里要注意一點(diǎn)是:作者覺(jué)得單純的使用語(yǔ)音轉(zhuǎn)文字輸入問(wèn)題并不能定義成語(yǔ)音搜索,這樣的做法只是改變了文字的輸入形式,但沒(méi)有改變信息總量,語(yǔ)音模態(tài)信息中的非文字信息沒(méi)有被整合進(jìn)query。
未來(lái)則會(huì)提升已有搜索方式的可用性,如準(zhǔn)確度提升、用時(shí)減少。同時(shí)基于用戶輸入信息做補(bǔ)全、糾錯(cuò)和問(wèn)題推薦(問(wèn)題推薦應(yīng)該已經(jīng)有產(chǎn)品上線了)
再之后可能會(huì)對(duì)這些搜索方式進(jìn)行擴(kuò)充,支持更多的媒體類型,例如動(dòng)圖和視頻,讀取其中的信息形成query。
但這并不酷!對(duì)人機(jī)交互的過(guò)程改變也非常有限,如果想再進(jìn)一步則需要打破固有的思維,為什么搜索一定需要以用戶主體輸入信息呢?
輸入過(guò)程完成可以變手動(dòng)為自動(dòng),或者說(shuō)輸入環(huán)節(jié)可能會(huì)在整個(gè)搜索流程中被透明化。
想一想當(dāng)我們閱讀一篇“super黃的AI文章”時(shí),如果結(jié)合具體用戶的歷史閱讀信息、當(dāng)前的閱讀進(jìn)度,在某個(gè)段落的停留時(shí)長(zhǎng)等信息,就極有可能判斷出用戶對(duì)這個(gè)段落中的某個(gè)名詞含義有些模糊,此時(shí)如果直接將這個(gè)名詞的含義顯示出來(lái)。就做到了輸入階段的透明化(自動(dòng)化)。
當(dāng)然這種階段的產(chǎn)品可能短時(shí)間不會(huì)出現(xiàn),還是需要結(jié)合用戶的一些簡(jiǎn)單行為做判斷,例如豆包中以劃詞搜索作為過(guò)渡方案。
在人機(jī)交互中,一般可以用行為來(lái)判斷意圖,要做到自動(dòng)化的輸入過(guò)程則需要更大量的獲知用戶的環(huán)境信息,例如用戶看到的界面包含什么信息,用戶所處的環(huán)境包含什么信息,同時(shí)結(jié)合大量歷史數(shù)據(jù)、當(dāng)下特征數(shù)據(jù)就一定有可能判斷出用戶想問(wèn)的問(wèn)題。
舉一個(gè)生活中的例子,一個(gè)5歲的小朋友讀課文,遇到了一個(gè)【貔】字,同時(shí)小朋友的聲音停止了,那么一款智能課本產(chǎn)品在得知閱讀進(jìn)度、生僻字字庫(kù)、聲波消失等信息后,非常有可能直接告訴小朋友:這個(gè)字念pi,而不是需要小朋友主動(dòng)詢問(wèn)。這就做到了搜索過(guò)程中輸入環(huán)節(jié)的透明化(或者叫自動(dòng)化/被動(dòng)化)。
在AI技術(shù)的具體應(yīng)用上,意圖識(shí)別是非常重要的一部分能力,而意圖識(shí)別準(zhǔn)確率的前提有一方面是多模態(tài)交互,準(zhǔn)確的說(shuō)是人機(jī)交互過(guò)程中人對(duì)機(jī)的多模態(tài)信息輸入。
信息的來(lái)源和模態(tài)變多了之后總量一定會(huì)變多,那么在已知條件變多后,解題準(zhǔn)確率(產(chǎn)品判斷用戶意圖的準(zhǔn)確率)一定會(huì)提高。
就像人與人對(duì)話中語(yǔ)言文字只占信息總量的一半左右。多模態(tài)交互解決了之前無(wú)法被機(jī)器接收到的那部分信息的問(wèn)題,能從信息源上提升意圖識(shí)別的準(zhǔn)確率。(這是AI搜索后續(xù)直鏈其他服務(wù)的基礎(chǔ))
不過(guò)這還只是把【模態(tài)】限制在了【人類信息通道類型】的范圍內(nèi),對(duì)機(jī)來(lái)說(shuō),可能不是【多模態(tài)】而是【超模態(tài)】,人僅有五感模態(tài),但機(jī)器安裝傳感器器后則可以有更多種信息通道如陀螺儀、GPS、紅外信號(hào)、人類無(wú)法感知到的電磁波、聲波……
所以從底層來(lái)說(shuō)機(jī)的信息通道數(shù)量可以遠(yuǎn)超人,那么解決了中間層的算力和算法之后,意圖識(shí)別準(zhǔn)確率很大概率可以達(dá)到人的水平,變意圖識(shí)別的下一階段就是我們剛剛提到的意圖預(yù)測(cè)(智能課本獲知多個(gè)信息后預(yù)測(cè)了小朋友不會(huì)讀貔這個(gè)字)。
意圖預(yù)測(cè)的意義就非常重要了,它可以變給出反饋為主動(dòng)服務(wù)。這才是對(duì)人機(jī)交互過(guò)程的重要改變。此處作為一名交互設(shè)計(jì)師,真誠(chéng)的點(diǎn)贊榮耀手機(jī)發(fā)布會(huì)中人機(jī)交互那部分內(nèi)容,非常酷!
稍微有點(diǎn)跑題,拉回來(lái):以上這一小段是作者對(duì)AI搜索產(chǎn)品未來(lái)演進(jìn)方向的猜測(cè)。除此之外可能在情感理解和跨多語(yǔ)言方面也會(huì)有更多意義此處就不展開了。下面繼續(xù)說(shuō)查詢階段。
2)查詢階段:結(jié)合其他信息
目前的AI搜索在用戶輸入完成后,一般會(huì)對(duì)問(wèn)題進(jìn)行改寫,使其更精準(zhǔn)或覆蓋更多用戶可能需要的信息,例如把“RAG”改寫成“RAG是什么意思”,甚至改寫成“RAG在AI搜索產(chǎn)品中的具體含義”。
這樣一來(lái)就通過(guò)查詢階段的改寫進(jìn)一步提升的輸入信息量,可以找到更加精準(zhǔn)的信息。
這一點(diǎn)涉及到的技術(shù)問(wèn)題,作者懂得不多,但基于“問(wèn)題描述的越清楚答案就越精準(zhǔn)”這一原理,作者猜測(cè)改寫的進(jìn)一步做法是融合更多信息,而不只是對(duì)用戶在本次使用中輸入信息的修改擴(kuò)展。
融合更多信息指的是融合用戶的個(gè)人信息、過(guò)去查詢過(guò)的問(wèn)題、復(fù)制行為、寫作數(shù)據(jù)等等很多方面的歷史行為數(shù)據(jù),再與用戶本次輸入的信息做融合判斷來(lái)獲取結(jié)果。
其實(shí)在現(xiàn)階段一些內(nèi)容平臺(tái)、電商網(wǎng)站的推薦算法已經(jīng)非常精準(zhǔn)了,往往我們正需要的內(nèi)容/商品都會(huì)被主動(dòng)推薦過(guò)來(lái),這就是因?yàn)檫@些平臺(tái)掌握了大量用戶的數(shù)據(jù)。
而AI搜索產(chǎn)品掌握的用戶數(shù)據(jù)類型和總量可能沒(méi)有電商產(chǎn)品那么多。所以為了提升搜索準(zhǔn)確度,作者猜測(cè)未來(lái)各個(gè)大廠可能會(huì)努力實(shí)現(xiàn)數(shù)據(jù)互通,但僅以當(dāng)下的搜索產(chǎn)品商業(yè)模式來(lái)說(shuō),各個(gè)大廠還沒(méi)有足夠的利益能夠驅(qū)動(dòng)達(dá)成這個(gè)目標(biāo)。
所以作者的觀點(diǎn)是:AI搜索產(chǎn)品的商業(yè)模式和數(shù)據(jù)積累/互通可能會(huì)協(xié)同促進(jìn),如果AI搜索產(chǎn)品的答案中能夠?yàn)橛脩敉扑]更精準(zhǔn)的收費(fèi)服務(wù)/商品,為廣告主帶來(lái)更高的轉(zhuǎn)化和營(yíng)收,則現(xiàn)在的數(shù)據(jù)持有者有可能將掌握的數(shù)據(jù)提供給AI搜索產(chǎn)品。(當(dāng)然也可以是數(shù)據(jù)主擴(kuò)展業(yè)務(wù)自己做個(gè)同類產(chǎn)品)
具體的使用過(guò)程還有很多細(xì)節(jié)需要協(xié)商,例如數(shù)據(jù)是否是直接可見(jiàn)的還是只提供特征等等。
3)輸出階段:擴(kuò)充輸出方式
輸出的方式同樣包括不同的模態(tài)、媒體、形式還有文件類型,目前各個(gè)產(chǎn)品支持腦圖和PPT,未來(lái)應(yīng)該會(huì)支持流程圖、魚骨圖….來(lái)覆蓋更多用戶需求。
用戶voice
同時(shí)對(duì)已支持形式的精細(xì)化改進(jìn)也非常重要,例如目前只支持將答案中的腦圖作為圖片下載,其實(shí)無(wú)法滿足用戶編輯修改的需要,如果能生成xmind源文件或支持在網(wǎng)頁(yè)中對(duì)腦圖進(jìn)行修改也非常有意義。
包括PPT的排版形式、精美程度其實(shí)目前的AI搜索產(chǎn)品都還做的比較弱,如果和Gamma這樣的產(chǎn)品對(duì)比,算是被按在地上摩擦了,即使和國(guó)產(chǎn)的比格PPT相比,也有很大差距。
面對(duì)創(chuàng)作場(chǎng)景,生成與內(nèi)容相關(guān)的配圖也是很需要的能力,在把非常長(zhǎng)的答案內(nèi)容如何分割、提取與圖像相關(guān)的關(guān)鍵詞,以及保證全文中配圖視覺(jué)風(fēng)格一致都是要考慮的問(wèn)題。
以上說(shuō)的是輸出階段支持不同的媒體形式,下面說(shuō)輸出不同模態(tài):
以文字形式輸出和以聲音形式輸出可以滿足不同的使用場(chǎng)景,例如當(dāng)用戶設(shè)備的距離稍大時(shí),視覺(jué)模態(tài)就無(wú)法幫助用戶有效接收信息。
在多任務(wù)場(chǎng)景中也可以使用不同模態(tài)的信息接收通道來(lái)獲得更好的協(xié)同體驗(yàn),使用戶可以把更多精力集中在主任務(wù)。
舉個(gè)例子現(xiàn)在很多人都有使用雙顯示器的需求,主要就是為了解決多任務(wù)協(xié)同的問(wèn)題,這種方式相對(duì)于使用聲音通道進(jìn)行多任務(wù)協(xié)同更適合需要更多時(shí)間理解內(nèi)容的場(chǎng)景,如果只是想獲取一個(gè)簡(jiǎn)單數(shù)據(jù),完全可以用語(yǔ)音操控“小愛(ài)同學(xué),幫我查一下百度2024年?duì)I收數(shù)據(jù)”并以聲音的形式接收直接寫到文章里,避免多界面切換帶來(lái)的割裂感。
再進(jìn)一步,輸出階段還需要考慮到用戶對(duì)信息的儲(chǔ)存和分享等需求,甚至可以做多內(nèi)容關(guān)聯(lián)輔助用戶后期再查找等需求。
按作者的理解,對(duì)信息的儲(chǔ)存最好能與筆記產(chǎn)品關(guān)聯(lián)起來(lái),最好能做到無(wú)縫導(dǎo)入筆記,并與相關(guān)話題產(chǎn)生關(guān)聯(lián)。最簡(jiǎn)單的做法可以是提取相同關(guān)鍵詞形成標(biāo)簽,可以按標(biāo)簽篩選內(nèi)容。
對(duì)于分享的需求則需要考慮分享的渠道、分享的排版精致化、分享時(shí)添加用戶需要的信息(如加入作者的ID、自媒體名稱甚至聯(lián)系方式等等),以減少用戶的二次加工。
4)瀏覽結(jié)果階段:千意千面
這一階段是現(xiàn)在各個(gè)AI搜索產(chǎn)品重點(diǎn)發(fā)力的部分,主要使用大模型的總結(jié)能力和文生圖能力為用戶帶來(lái)更聚合、更清晰、結(jié)構(gòu)化的結(jié)果瀏覽體驗(yàn)。
但也同樣存在問(wèn)題,上面曾經(jīng)*·37-提到閱讀娛樂(lè)新聞的場(chǎng)景就不適合使用結(jié)構(gòu)化、總結(jié)后的信息進(jìn)行展示。
所以作者猜測(cè)當(dāng)未來(lái)的AI搜索模型能夠識(shí)別出更多種、更細(xì)致的用戶場(chǎng)景和意圖后,在界面呈現(xiàn)上會(huì)根據(jù)不同的場(chǎng)景和意圖做出對(duì)應(yīng)的界面樣式。
目前結(jié)構(gòu)化的結(jié)果顯示方式只適合閱讀場(chǎng)景中專業(yè)知識(shí)閱讀的細(xì)分場(chǎng)景,對(duì)于搜索產(chǎn)品來(lái)說(shuō)覆蓋的場(chǎng)景數(shù)量太多了??磩 ⑾螺d文件、尋址等等場(chǎng)景都需要更細(xì)致更個(gè)性化的界面設(shè)計(jì),甚至如尋址這種場(chǎng)景都不需要界面設(shè)計(jì),當(dāng)對(duì)尋址意圖的判斷準(zhǔn)確率夠高之后,完全可以在用戶搜索【優(yōu)酷】時(shí)直接打開該網(wǎng)站。
從這個(gè)角度來(lái)說(shuō),千意千面的面完全可以不限制在頁(yè)面樣式上,包括整體流程都可以根據(jù)意圖做出區(qū)別。屆時(shí)結(jié)合上述其他猜想,可能搜索的流程會(huì)變得面目全非:
如果不從業(yè)務(wù)角度考慮的話,還可以根據(jù)用戶的審美對(duì)頁(yè)面設(shè)計(jì)中的字體、顏色、布局等很多其他視覺(jué)樣式做出個(gè)性化呈現(xiàn)。同樣可以成為體驗(yàn)提升的一部分,但要注意視覺(jué)統(tǒng)一性、品牌性與個(gè)性化之間的平衡。
5)結(jié)果復(fù)用與社區(qū)化
目前AI搜索產(chǎn)品的成本依然較高,按super黃與360負(fù)責(zé)AI業(yè)務(wù)的VP梁先生的博客公開的數(shù)據(jù)是每次搜索在0.2元左右。
粗糙的這個(gè)成本的構(gòu)成視為輸入和輸出階段消耗的token,那么對(duì)于類似的相似度達(dá)到一定標(biāo)準(zhǔn)的問(wèn)題完全可以使用相同的答案。這樣可以降低輸出階段token消耗的成本。
對(duì)于相似但不達(dá)標(biāo)的問(wèn)題,之前已經(jīng)生成的回答依然可以作為信息源參與新問(wèn)題的結(jié)果生成,此時(shí)上一個(gè)問(wèn)題生成的結(jié)果相當(dāng)于把多篇內(nèi)容提煉出與此問(wèn)題匹配度更高的內(nèi)容,可能同樣可以節(jié)省一部分token消耗。
當(dāng)結(jié)果生成后,部分場(chǎng)景有可能用戶會(huì)對(duì)結(jié)果內(nèi)容進(jìn)行再次優(yōu)化,如果此時(shí)能夠引導(dǎo)用戶將自己人工修改后的信息作為公開內(nèi)容,允許被其他用戶訪問(wèn),那么就可以將內(nèi)容沉淀下來(lái),形成內(nèi)容社區(qū),最終把內(nèi)容社區(qū)產(chǎn)品與AI搜索產(chǎn)品融合。
傳統(tǒng)的搜索產(chǎn)品結(jié)果來(lái)源大多是第三方網(wǎng)站,所以搜索產(chǎn)品雖然是整個(gè)互聯(lián)網(wǎng)重要的流量入口,但也只能做做賣流量賣廣告的生意。其原因就是因?yàn)閮?nèi)容不是自己的,商業(yè)鏈路到搜索結(jié)果這一步就停了。
而AI搜索產(chǎn)品如果能將內(nèi)容完成沉淀,形成類似小紅書、知乎這樣的內(nèi)容社區(qū)則對(duì)產(chǎn)品天花板是一次巨大的提升。
簡(jiǎn)單來(lái)講,搜索產(chǎn)品一般是有需求才使用,而內(nèi)容社區(qū)產(chǎn)品則是有事沒(méi)事都可以逛一逛。
例如用戶喜歡看冷笑話,現(xiàn)在這個(gè)時(shí)間常規(guī)的路徑一般是在某內(nèi)容社區(qū)關(guān)注了冷笑話類博主,而不是在百度搜索“冷笑話”。
第二意味著用戶留存。內(nèi)容本身就是消費(fèi)品,更可以在kol與消費(fèi)者之間進(jìn)行連接,兩方面都是留存的關(guān)鍵。其實(shí)內(nèi)容消費(fèi)產(chǎn)品的留存能力也不必多說(shuō),想想抖音和小紅書就知道了~
有些傳統(tǒng)的筆記產(chǎn)品也是這個(gè)思路,希望能把用戶創(chuàng)作的高質(zhì)量筆記授權(quán)后公開顯示,基于大基數(shù)的用戶量形成內(nèi)容社區(qū),為筆記類產(chǎn)品突破天花板,變工具型產(chǎn)品為社區(qū)型產(chǎn)品。例如印象筆記就有源于筆記產(chǎn)品內(nèi)容板塊的獨(dú)立的【識(shí)堂】產(chǎn)品。
對(duì)AI搜索產(chǎn)品來(lái)說(shuō),由于其創(chuàng)作內(nèi)容更簡(jiǎn)單,在內(nèi)容全面性和大眾領(lǐng)域的內(nèi)容質(zhì)量也能達(dá)到一定標(biāo)準(zhǔn),所以想按這個(gè)思路發(fā)展是更有機(jī)會(huì)的,最重要的是可以把自家消耗大量算力產(chǎn)出的內(nèi)容沉淀下來(lái),產(chǎn)生2次-N次被消費(fèi)的價(jià)值。
通觀全篇,其實(shí)會(huì)發(fā)現(xiàn)數(shù)據(jù)的價(jià)值體現(xiàn)在AI搜索產(chǎn)品的各個(gè)環(huán)節(jié),輸入環(huán)節(jié)可以結(jié)合用戶個(gè)性化數(shù)據(jù)把問(wèn)題改寫的更清楚準(zhǔn)確,匹配環(huán)節(jié)可以找到更多信息源,輸出環(huán)節(jié)決定了答案準(zhǔn)確度和內(nèi)容質(zhì)量,搜索后服務(wù)環(huán)節(jié)甚至可以有突破搜索產(chǎn)品天花板的機(jī)會(huì)。
由此可見(jiàn)數(shù)據(jù)是AI搜索產(chǎn)品(甚至所有AI產(chǎn)品)的最重要競(jìng)爭(zhēng)壁壘之二,另一方面毫無(wú)疑問(wèn)是模型能力。
形成社區(qū)/搜索融合形態(tài)的產(chǎn)品后,更重要的意義是商業(yè)方面實(shí)現(xiàn)更多模式的收入構(gòu)成,對(duì)于自家不涉及的業(yè)務(wù)依然可以像傳統(tǒng)搜索產(chǎn)品那樣出售流量變現(xiàn),對(duì)于自家涉及的業(yè)務(wù),完全可以變賣流量為賣產(chǎn)品,拿到更多利潤(rùn)。
從這一點(diǎn)來(lái)說(shuō),AI搜索產(chǎn)品對(duì)規(guī)模越大、涉及業(yè)務(wù)越多的公司重要程度就會(huì)越高。再加上新一代流量入口的屬性,作者認(rèn)為AI搜索產(chǎn)品是大廠必爭(zhēng)之地。
6)從搜索產(chǎn)品到全部產(chǎn)品
上面的5點(diǎn)我們討論的基本是AI搜索作為獨(dú)立搜索產(chǎn)品的演進(jìn)猜測(cè),但搜索+AI的能力其實(shí)可以體現(xiàn)在任何需要搜索功能的產(chǎn)品中。
如筆記產(chǎn)品,用戶積累了10年的筆記內(nèi)容在查找和關(guān)聯(lián)時(shí)都是比較困難的問(wèn)題,在相關(guān)內(nèi)容聚合方面也非常需要AI能力。如果把AI能力加入之后可以實(shí)現(xiàn)更精準(zhǔn)的搜索、模糊搜索、基于筆記內(nèi)容的問(wèn)答等等。
同樣的,對(duì)電商產(chǎn)品的搜索過(guò)程,基于對(duì)搜索關(guān)鍵詞的改寫可以做到更精準(zhǔn)的商品匹配,于公司而言可以在企業(yè)級(jí)知識(shí)管理產(chǎn)品中發(fā)揮作用,對(duì)特定行業(yè)可以做科研文獻(xiàn)快速查找。
因此作者認(rèn)為,廣義的AI搜索產(chǎn)品可能不是獨(dú)立產(chǎn)品,而是在眾多類型產(chǎn)品的查找場(chǎng)景中發(fā)揮作用。
搜素的本質(zhì)是人的信息需求,而AI搜索的未來(lái)形態(tài)會(huì)分成兩種主要場(chǎng)景:
一種是基于已有直接可用信息的匹配,另一種主要場(chǎng)景是基于非直接可用內(nèi)容的聚合+生成。
三、AI搜索產(chǎn)品的核心體驗(yàn)
嘮叨了這么多,其實(shí)AI搜索產(chǎn)品的核心體驗(yàn)已經(jīng)很清晰了,按照用戶路徑的順序來(lái)說(shuō)依次是:
輸入體驗(yàn)、反饋速度、結(jié)果質(zhì)量、接收體驗(yàn)、搜索后服務(wù),下面依次詳細(xì)介紹其影響因素:
1)輸入體驗(yàn)
輸入體驗(yàn),首先指支持輸入的媒體/文件類型,文字、圖片、音頻、視頻、動(dòng)圖、文檔、鏈接….支持的類型越多則用戶的操作自由度越高、能覆蓋的場(chǎng)景越多,還可以減少輸入限制導(dǎo)致的用戶手動(dòng)轉(zhuǎn)換格式的成本,所以支持輸入的媒體/文件類型越多體驗(yàn)一定越好。
輸入體驗(yàn)的第二方面是非文字信息理解能力,例如的當(dāng)用戶使用語(yǔ)音方式搜索時(shí)是否能從語(yǔ)速、音量、停頓等其他方面獲取更多信息,使這些信息與語(yǔ)音轉(zhuǎn)化成文字的信息融合起來(lái)形成更準(zhǔn)確的輸入Query。
第三方面是問(wèn)題轉(zhuǎn)寫能力,同樣影響著輸入Query質(zhì)量,例如用戶輸入的是“12400f和12490f相比”被轉(zhuǎn)寫為“對(duì)比12400f和12490f兩個(gè)CPU,兩者在性能和功耗、游戲體驗(yàn)等方面相比哪個(gè)好”其實(shí)可以更完善的描述問(wèn)題并更多更準(zhǔn)確的答案。輸入體驗(yàn)并非指用戶輸入的體驗(yàn),而是指從用戶輸入直到將query信息輸入到模型這一過(guò)程的整體影響。
2)反饋速度
反饋速度由索引庫(kù)、模型效率、算力、服務(wù)器性能、網(wǎng)速、需要反饋給用戶的數(shù)據(jù)量等指標(biāo)決定。
索引庫(kù)是一個(gè)包含產(chǎn)品信息的數(shù)據(jù)庫(kù),其特殊的數(shù)據(jù)結(jié)構(gòu)可以提升查詢效率,使查詢過(guò)程不需要掃描整個(gè)數(shù)據(jù)就能找到相關(guān)結(jié)果,對(duì)于復(fù)雜條件的查詢,也能做到更高效的完成。因此索引庫(kù)效率越高反饋時(shí)間越短。
模型效率則在輸出環(huán)節(jié)決定了結(jié)果內(nèi)存的生成速度,不同模型生成內(nèi)容的速度可能有明顯的快慢之分,因此模型效率同樣影響反饋速度。反饋速度越快則用戶能得到結(jié)果信息越快,體驗(yàn)越好。
算力(用戶可用部分)直接影響了生成速度,算力在不同時(shí)間的需求量會(huì)有明顯差距,例如工作時(shí)間的需求量一定大于夜晚時(shí)段,在需求峰時(shí)可考慮結(jié)合收費(fèi)方式為付費(fèi)用戶帶來(lái)更好的體驗(yàn),或采用其他對(duì)企業(yè)有益的用戶引導(dǎo)給與用戶優(yōu)先使用權(quán),kimichat在幾個(gè)月前就試水了打賞機(jī)制讓付費(fèi)用戶在高峰時(shí)段能優(yōu)先使用算力。
對(duì)于閑時(shí)算力,同樣可以預(yù)先生成用戶可能需要的內(nèi)容或一些長(zhǎng)尾問(wèn)題,當(dāng)用需要時(shí)直接顯示處理,以提高反饋速度。
同樣的服務(wù)器性能、網(wǎng)速也會(huì)事實(shí)上對(duì)反饋速度有較大影響,但兩個(gè)方面也適用于傳統(tǒng)搜索產(chǎn)品,非AI搜索產(chǎn)品獨(dú)有的體驗(yàn)影響因素。
需要反饋給用戶的數(shù)據(jù)量這一指標(biāo)是作者認(rèn)為需要優(yōu)化的重點(diǎn),例如當(dāng)用戶搜索【喬布斯在哪一年創(chuàng)立了蘋果公司】,可能用戶只是需要一個(gè)具體的年份信息,而不需要非常多的長(zhǎng)篇大論,把蘋果公司和喬布斯的各種信息全部輸出一遍對(duì)用戶來(lái)說(shuō)可能是沒(méi)有意義的信息。輸出這些信息的過(guò)程中既消耗了token增加了成本又影響力反饋速度。
某些場(chǎng)景下甚至可以沒(méi)有輸出信息,例如尋址場(chǎng)景用戶的最終目的就是打開一個(gè)網(wǎng)站,那么沒(méi)有搜索結(jié)果頁(yè)面直接打開某網(wǎng)站是既低成本又短路徑的優(yōu)秀體驗(yàn)。
3)結(jié)果質(zhì)量
結(jié)果質(zhì)量由索引庫(kù)數(shù)據(jù)量、信息源選擇規(guī)則、信息源總量、模型質(zhì)量、輸入query信息量、問(wèn)題理解準(zhǔn)確度等指標(biāo)決定。
索引庫(kù)數(shù)據(jù)量越大,則匹配過(guò)程能找到回答用戶問(wèn)題的信息總量就越多,就涵蓋更多用戶所需的答案。
信息源選擇規(guī)則影響了用于傳遞給模型的信息質(zhì)量,面對(duì)同樣的問(wèn)題,如果選擇了百度問(wèn)答中的答案作為信息源頭或使用知乎作為信息源頭對(duì)結(jié)果質(zhì)量的影響可想而知。
當(dāng)然信息源選擇并非簡(jiǎn)單選擇從百度獲取信息還是從知乎獲取信息,一般來(lái)說(shuō)對(duì)于專業(yè)領(lǐng)域的問(wèn)題可以從各種垂直網(wǎng)站獲取專業(yè)信息質(zhì)量更好。對(duì)于普通問(wèn)題,則可能會(huì)從內(nèi)容的相關(guān)性、瀏覽量、作者身份、內(nèi)容互動(dòng)量、內(nèi)容發(fā)布時(shí)間…等很多維度的指標(biāo)進(jìn)行選擇,總體原則就是希望通過(guò)各種直接的或間接的指標(biāo)抽象判斷出內(nèi)容質(zhì)量,將內(nèi)容質(zhì)量較好的一部分文章傳遞給模型進(jìn)行總結(jié)和結(jié)構(gòu)化加工。那么很容易理解信息源選擇規(guī)則越合理結(jié)果質(zhì)量越好、用戶體驗(yàn)越好。
模型質(zhì)量則在答案信息傳遞進(jìn)模型后發(fā)揮作用,面對(duì)同樣的輸入信息各家的模型生成的答案可能會(huì)有很大不同,此時(shí)自然是模型質(zhì)量越高結(jié)果質(zhì)量越高、體驗(yàn)越好。
同時(shí)模型質(zhì)量的一部分指的是對(duì)自然語(yǔ)言的理解能力,面對(duì)用戶輸入的問(wèn)題能否做到準(zhǔn)確理解含義,明白用戶需要的是什么,此處不得不再提一下360AI搜索,當(dāng)我搜索“老虎圖片”的時(shí)候,居然不能直接定位到圖片結(jié)果,而是給我顯示了這樣的結(jié)果頁(yè)面:
首先頁(yè)面主題居然用文字給我描述了兩個(gè)圖片,然后給我推薦了老虎的其他相關(guān)信息,同時(shí)右上角的引導(dǎo)我點(diǎn)了十幾秒還是關(guān)不掉,體驗(yàn)糟透了。
對(duì)問(wèn)題的準(zhǔn)確理解影響了后續(xù)流程如何推進(jìn),再舉個(gè)簡(jiǎn)單的例子,當(dāng)我輸入“優(yōu)酷”的時(shí)候,是應(yīng)該給我介紹一下優(yōu)酷公司的信息還是應(yīng)該直接給一個(gè)跳轉(zhuǎn)鏈接?
輸入query信息量是被模型處理前的信息量,此信息量越大一般結(jié)果質(zhì)量會(huì)越好,但會(huì)存在一個(gè)臨界值,超過(guò)此臨界值后信息量的增加對(duì)結(jié)果質(zhì)量?jī)?yōu)化將變得很有限,同時(shí)考慮到輸入類token的成本問(wèn)題、模型處理所需時(shí)間問(wèn)題,也不能將所有相關(guān)信息全部輸入給模型。需要界定一個(gè)合理數(shù)值,這也印證了數(shù)據(jù)源選擇規(guī)則的重要性。
4)接收體驗(yàn)
接收體驗(yàn)由可輸出的媒體/模態(tài)/格式類型、UI界面、二次加工時(shí)間、廣告體驗(yàn)等指標(biāo)決定。
可輸出的媒體類型和格式越多對(duì)用戶需求的覆蓋度越廣,屬于有和沒(méi)有的區(qū)別,省去了用戶二次轉(zhuǎn)換的時(shí)間,這方面的體驗(yàn)的影響不必廢話。
可輸出的模態(tài)則略有不同,例如在駕車場(chǎng)景中,一定是以聲音模態(tài)輸出更符合該場(chǎng)景下用戶能接受的方式。在辦公室場(chǎng)景中則視覺(jué)模態(tài)更好。
所以支持不同模態(tài)的輸出一是匹配不同場(chǎng)景用戶適合接收信息的方式,二是多模態(tài)協(xié)同可以進(jìn)一步提升信息傳遞的效率。
視覺(jué)模態(tài)接收信息的效率可以是聽覺(jué)的百倍以上,但聽覺(jué)模態(tài)具有被動(dòng)性、注意力敏感性、環(huán)繞性等特點(diǎn)。
被動(dòng)性指信息可以被動(dòng)的由人進(jìn)行接收,相比于視覺(jué)信息更不易被遺漏,注意力敏感性指聲音的變化能更快速的被用戶感知,環(huán)繞性指信息來(lái)源的位置可以由人周邊360°發(fā)起,都可以被人接收到。
基于視覺(jué)模態(tài)和聽覺(jué)模態(tài)的不同特點(diǎn),多模態(tài)融合的方式可以各取其所長(zhǎng),幫助用戶同時(shí)處理多任務(wù)及各種場(chǎng)景下更輕松的接收信息。(多模態(tài)交互涉及的內(nèi)容極多,可能需要另一篇萬(wàn)字長(zhǎng)文才能完全解釋清楚,這里不多展開了)
上面略微展開了一下信息以不同模態(tài)的特點(diǎn),下面繼續(xù)說(shuō)UI界面對(duì)接收體驗(yàn)的影響。
UI界面是發(fā)展時(shí)間最長(zhǎng),被研究最深入的視覺(jué)通道信息傳遞方式,而視覺(jué)通道是人類90%以上接收信息的方式,因此單獨(dú)把UI界面作為影響接收體驗(yàn)的因素之一。
廣義的UI設(shè)計(jì)包括排版、文字、圖形、動(dòng)效、交互方式及其二級(jí)屬性,由于人類從外界獲取信息最主要的途徑就是視覺(jué)模態(tài),所以UI界面是接收體驗(yàn)中非常重要的一部分。
排版的方式?jīng)Q定了用戶獲取信息的先后順序、視覺(jué)壓力,文字的字體決定了獲取信息的難易程度(如草書和楷書)和美觀的感受,圖形可以更直觀的表達(dá)信息并附帶情感,動(dòng)效可以引導(dǎo)用戶的注意力使視覺(jué)焦點(diǎn)始終位于目標(biāo)信息,交互方式可以讓用戶更自然的得到隱藏信息、多環(huán)節(jié)信息。
舉個(gè)例子如token生成速度對(duì)UI界面的影響,現(xiàn)在很多Chatbot的生成答案時(shí)都是一個(gè)token一個(gè)token顯示到用戶界面上的,這種方式造成了很強(qiáng)烈的動(dòng)態(tài)效果,會(huì)對(duì)用戶注意有嚴(yán)重干擾,影響信息接收效率。
目前token生成速度的價(jià)格差異主要體現(xiàn)在廠商定價(jià)階段,作者查了一下沒(méi)看到根據(jù)生成速度定價(jià)的廠商,從反饋速度的體驗(yàn)來(lái)說(shuō),一定是結(jié)果生成的越快越好,但可以稍微控制一下顯示到界面上的間隔時(shí)間。
一般首次等待時(shí)間在2秒內(nèi)不會(huì)造成用戶流失,后續(xù)可以考慮生成一段內(nèi)容后一次性顯示到界面上,避免界面頻繁變化。(想一想垃圾網(wǎng)站上不停跳動(dòng)的小廣告應(yīng)該可以感受到類似的體驗(yàn)~)
二次加工時(shí)間則受到前面講過(guò)的可輸出的媒體/模態(tài)/格式類型、結(jié)果質(zhì)量等因素影響,用戶難免遇到搜索結(jié)果無(wú)法直接在其他場(chǎng)景(如各種匯報(bào))中使用的情況,此時(shí)對(duì)內(nèi)容的二次加工時(shí)間非常影響體驗(yàn)。
例如對(duì)思維導(dǎo)圖的編輯是可在線編輯還是需下載后編輯,對(duì)生成的圖片能否局部修改等等,二次加工所需時(shí)間越長(zhǎng)則體驗(yàn)越差。
廣告體驗(yàn)則是繞不過(guò)去的話題,AI搜索產(chǎn)品必定需要進(jìn)行商業(yè)化以覆蓋成本,前文中曾提到過(guò)視覺(jué)樣式對(duì)廣告體驗(yàn)的影響,如下圖:
除視覺(jué)樣式外,廣告內(nèi)容能否與用戶屬性匹配同樣重要,當(dāng)廣告內(nèi)容恰巧是用戶所需內(nèi)容,并與用戶的消費(fèi)能力相符時(shí),甚至可以實(shí)現(xiàn)整體正向的廣告體驗(yàn)。
如果整體生態(tài)、合作廣告主規(guī)模足夠大,將廣告內(nèi)容無(wú)形融合到答案內(nèi)容將會(huì)是未來(lái)廣告形態(tài)的重要變化。
現(xiàn)階段基于關(guān)鍵詞的廣告最大的體驗(yàn)問(wèn)題是非用戶所需,即用戶需要的東西與廣告推薦的東西不匹配,導(dǎo)致了廣告信息影響了用戶找到、閱讀正確的目標(biāo)信息。
如果用戶搜索的目標(biāo)是“AI課程”,那么即使出現(xiàn)賣課的廣告也不會(huì)影響用戶體驗(yàn),因?yàn)檫@正是用戶所需的。如果再能夠保證課程質(zhì)量(廣告對(duì)應(yīng)的商品質(zhì)量)則體驗(yàn)更佳。而保證廣告對(duì)應(yīng)的商品質(zhì)量的基礎(chǔ)就是上方提到的各作廣告主規(guī)模足夠大,有篩選的基礎(chǔ)。
5)搜索后服務(wù)
搜索后服務(wù)的體驗(yàn)由服務(wù)范圍、搜索-服務(wù)融合度、服務(wù)-意圖匹配度、服務(wù)路徑長(zhǎng)度、信息記憶、廣告體驗(yàn)等指標(biāo)決定。
服務(wù)范圍指搜索到相關(guān)信息后,能否接近一站式的繼續(xù)解決需求,例如搜索北京旅行攻略,能繼續(xù)預(yù)定去北京的機(jī)票/酒店/旅行團(tuán)。搜索iphone15能在結(jié)果頁(yè)中馬上下單購(gòu)買。
這方面的體驗(yàn)與前文中提過(guò)的數(shù)據(jù)互通、AI搜索產(chǎn)品融合等話題相關(guān),顯而易見(jiàn)的是AI搜索后服務(wù)能提供的服務(wù)范圍越大,則路徑越短、操作越簡(jiǎn)、體驗(yàn)越好。
在搜索后服務(wù)的流程中,傳統(tǒng)方式是在各個(gè)大廠的平臺(tái)切換,用戶路徑較長(zhǎng)并且需要在不同產(chǎn)品中多次輸入賬號(hào)/密碼/地址….等很多信息,操作復(fù)雜度很高還有詐騙風(fēng)險(xiǎn)。
AI搜索產(chǎn)品如果能融合其他業(yè)務(wù),則可以更接近一站式的完整解決需求,而不是將需求分解到多個(gè)公司的多個(gè)產(chǎn)品中完成。如旅行場(chǎng)景就可以把搜索攻略與機(jī)/酒/團(tuán)等需求一次性解決。這就是搜索-服務(wù)融合度的意義。
而服務(wù)-意圖匹配度則還是強(qiáng)調(diào)的意圖識(shí)別準(zhǔn)確率的問(wèn)題,當(dāng)某大廠覆蓋的業(yè)務(wù)范圍極廣,那么能否把各業(yè)務(wù)與用戶搜索的意圖精準(zhǔn)對(duì)應(yīng)就成了影響商業(yè)轉(zhuǎn)化和體驗(yàn)的重要因素。
服務(wù)路徑長(zhǎng)度上面也舉過(guò)例子,當(dāng)用戶的目的是打開一個(gè)網(wǎng)站,那么沒(méi)有搜索結(jié)果頁(yè)面直接打開某網(wǎng)站是既低成本又短路徑的優(yōu)秀體驗(yàn)。沒(méi)有必要非給用戶一個(gè)結(jié)果頁(yè)面上面有個(gè)網(wǎng)站入口,還需要再點(diǎn)擊一次。不過(guò)這個(gè)具體場(chǎng)景可能會(huì)影響廣告曝光量,實(shí)際環(huán)境中需要再仔細(xì)考慮。
廣告體驗(yàn)同樣也在前文中提到過(guò)都不再多說(shuō)。
—-總結(jié)分割線—-
本文內(nèi)容由3個(gè)大主題構(gòu)成:
1、為什么AI搜索產(chǎn)品成了共識(shí)
2、AI搜索產(chǎn)品的演進(jìn)方向猜測(cè)
3、AI搜索產(chǎn)品的核心體驗(yàn)及影響因素
其實(shí)目前大多數(shù)Chatbot和其他AI類產(chǎn)品出現(xiàn)時(shí)間都非常短,很多用戶體驗(yàn)方面的問(wèn)題也來(lái)不及做的很細(xì),大多數(shù)公司依然在關(guān)注模型層面的技術(shù)問(wèn)題。
但作者一直認(rèn)為在用戶視角下其實(shí)并不關(guān)心模型層面的技術(shù)問(wèn)題,更直接與用戶接觸的是體驗(yàn),體驗(yàn)是用戶使用產(chǎn)品后在極短時(shí)間內(nèi)、極主觀決定是否繼續(xù)使用這一產(chǎn)品的決定性因素。
因此作者更關(guān)注AI產(chǎn)品體驗(yàn)方面的問(wèn)題,未來(lái)也將輸出更多AI產(chǎn)品體驗(yàn)的案例與大家分享,感謝的朋友圈可以關(guān)注下面的公眾號(hào)到時(shí)收看或加作者微信直接討論~
本文參考了:
1、super黃老哥的文章《雙10億:AI重塑搜索 | 一文看懂AI搜索現(xiàn)狀和未來(lái)》
2、橘子汽水鋪的文章《AI 搜索,一次講透》
專欄作家
杜昭,微信公眾號(hào):AI與用戶體驗(yàn),人人都是產(chǎn)品經(jīng)理專欄作者,實(shí)戰(zhàn)派設(shè)計(jì)師,目前在某手機(jī)公司負(fù)責(zé)手機(jī)OS交互設(shè)計(jì),所負(fù)責(zé)產(chǎn)品覆蓋用戶數(shù)億,主要研究AI與人機(jī)交互設(shè)計(jì)的融合及人因?qū)W對(duì)用戶體驗(yàn)的影響。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Pixabay,基于 CC0 協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!