十問(wèn)AI搜索
在人工智能的浪潮中,AI搜索技術(shù)正迅速發(fā)展,成為信息檢索領(lǐng)域的新熱點(diǎn)。本文探討了AI搜索的多個(gè)關(guān)鍵問(wèn)題,包括數(shù)據(jù)壁壘、索引庫(kù)的重要性、垂直搜索的機(jī)遇與挑戰(zhàn),以及用戶習(xí)慣對(duì)AI搜索的影響等。文章還對(duì)模型微調(diào)的必要性、AI搜索與Agent結(jié)合的趨勢(shì)、AI搜索生成內(nèi)容的潛力,以及AI SEO的未來(lái)進(jìn)行了深入分析。
一、AI搜索最大的壁壘在數(shù)據(jù)?
閉門會(huì)有一個(gè)小伙伴在某大廠做搜索,給出的洞察是:
沒(méi)有數(shù)據(jù)的話都是白扯!
后面在和胡寧交流的時(shí)候,她也明確指出了這一點(diǎn)。
否則外殼做得再好、交互做的再好,用戶一問(wèn),出來(lái)的內(nèi)容渣渣!
這也是內(nèi)容型產(chǎn)品做自己AI搜索的巨大優(yōu)勢(shì):微信讀書(shū)的AI問(wèn)書(shū)、知乎&抖音&小紅書(shū)等產(chǎn)品的AI搜索、騰訊元寶整合了公眾號(hào)的數(shù)據(jù)。
我最近使用了小紅書(shū)的達(dá)芬奇AI搜索,效果出奇的驚人:
為什么呢?小紅書(shū)在旅游、美食、美妝、寵物、健身等等品類上,有全網(wǎng)最優(yōu)質(zhì)的內(nèi)容,只要在它優(yōu)質(zhì)內(nèi)容的垂域里搜索,自然也最容易得到優(yōu)質(zhì)的答案!
當(dāng)然這也帶來(lái)了國(guó)內(nèi)過(guò)去這么多年百度逐漸沒(méi)落的老問(wèn)題:數(shù)據(jù)被分散在各個(gè)App內(nèi)。
二、索引庫(kù)必備么?
結(jié)論:做通用AI搜索不必,但垂直搜索必備!
很多AI搜索依賴Google或者Bing的API來(lái)獲得檢索結(jié)果,為何呢?
這是因?yàn)镚oogle和Bing自建了非常強(qiáng)大的搜索引擎,其中包含了強(qiáng)大的索引庫(kù),可以較好的保證搜索結(jié)果的質(zhì)量,以及提供了不錯(cuò)的排序。
此時(shí)依靠這些傳統(tǒng)搜索引擎,已經(jīng)能解決95%的問(wèn)題了!
(以上是公眾號(hào) 艾逗筆 在《我做了一個(gè)AI搜索引擎》一文內(nèi)的流程圖,在信息源檢索下面我加了兩個(gè)小方框)
從上圖來(lái)看,自檢索引庫(kù)的關(guān)鍵在于要能提供比Google和Bing返回的結(jié)果更優(yōu)的內(nèi)容!想要做到,那就需要付出極大的成本和時(shí)間。
所以上面的結(jié)論就是如果你要做通用AI搜索,就別考慮自建索引庫(kù)了,不管是資源的消耗還是時(shí)間的投入,都極其困難??康谌教峁┑腁PI快速的把商業(yè)模式跑通,可能才是王道。
當(dāng)然這是大多數(shù)人不看好創(chuàng)業(yè)公司做通用AI搜索的一個(gè)主要原因。
那垂直搜索呢?這里進(jìn)行到第二點(diǎn):優(yōu)質(zhì)索引庫(kù)!
索引庫(kù)分很多種,剛才說(shuō)的是一個(gè)最大的索引庫(kù),要在里面去撈到合適的內(nèi)容,其實(shí)效率還是比較低的。可以在這個(gè)大庫(kù)上面再整一個(gè)優(yōu)質(zhì)索引庫(kù),里面存著更優(yōu)質(zhì)、更權(quán)威的內(nèi)容,這樣的優(yōu)質(zhì)索引庫(kù)對(duì)于垂直AI搜索就會(huì)很有幫助。
因?yàn)榍懊娴谝徽鹿?jié)也說(shuō)了,AI搜索最大的關(guān)鍵點(diǎn)是數(shù)據(jù)!你知道這個(gè)垂直品類的優(yōu)質(zhì)內(nèi)容和信息或者數(shù)據(jù)在哪里的話,是不是就能讓AI搜索的結(jié)果質(zhì)量更高了?
這是為何Perplexity在一開(kāi)始從Academic啟動(dòng),也是錨定垂類也方便去提前構(gòu)建垂直索引庫(kù),保證初始的AI搜索效果非常優(yōu)質(zhì)。
打個(gè)比喻來(lái)幫助大家理解索引庫(kù)是否必備:
我們?cè)O(shè)想一個(gè)各種菜系都提供的餐館,思考一下,你增加了一個(gè)菜品的供貨渠道,能讓餐館有更多客人嗎?這個(gè)就離得有點(diǎn)遠(yuǎn)了。
但如果你只做大阪和牛,找到了一個(gè)精品貨源,對(duì)于用戶的口碑可能就會(huì)有很大的幫助。
三、垂類更方便于AI搜索初創(chuàng)公司切入?
結(jié)合前兩點(diǎn),我們可以發(fā)現(xiàn),不管是數(shù)據(jù),還是索引庫(kù),給到創(chuàng)業(yè)者的選擇都是先從垂直切入會(huì)是更好的一種方式。
toC層面有兩點(diǎn):有利于用戶口碑和心智的建立;垂類更好整合進(jìn)用戶的工作流。
秘塔之所以被口口相傳,也是科技工作者,或者學(xué)生,查詢資料時(shí),可以快速獲得海量的結(jié)構(gòu)化信息,相信秘塔本身索引庫(kù)也會(huì)在這些用戶群體關(guān)注的內(nèi)容品類上做更多覆蓋,提高AI生成的內(nèi)容質(zhì)量。
前陣子秘塔又上線了播客搜索,這也是秘塔的用戶群體喜聞樂(lè)見(jiàn)的:
Repotify則更加具體,聚焦在財(cái)報(bào)研報(bào)等投融資用戶的需求方向上:
有時(shí)我自己查詢一些企業(yè)的財(cái)報(bào)、電話會(huì)信息,也會(huì)打開(kāi)使用。
再比如Devv,可以指定信息源,連接到指定的Github倉(cāng)庫(kù)來(lái)進(jìn)行搜索:
這種深入就是心智的建立:知道這款A(yù)I搜索產(chǎn)品能解決自己的問(wèn)題!
對(duì)應(yīng)的,垂直AI搜索也知道很多信息源在哪里,包括還有一些獨(dú)到的用戶需求能夠更好地滿足。
四、用戶習(xí)慣的慣性對(duì)于AI搜索的意義?
結(jié)論:非常重要!
上圖是夸克瀏覽器最近全面更新的AI搜索。
如果你是夸克的用戶,會(huì)不會(huì)天然的就體驗(yàn)到了AI搜索呢?
我們?cè)O(shè)想一下,即使是過(guò)去百度最鼎盛的時(shí)期,依然有大量的用戶不會(huì)去用它,為什么?還有其他的產(chǎn)品會(huì)占據(jù)用戶的習(xí)慣呀,比如說(shuō)搜狗和360的三級(jí)火箭里面,就會(huì)用瀏覽器來(lái)滿足用戶的搜索需求,你百度做的比Google更好也不可能搶走那批用戶。
通用AI搜索很難做的一點(diǎn)是,用戶習(xí)慣很難遷移,他用慣了夸克瀏覽器,就會(huì)繼續(xù)用夸克的AI搜索,并且各家大廠包括Google都已經(jīng)很堅(jiān)決的推進(jìn)AI搜索的情況下,你很難做的遠(yuǎn)超出Google去讓用戶轉(zhuǎn)過(guò)來(lái)用你的,或者說(shuō),在Google全量上AI搜索之前,只會(huì)留出很短的時(shí)間窗口。
五、模型微調(diào)是必備的么?
結(jié)論:當(dāng)前階段非常有價(jià)值!
搜索是一個(gè)用戶需求很泛化的場(chǎng)景,用戶會(huì)問(wèn)各種各樣的問(wèn)題,比如說(shuō):
黃河有多長(zhǎng)?這種問(wèn)題簡(jiǎn)短回答就行了
怎么哄小孩睡覺(jué)?這種問(wèn)題可能需要給你個(gè)手把手的教程
所以搜索依賴的大模型能力需要在不同分支下,具備不同的回答能力。
360AI搜索已經(jīng)把query的意圖識(shí)別分類做到了4000多種,每一種需求配對(duì)應(yīng)的Prompt。工作做得已經(jīng)相當(dāng)精細(xì)了,但梁志輝告訴我,這仍然只是很粗顆粒度的匹配。
你會(huì)好奇的是,為何360要做這么多Prompt工程,似乎也沒(méi)說(shuō)到微調(diào)的事情呀。
是的,這就是不同的解決方案。
Prompt也好,微調(diào)也罷,是對(duì)模型做不同力度的勸導(dǎo)!
目前階段大模型對(duì)于指令的跟隨效果不是特別優(yōu)秀,所以當(dāng)前階段下,微調(diào)非常有價(jià)值。
六、AI搜索+Agent會(huì)逐漸盛行?
結(jié)論:大模型提供信息,Agent提供服務(wù)
未來(lái)大概率會(huì)演變成AI搜索是平臺(tái),上面的Agent是一個(gè)個(gè)的服務(wù)。
目前的Agent更多是用Prompt調(diào)教的,對(duì)于垂直的能力深度還是非常有限的,如果未來(lái)能做到AI搜索和AI Agent之間的緊密配合,就很厲害了。
換個(gè)思路,思考下微信平臺(tái)里的小程序。微信提供基礎(chǔ)的服務(wù)/信息,小程序提供各種垂直的服務(wù)。
Agent進(jìn)階的一種形態(tài)是:Multi-Agent
Miku AI搜索就很典型是一個(gè)基于Agent框架開(kāi)發(fā)的AI搜索,吳恩達(dá)在AI Ascent 2024大會(huì)上指出:“基于GPT-3.5構(gòu)建的AI智能體工作流在實(shí)際應(yīng)用中表現(xiàn)比GPT-4更好”
除此之外,ThinkAny的創(chuàng)始人idoubi也考慮后續(xù)增加工作流Workflow,就是Multi-Agents,你可以認(rèn)為前端是AI搜索,去檢索信息,然后進(jìn)入到用戶自定義的Multi-Agnets里,最后經(jīng)過(guò)智能體們的處理,獲得用戶自己想要的信息:
或者說(shuō),AI搜索+Coze。
七、AI搜索生成內(nèi)容,AI小紅書(shū)會(huì)來(lái)么?
結(jié)論:是一個(gè)明確的趨勢(shì)
我們?cè)凇度騁oogle,腳踢Perplexity,Genspark要做美女給你打好飯還喂進(jìn)嘴!的新物種》一文里,也提到了Sparkpage這套邏輯:
AI可以先生成一次結(jié)果,用戶再在此基礎(chǔ)上進(jìn)行修改,相當(dāng)于AI+人共同生成一個(gè)網(wǎng)頁(yè)。
包括Perplexity也做了一樣的Page能力。
從某種角度來(lái)說(shuō),這種邏輯是直接和人類創(chuàng)作者PK,是AI搜索+人去PK人類創(chuàng)作者。
參考即刻@余一 的普通人的AI使用說(shuō)明書(shū),相當(dāng)于中間那一層。
其實(shí)AI搜索走到這一步非常自然,就像我們理解各大廠和各大模型廠的效率工具都會(huì)加入搜索能力一樣,只要理解搜索是為了后續(xù)效率工具獲取信息,就可以很絲滑的get到這一點(diǎn)。
也就容易理解小紅書(shū)很擔(dān)心類似的產(chǎn)品:未來(lái)如果是AI+人也能生成高質(zhì)量的內(nèi)容,并且形成自己的社區(qū)生態(tài),那必然和小紅書(shū)是帶來(lái)競(jìng)爭(zhēng)關(guān)系。
八、AI SEO會(huì)逐漸形成共識(shí)?
上面這一點(diǎn),其實(shí)衍生出一個(gè)結(jié)論:AI SEO馬上就會(huì)成為共識(shí)
新的產(chǎn)品如何獲得流量,已經(jīng)開(kāi)始逐步變成大家關(guān)注的話題了,那AI搜索也同樣會(huì)面臨這個(gè)困境,我們?cè)贕enspark一文里,提到了Genspark通過(guò)Agent生成Sparkpage的內(nèi)容質(zhì)量“很高”,這樣的內(nèi)容可以被Google收錄,從而獲得源源不斷的流量:
類似的流量獲取機(jī)制,Perplexity已經(jīng)深深受益了:
同樣的,360AI搜索也通過(guò)每天晚上定時(shí)跑任務(wù),并且通過(guò)更高優(yōu)先級(jí)的方式插入到360搜索的索引內(nèi),用AI生成網(wǎng)頁(yè)的方式,既滿足了用戶的長(zhǎng)尾Query,又給AI搜索本身帶去了流量。
AI搜索本身就是非常好的內(nèi)容生成框架,結(jié)合AI SEO從傳統(tǒng)搜索引擎吸取流量,也是前期快速成長(zhǎng)的好方式。
九、有人說(shuō)Sparkpage的內(nèi)容質(zhì)量一般,重要么?
結(jié)論:可能并不重要
沿著上面的思路,我們可以嘗試去思考一個(gè)點(diǎn):
不是所有問(wèn)題都要直達(dá)終點(diǎn)
答案可以是一個(gè)過(guò)程,是一個(gè)中間態(tài),這依然有很大的價(jià)值。
直白點(diǎn)說(shuō),Sparkpage能給到你一些啟發(fā),幫助你去優(yōu)化自己的攻略/購(gòu)買決策,已經(jīng)很有效了。如果未來(lái)更多用戶基于它去生成高質(zhì)量的人+AI共創(chuàng)的內(nèi)容,那真的就是AI小紅書(shū)。
換個(gè)角度:傳統(tǒng)搜索里,Top10%的Query占據(jù)了95%以上的流量。這意味著AI搜索有一定的可能性把用戶最關(guān)注的答案優(yōu)先生成好!
十、AI搜索是一種退化?
結(jié)論:搜索從10個(gè)鏈接到1個(gè)答案是進(jìn)化,但從視頻到文字是退化
這是閉門會(huì)的一位小伙伴說(shuō)的,傳統(tǒng)搜索是菜市場(chǎng),AI搜索是送外賣,但是,從視頻到文字是退化!
相信你也會(huì)思考,為何AI搜索大部分都是文字結(jié)果的呢?
我們來(lái)看看一些可能性:
這里面廣義的AI搜索可以包含,并且可以實(shí)現(xiàn)的擴(kuò)展能力有:
輸入變得更加豐富和自由:
Query多模態(tài):從只能文字+語(yǔ)音轉(zhuǎn)文字輸入,到Circle to Search、智能鏡頭,圖片、視頻輸入等等
360AI搜索App已經(jīng)上線了AI圖片識(shí)別搜索能力:
Google的Take a video,微軟的Copilot陪你一起玩,在技術(shù)層面已經(jīng)開(kāi)始進(jìn)入到了視頻交互層面了,這是非常大的一個(gè)跨越。不難想象的是,一旦這類能力進(jìn)一步整合到隨身的硬件上,會(huì)有多么大的體驗(yàn)提升。
輸出也會(huì)更多元:
1.信息整合:AI OverView(鏈接、圖片、POI、郵件、文檔等),典型的可見(jiàn)產(chǎn)品為Genspark的Sparkpage;Perplexity和Tako信息卡片合作,使得輸出內(nèi)容可以支持圖標(biāo),還有秘塔AI搜索可以直接把生成的結(jié)果信息生成PPT;
(秘塔AI搜索實(shí)現(xiàn):Search Query to PPT)
2.服務(wù)整合:Planning、Agent、Prompt-pic-Shopping等等
兩者的邊界同時(shí)在擴(kuò)充,并且都可以更深度的理解用戶的意圖,這會(huì)讓AI搜索可滿足的用戶需求,從過(guò)去僅僅提供信息/內(nèi)容整理,擴(kuò)充到工作生活學(xué)習(xí)的方方面面。
最近的一步,AI搜索更應(yīng)該是把答案組織成用戶更喜歡的載體,這可能是圖文混排,或者包含視頻,這涉及到的是信息的組織,Genspark的Sparkpage就非常典型,我們之前畫(huà)過(guò)結(jié)構(gòu)圖:
所以,目前看只能生成文字的AI搜索,在局部確實(shí)是退化的。
十一、總結(jié)
這篇文章,是一個(gè)階段性的思考,期間有大量的使用AI搜索完成日常信息的搜集,有大量和行業(yè)從業(yè)者的溝通交流,這里感謝參與其中的各位。
這里感謝愿意署名的共創(chuàng)者:
AI產(chǎn)品經(jīng)理 小邵,即刻 “小邵嘚啵嘚”
Miku AI創(chuàng)始人 Franco,微信:aigeek2024
ThinkAny 創(chuàng)始人 idoubi,即刻: 艾逗筆
參考:
我做了一個(gè) AI 搜索引擎 from 艾逗筆
《普通人的AI使用說(shuō)明書(shū)》 from 即刻@余一
https://gamma.app/docs/AI-Dev-9y7n4vslcp2bol2?mode=doc
本文由人人都是產(chǎn)品經(jīng)理作者【Super黃】,微信公眾號(hào):【AI產(chǎn)品黃叔】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!