誰能對Perplexity貼臉開大?
Perplexity以其獨特的RAG技術和顛覆性創(chuàng)新,打破了傳統(tǒng)搜索引擎的局限。那么,它是如何做到的呢?又是如何看待與其他AI搜索的競爭呢?讓我們一同揭開Perplexity的神秘面紗,探尋它的內(nèi)核與未來。
我有一個小習慣,每次參加完活動,總會加一些新朋友,或被人加,為防止加完后忘記這人長啥樣;我會習慣性翻看一下對方朋友圈,找到一張照片,保存到備注里,下次見面,以防止認不出來的尷尬。
前兩天,活動結束,我加一位技術領域的專家,他在網(wǎng)上還算有名;當時,我從百度百科上保存一張他的照片,想著忙完再備注。
可回到家,怎么也想不起這人是誰,鑒于強迫癥人格,我總想弄清楚。很頭疼,怎么辦?于是,我把照片發(fā)給國內(nèi)的幾個AI搜索軟件,結果都沒找到我想要的答案。
最后,把它發(fā)給了GPT-4,也沒有識別出來,在快要放棄時我尋思給Perplexity試試吧,沒想到,不到5秒時間,它幫我識別出了對方是誰。
我按照線索,在通訊錄里找到他的微信,趕緊把備注加上;真驚訝,沒想到Perplexity進步這么快,雖然Perplexity PRO版用Claude3.5、GPT4-4o和sonar三個模型,但不得不說,某些方面,它已經(jīng)超過了GPT-4。
于是我在想,各家AI搜索都在對Perplexity貼臉開大,到底誰能做出Perplexity內(nèi)核部分?Perplexity僅是問答產(chǎn)品嗎?創(chuàng)始人怎么看的?這些問題,有必要挖一挖。
01
每次要說這個名字,對不太擅長英語的人來說,都有點兒難為情。是的,Perplexity,聽起來挺拗口,用中文念出來要五個字,你可以這么讀:“佩爾-普萊克-斯提”。
什么意思呢?
簡單講,困惑的。創(chuàng)始人也許在想,如果你有什么困惑,就來問問我們的產(chǎn)品,它能為你解答。
產(chǎn)品是國外的,從生態(tài)位上看,介于Google搜索和ChatGPT聊天機器人之間,它不僅有提問窗口還有相關問題,還有發(fā)現(xiàn)功能,目前里面收集大量當日的新聞摘要,你可以瀏覽,還是隨時繼續(xù)追問。
發(fā)現(xiàn)的好處在于,它能讓你知道全球正在發(fā)生什么。
注意,是全球。我覺得比起ChatGPT或Gemini更便捷一些,更像國內(nèi)AI版知乎,這么說,你也不用感到奇怪,因為它的創(chuàng)始團隊中,有不少人以前在Quora工作過,而知乎當年的創(chuàng)業(yè)靈感,就來自于Quora。
比如:
技術總監(jiān)Denis Yarats,以前是Quora的機器學習工程師,創(chuàng)始設計師Henry Modisett在Quora工作超過了8年,做過很多產(chǎn)品設計。
Perplexity的創(chuàng)始人Aravind Srinivas,以前在OpenAI工作,主要研究語言和擴散生成模型,所以,通過幾個人的組合,不難看出,這家公司的基因深受其創(chuàng)始團隊的經(jīng)歷影響。
知道初心就知道使命,那么,這個產(chǎn)品的設計初心是什么呢?Aravind Srinivas說過,決定做AI問答社區(qū),首先第一點啟發(fā)來自于谷歌。
Aravind從谷歌兩位聯(lián)合創(chuàng)始人拉里·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)身上學到一件事,即:
早些年,谷歌沒有通過模仿其他搜索引擎來競爭,而是選擇一種顛覆式創(chuàng)新的模式。
如何顛覆?他們注意到,答案引擎概念比現(xiàn)在用的搜索引擎歷史還要悠久,早在1970年代,信息檢索領域研究人員就開始用自然語言處理(NLP)來幫助人們從文本中獲取信息。
1990年代中期的Ask Jeeves(現(xiàn)在的Ask.com)也提供過類似的問答服務,但是,當時搜索引擎靠文本檢索信息效果不理想,后來沒辦法,谷歌才改變技術結構。
進而,采用了用網(wǎng)頁鏈接結構來提取信息,這種辦法后來被稱為“頁面排名”,非常巧妙的創(chuàng)新。
具體來說,兩位聯(lián)合創(chuàng)始人將搜索過程簡化成了冪次迭代,他們聘請大量工程師,來開發(fā)關于更多基于傳統(tǒng)信息提取技術的排名信息,谷歌與其他搜索引擎的根本區(qū)別在于獨特的排名信號。
Aravind還注意到,Google的創(chuàng)始人拉里·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)都有深厚的學術背景,并且他們努力將學術研究與產(chǎn)品開發(fā)相結合。
這里有一個小事件:
Google在創(chuàng)業(yè)階段時,試圖將自己的搜索引擎基礎賣給Excite公司,拉里·佩奇做過一個展示,把Excite的搜索結果和Google的搜索結果進行對比。
這個過程中,Excite的首席執(zhí)行官批評Google的搜索結果,但拉里·佩奇堅持認為,一個優(yōu)秀的搜索引擎應該能夠在用戶輸入任何內(nèi)容時都提供高質(zhì)量的答案。
所以,拉里·佩奇認為,搜索軟件應在任何輸入下,都得給用戶提供高質(zhì)量答案;但是,很不巧,后來谷歌走了一條與初心違背卻很賺錢的事情,即:賣廣告,廣告賺錢效率在當年要比文本生成賺錢。
因此,Aravind在谷歌學到兩點,一,要顛覆式創(chuàng)新,做文本搜索的事情,而非網(wǎng)頁檢索;二,最好文本和學術掛鉤,用戶想要一個實際答案,不是一堆有答案的網(wǎng)頁列表。
02
第二點來自于誰呢?投資人Marc Andresson。
Aravind在困惑要不要做垂直領域的搜索軟件時,Marc Andresson給他過兩個建議:
一,不管如何,都不要做搜索,是把業(yè)務拓展到像Quora社區(qū)這樣的有社交特性的領域。
為什么呢?
很多只做垂直領域搜索的公司最后都失敗了,相反,那些在特定領域提供全面服務的公司卻獲得了成功。
比如,Booking.com不只搜索酒店,還可以直接預訂;Airbnb也不僅僅是預訂住宿,而是提供了全套的旅行服務了;如果Perplexity只做得足夠深,競爭優(yōu)勢不會只停留在技術和積累用戶上。
二,一個結合社交、AI問答的社區(qū),比單純的搜索引擎更有價值。
傳統(tǒng)的搜索引擎在回答問題時往往反應慢,不能有效地獲取知識。如果Perplexity能提升回答的效率,并連接社區(qū)成員,那么,這件事會格外的性感。
所以,后來Aravind被說服了,他覺得Perplexity應該做這件事,眼前不止于有網(wǎng)頁產(chǎn)品,還有社區(qū),未來還要與一切可穿戴設備連接。
比如,與Brilliant Labs合作(注:Brilliant Labs,是一家總部位在新加坡的科技公司,主要開發(fā)具有人工智能功能的開源眼鏡),讓人們通過AR眼睛進行搜索和查詢。
現(xiàn)在來看,Brilliant Labs的確在今年2月9日與Perplexity達成了合作,并且推出Frame眼鏡。因此,Perplexity超越了傳統(tǒng)搜索引擎的范疇。
第三個啟發(fā)來自于GitHub Copilot,這當中有個故事。
Aravind說過,像GitHub Copilot這樣的工具,很多人都在用,而且還有人為此付費,我自己也在用。(注:GitHub Copilot是由GitHub和OpenAI共同開發(fā)的AI編碼助手工具,他能輔助開發(fā)者更智能的寫代碼)。
擁有人工智能的公司,收集大量數(shù)據(jù),但這些數(shù)據(jù)只是更大事物的一部分;我要找到一個問題,努力解決它,就能從人工智能的進步中受益。
也就是說:
通過人工智能技術,讓人使用技術解決具體問題,不僅能改善產(chǎn)品,吸引用戶,還能用用戶生成的數(shù)據(jù)持續(xù)迭代人工智能的能力,形成一個正向循環(huán)。
但是,大多數(shù)公司都沒有這種特性,這就是為什么他們都在努力找在哪里可以使用人工智能,并讓人用起來的原因。
Aravind覺得,有兩款產(chǎn)品做到了這一點。一個是谷歌搜索,任何人工智能、語義理解、自然語言處理的改進都會提升產(chǎn)品的質(zhì)量,更多的數(shù)據(jù)會讓嵌入變得更好。
另一個是自動駕駛汽車,越來越多的人使用它,它為你提供了更多的數(shù)據(jù)。這使得模型更好,視覺系統(tǒng)更好,行為克隆也更好。
所以,我一直希望我做的產(chǎn)品有這種特定,它本身不是為消費者搜索行為所設計的,而是,從搜索的那一刻開始,產(chǎn)品才剛剛開始。
03
第四個啟發(fā)在數(shù)據(jù)庫上。
Aravind說,從技術層面,在如何改變用戶搜索體驗過程中,我意識到傳統(tǒng)的關系數(shù)據(jù)庫面臨很多限制,特別在處理復雜的自然語言查詢時。
比如:
如果你問數(shù)據(jù)庫,“埃隆·馬斯克關注了誰?”或者“萊克斯·弗里德曼關注的是誰?”這種問題,傳統(tǒng)數(shù)據(jù)庫是搞不定的。這樣的限制,讓查詢不夠靈活,用戶和數(shù)據(jù)的互動也就受限了。
怎么辦呢?隨著人工智能技術的進步,我們覺得可以破這個局。因為現(xiàn)在有些很棒的編程模型,能懂你說的話,我們就想用這些模型來幫忙。
我們的方法是這樣的:
先搜集一些數(shù)據(jù),然后把數(shù)據(jù)放進表里,再根據(jù)需要生成SQL查詢。我們選擇用SQL,是因為它簡單明了,選擇的東西不多,不像Python那樣復雜。
你可以把這個過程想象成在一個大圖書館里找書。
比如:你想找所有關于“太空旅行”的書,但圖書館的索引系統(tǒng)只按作者名、出版年份排序,沒按主題來排。這就麻煩了,因為你知道這些書肯定在,但找起來就沒那么直接了。
所以,我們用了一種類似的外部助手(就是大模型),讓它從內(nèi)部開始整理和處理信息,然后,把信息整理成表格,生成需要的SQL查詢。
雖然這方法聽起來很不錯,但其實在把自然語言轉(zhuǎn)換成SQL的過程中,我們遇到了很多問題,比如錯誤處理和系統(tǒng)穩(wěn)定性問題。
怎么辦呢?
我們決定用一種更靈活、能自我調(diào)整的方式,來應對挑戰(zhàn)。如此一來,一方面,我們提升了自然語言處理系統(tǒng)的能力,讓它能更準確地理解和分析用戶的意圖。
另一方面,引進更高級的機器學習模型和算法,特別是能從大量雜亂無章的數(shù)據(jù)中,學習和提取有用信息的模型,就形成了技術迭代。
問題是,如何改進呢?我們認為關鍵點在RAG部分。
04
什么是RAG?為什么是RAG呢?
RAG,全稱Retrieval-Augmented Generation,中文叫檢索增強生成技術。
概念是帕特里克·劉易斯(Patrick Lewis)在2020年的一篇文章《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》中首次提出,現(xiàn)在,他是Cohere RAG團隊的負責人。
Aravind認為,RAG技術能夠連接到任何外部數(shù)據(jù)源,讓用戶幾乎可以和任何數(shù)據(jù)存儲庫進行對話。
例如:在醫(yī)療領域,一個聊天機器人可以通過查詢醫(yī)院的數(shù)據(jù)來幫助醫(yī)生;在金融領域,分析師使用的機器人也可以通過訪問市場數(shù)據(jù)庫來提供更可靠的分析。
以OpenAI為代表的公司采用“微調(diào)”方式服務于特定行業(yè)客戶,即:利用企業(yè)自己的數(shù)據(jù),來繼續(xù)訓練提供的基礎模型,從而開發(fā)出更懂該企業(yè)的專有模型。
比如:GPT-4在被訓練了更多關于法律和財務的知識后,相較于學得較少的GPT-3.5,更容易通過法律和財務方面的考試。
而使用RAG方法不同。
雖然Perplexity也使用了一些大型模型,但并沒有繼續(xù)讓這些模型深入學習特定領域的知識,而是,將數(shù)據(jù)作為隨時可查詢的資源供模型參考。
什么意思呢?
當OpenAI通過不斷喂養(yǎng)數(shù)據(jù),讓大模型變得更聰明,使其能直接回答用戶問題時,這種做法像是在進行閉卷考試,需要憑借已有的記憶來回答問題。
而Perplexity利用RAG技術,則相當于開卷考試,你可以隨時查閱資料來找到答案。
也就是說,RAG技術讓Perplexity能夠利用即時的、廣泛的外部數(shù)據(jù),為人們提供更精確、更相關的答案,這不僅提高了答案的質(zhì)量,也極大地增強了系統(tǒng)的應用靈活性和實用性。
所以,讓Perplexity與Google不同的是其答案引擎,而與ChatGPT的區(qū)別則在于使用了RAG(Retrieval-Augmented Generation)技術。這種技術連接到外部知識庫,使得AI生成的內(nèi)容更加準確和可靠。
雖然,最近Perplexity面臨一些技術倫理、版權爭議的問題,但我認為,這并沒有影響其在提供高質(zhì)量搜索上的核心能力。
除了從谷歌、投資人、GitHub Copilot、數(shù)據(jù)庫以及RAG這六個方面得到啟發(fā)之外,國內(nèi)的創(chuàng)業(yè)者可能更關注如何賺錢。
Perplexity并沒有像其他公司那樣,先做大規(guī)模再開始收費,而是一開始就推出了訂閱制付費模式,每月20美刀,的確不便宜。但它的模型能力確實很強。
我用它來搜索國內(nèi)的信息,然后,和使用國內(nèi)AI軟件搜索的結果,以及信息來源的抓取能力進行綜合比較,結果毋庸置疑,國內(nèi)技術還有很長的路要走。
RAG已經(jīng)成了開卷考試,到底誰更勝一籌呢?
也許用戶體驗是最好的評判標準,試一試就知道了;此外,國內(nèi)AI搜索產(chǎn)品中,很多還不支持圖片搜索功能、視頻搜索功能,并且也面臨著如何商業(yè)化的挑戰(zhàn)。
盡管這個領域,一些企業(yè)不差錢,不急于賺錢,但,維持AI技術的開發(fā)和運營燒錢迅速,也不小。
我認為,用戶訴求會越來越多,先收費再迭代產(chǎn)品,并非是一件壞事。反之,錢都賺不到,額外需求又進一步增加,就會陷入一種怪圈,也許到時候,用戶的衡量標準會變得越來越琢磨不透。
05
總結
AI搜索,到了內(nèi)卷時刻。
當產(chǎn)品、資源都在同質(zhì)化時還能拼什么?答案可能只有兩個字:速度。誰能賺到錢,更快地迭代技術、誰就更有可能領先。
速度的硝煙,等不到明年,也許下半年,就見分曉。祝你,卷出成績。
本文由人人都是產(chǎn)品經(jīng)理作者【王智遠】,微信公眾號:【王智遠】,原創(chuàng)/授權 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Pixabay,基于 CC0 協(xié)議。
RAG產(chǎn)品隨處可見,但Perplexity到底在RAG技術中用了哪些創(chuàng)新的技術達到這樣高質(zhì)量的輸出,也沒講
是的,懂RAG的人還是太少了,太多的RAG效果不好