国产成人久久精品二三区麻豆,精品在线免费观看

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

開通會(huì)員

發(fā)布

注冊(cè) | 登錄

誰能對(duì)Perplexity貼臉開大？

王智遠(yuǎn)

2024-07-15

2 評(píng)論 1174 瀏覽 0 收藏

Perplexity以其獨(dú)特的RAG技術(shù)和顛覆性創(chuàng)新，打破了傳統(tǒng)搜索引擎的局限。那么，它是如何做到的呢？又是如何看待與其他AI搜索的競(jìng)爭(zhēng)呢？讓我們一同揭開Perplexity的神秘面紗，探尋它的內(nèi)核與未來。

我有一個(gè)小習(xí)慣，每次參加完活動(dòng)，總會(huì)加一些新朋友，或被人加，為防止加完后忘記這人長(zhǎng)啥樣；我會(huì)習(xí)慣性翻看一下對(duì)方朋友圈，找到一張照片，保存到備注里，下次見面，以防止認(rèn)不出來的尷尬。

前兩天，活動(dòng)結(jié)束，我加一位技術(shù)領(lǐng)域的專家，他在網(wǎng)上還算有名；當(dāng)時(shí)，我從百度百科上保存一張他的照片，想著忙完再備注。

可回到家，怎么也想不起這人是誰，鑒于強(qiáng)迫癥人格，我總想弄清楚。很頭疼，怎么辦？于是，我把照片發(fā)給國(guó)內(nèi)的幾個(gè)AI搜索軟件，結(jié)果都沒找到我想要的答案。

最后，把它發(fā)給了GPT-4，也沒有識(shí)別出來，在快要放棄時(shí)我尋思給Perplexity試試吧，沒想到，不到5秒時(shí)間，它幫我識(shí)別出了對(duì)方是誰。

我按照線索，在通訊錄里找到他的微信，趕緊把備注加上；真驚訝，沒想到Perplexity進(jìn)步這么快，雖然Perplexity PRO版用Claude3.5、GPT4-4o和sonar三個(gè)模型，但不得不說，某些方面，它已經(jīng)超過了GPT-4。

一款产品无到有，产品经理需要做些什么？

在一个产品从无到有的过程中，要做好产品经理这个角色实在是不容易，除了大家都知道的写需求、写需求、写需求，要做的事多着呢。产品经理不是你眼中的只会找你麻烦，提要求..

查看详情 >

于是我在想，各家AI搜索都在對(duì)Perplexity貼臉開大，到底誰能做出Perplexity內(nèi)核部分？Perplexity僅是問答產(chǎn)品嗎？創(chuàng)始人怎么看的？這些問題，有必要挖一挖。

01

每次要說這個(gè)名字，對(duì)不太擅長(zhǎng)英語的人來說，都有點(diǎn)兒難為情。是的，Perplexity，聽起來挺拗口，用中文念出來要五個(gè)字，你可以這么讀：“佩爾-普萊克-斯提”。

什么意思呢？

簡(jiǎn)單講，困惑的。創(chuàng)始人也許在想，如果你有什么困惑，就來問問我們的產(chǎn)品，它能為你解答。

產(chǎn)品是國(guó)外的，從生態(tài)位上看，介于Google搜索和ChatGPT聊天機(jī)器人之間，它不僅有提問窗口還有相關(guān)問題，還有發(fā)現(xiàn)功能，目前里面收集大量當(dāng)日的新聞?wù)憧梢詾g覽，還是隨時(shí)繼續(xù)追問。

發(fā)現(xiàn)的好處在于，它能讓你知道全球正在發(fā)生什么。

注意，是全球。我覺得比起ChatGPT或Gemini更便捷一些，更像國(guó)內(nèi)AI版知乎，這么說，你也不用感到奇怪，因?yàn)樗膭?chuàng)始團(tuán)隊(duì)中，有不少人以前在Quora工作過，而知乎當(dāng)年的創(chuàng)業(yè)靈感，就來自于Quora。

比如：

技術(shù)總監(jiān)Denis Yarats，以前是Quora的機(jī)器學(xué)習(xí)工程師，創(chuàng)始設(shè)計(jì)師Henry Modisett在Quora工作超過了8年，做過很多產(chǎn)品設(shè)計(jì)。

Perplexity的創(chuàng)始人Aravind Srinivas，以前在OpenAI工作，主要研究語言和擴(kuò)散生成模型，所以，通過幾個(gè)人的組合，不難看出，這家公司的基因深受其創(chuàng)始團(tuán)隊(duì)的經(jīng)歷影響。

知道初心就知道使命，那么，這個(gè)產(chǎn)品的設(shè)計(jì)初心是什么呢？Aravind Srinivas說過，決定做AI問答社區(qū)，首先第一點(diǎn)啟發(fā)來自于谷歌。

Aravind從谷歌兩位聯(lián)合創(chuàng)始人拉里·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)身上學(xué)到一件事，即：

早些年，谷歌沒有通過模仿其他搜索引擎來競(jìng)爭(zhēng)，而是選擇一種顛覆式創(chuàng)新的模式。

如何顛覆？他們注意到，答案引擎概念比現(xiàn)在用的搜索引擎歷史還要悠久，早在1970年代，信息檢索領(lǐng)域研究人員就開始用自然語言處理（NLP）來幫助人們從文本中獲取信息。

1990年代中期的Ask Jeeves（現(xiàn)在的Ask.com）也提供過類似的問答服務(wù)，但是，當(dāng)時(shí)搜索引擎靠文本檢索信息效果不理想，后來沒辦法，谷歌才改變技術(shù)結(jié)構(gòu)。

進(jìn)而，采用了用網(wǎng)頁鏈接結(jié)構(gòu)來提取信息，這種辦法后來被稱為“頁面排名”，非常巧妙的創(chuàng)新。

具體來說，兩位聯(lián)合創(chuàng)始人將搜索過程簡(jiǎn)化成了冪次迭代，他們聘請(qǐng)大量工程師，來開發(fā)關(guān)于更多基于傳統(tǒng)信息提取技術(shù)的排名信息，谷歌與其他搜索引擎的根本區(qū)別在于獨(dú)特的排名信號(hào)。

Aravind還注意到，Google的創(chuàng)始人拉里·佩奇（Larry Page）和謝爾蓋·布林（Sergey Brin）都有深厚的學(xué)術(shù)背景，并且他們努力將學(xué)術(shù)研究與產(chǎn)品開發(fā)相結(jié)合。

這里有一個(gè)小事件：

Google在創(chuàng)業(yè)階段時(shí)，試圖將自己的搜索引擎基礎(chǔ)賣給Excite公司，拉里·佩奇做過一個(gè)展示，把Excite的搜索結(jié)果和Google的搜索結(jié)果進(jìn)行對(duì)比。

這個(gè)過程中，Excite的首席執(zhí)行官批評(píng)Google的搜索結(jié)果，但拉里·佩奇堅(jiān)持認(rèn)為，一個(gè)優(yōu)秀的搜索引擎應(yīng)該能夠在用戶輸入任何內(nèi)容時(shí)都提供高質(zhì)量的答案。

所以，拉里·佩奇認(rèn)為，搜索軟件應(yīng)在任何輸入下，都得給用戶提供高質(zhì)量答案；但是，很不巧，后來谷歌走了一條與初心違背卻很賺錢的事情，即：賣廣告，廣告賺錢效率在當(dāng)年要比文本生成賺錢。

因此，Aravind在谷歌學(xué)到兩點(diǎn)，一，要顛覆式創(chuàng)新，做文本搜索的事情，而非網(wǎng)頁檢索；二，最好文本和學(xué)術(shù)掛鉤，用戶想要一個(gè)實(shí)際答案，不是一堆有答案的網(wǎng)頁列表。

02

第二點(diǎn)來自于誰呢？投資人Marc Andresson。

Aravind在困惑要不要做垂直領(lǐng)域的搜索軟件時(shí)，Marc Andresson給他過兩個(gè)建議：

一，不管如何，都不要做搜索，是把業(yè)務(wù)拓展到像Quora社區(qū)這樣的有社交特性的領(lǐng)域。

為什么呢？

很多只做垂直領(lǐng)域搜索的公司最后都失敗了，相反，那些在特定領(lǐng)域提供全面服務(wù)的公司卻獲得了成功。

比如，Booking.com不只搜索酒店，還可以直接預(yù)訂；Airbnb也不僅僅是預(yù)訂住宿，而是提供了全套的旅行服務(wù)了；如果Perplexity只做得足夠深，競(jìng)爭(zhēng)優(yōu)勢(shì)不會(huì)只停留在技術(shù)和積累用戶上。

二，一個(gè)結(jié)合社交、AI問答的社區(qū)，比單純的搜索引擎更有價(jià)值。

傳統(tǒng)的搜索引擎在回答問題時(shí)往往反應(yīng)慢，不能有效地獲取知識(shí)。如果Perplexity能提升回答的效率，并連接社區(qū)成員，那么，這件事會(huì)格外的性感。

所以，后來Aravind被說服了，他覺得Perplexity應(yīng)該做這件事，眼前不止于有網(wǎng)頁產(chǎn)品，還有社區(qū)，未來還要與一切可穿戴設(shè)備連接。

比如，與Brilliant Labs合作（注：Brilliant Labs，是一家總部位在新加坡的科技公司，主要開發(fā)具有人工智能功能的開源眼鏡），讓人們通過AR眼睛進(jìn)行搜索和查詢。

現(xiàn)在來看，Brilliant Labs的確在今年2月9日與Perplexity達(dá)成了合作，并且推出Frame眼鏡。因此，Perplexity超越了傳統(tǒng)搜索引擎的范疇。

第三個(gè)啟發(fā)來自于GitHub Copilot，這當(dāng)中有個(gè)故事。

Aravind說過，像GitHub Copilot這樣的工具，很多人都在用，而且還有人為此付費(fèi)，我自己也在用。（注：GitHub Copilot是由GitHub和OpenAI共同開發(fā)的AI編碼助手工具，他能輔助開發(fā)者更智能的寫代碼）。

擁有人工智能的公司，收集大量數(shù)據(jù)，但這些數(shù)據(jù)只是更大事物的一部分；我要找到一個(gè)問題，努力解決它，就能從人工智能的進(jìn)步中受益。

也就是說：

通過人工智能技術(shù)，讓人使用技術(shù)解決具體問題，不僅能改善產(chǎn)品，吸引用戶，還能用用戶生成的數(shù)據(jù)持續(xù)迭代人工智能的能力，形成一個(gè)正向循環(huán)。

但是，大多數(shù)公司都沒有這種特性，這就是為什么他們都在努力找在哪里可以使用人工智能，并讓人用起來的原因。

Aravind覺得，有兩款產(chǎn)品做到了這一點(diǎn)。一個(gè)是谷歌搜索，任何人工智能、語義理解、自然語言處理的改進(jìn)都會(huì)提升產(chǎn)品的質(zhì)量，更多的數(shù)據(jù)會(huì)讓嵌入變得更好。

另一個(gè)是自動(dòng)駕駛汽車，越來越多的人使用它，它為你提供了更多的數(shù)據(jù)。這使得模型更好，視覺系統(tǒng)更好，行為克隆也更好。

所以，我一直希望我做的產(chǎn)品有這種特定，它本身不是為消費(fèi)者搜索行為所設(shè)計(jì)的，而是，從搜索的那一刻開始，產(chǎn)品才剛剛開始。

03

第四個(gè)啟發(fā)在數(shù)據(jù)庫上。

Aravind說，從技術(shù)層面，在如何改變用戶搜索體驗(yàn)過程中，我意識(shí)到傳統(tǒng)的關(guān)系數(shù)據(jù)庫面臨很多限制，特別在處理復(fù)雜的自然語言查詢時(shí)。

比如：

如果你問數(shù)據(jù)庫，“埃隆·馬斯克關(guān)注了誰？”或者“萊克斯·弗里德曼關(guān)注的是誰？”這種問題，傳統(tǒng)數(shù)據(jù)庫是搞不定的。這樣的限制，讓查詢不夠靈活，用戶和數(shù)據(jù)的互動(dòng)也就受限了。

怎么辦呢？隨著人工智能技術(shù)的進(jìn)步，我們覺得可以破這個(gè)局。因?yàn)楝F(xiàn)在有些很棒的編程模型，能懂你說的話，我們就想用這些模型來幫忙。

我們的方法是這樣的：

先搜集一些數(shù)據(jù)，然后把數(shù)據(jù)放進(jìn)表里，再根據(jù)需要生成SQL查詢。我們選擇用SQL，是因?yàn)樗?jiǎn)單明了，選擇的東西不多，不像Python那樣復(fù)雜。

你可以把這個(gè)過程想象成在一個(gè)大圖書館里找書。

比如：你想找所有關(guān)于“太空旅行”的書，但圖書館的索引系統(tǒng)只按作者名、出版年份排序，沒按主題來排。這就麻煩了，因?yàn)槟阒肋@些書肯定在，但找起來就沒那么直接了。

所以，我們用了一種類似的外部助手（就是大模型），讓它從內(nèi)部開始整理和處理信息，然后，把信息整理成表格，生成需要的SQL查詢。

雖然這方法聽起來很不錯(cuò)，但其實(shí)在把自然語言轉(zhuǎn)換成SQL的過程中，我們遇到了很多問題，比如錯(cuò)誤處理和系統(tǒng)穩(wěn)定性問題。

怎么辦呢？

我們決定用一種更靈活、能自我調(diào)整的方式，來應(yīng)對(duì)挑戰(zhàn)。如此一來，一方面，我們提升了自然語言處理系統(tǒng)的能力，讓它能更準(zhǔn)確地理解和分析用戶的意圖。

另一方面，引進(jìn)更高級(jí)的機(jī)器學(xué)習(xí)模型和算法，特別是能從大量雜亂無章的數(shù)據(jù)中，學(xué)習(xí)和提取有用信息的模型，就形成了技術(shù)迭代。

問題是，如何改進(jìn)呢？我們認(rèn)為關(guān)鍵點(diǎn)在RAG部分。

04

什么是RAG？為什么是RAG呢？

RAG，全稱Retrieval-Augmented Generation，中文叫檢索增強(qiáng)生成技術(shù)。

概念是帕特里克·劉易斯（Patrick Lewis）在2020年的一篇文章《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》中首次提出，現(xiàn)在，他是Cohere RAG團(tuán)隊(duì)的負(fù)責(zé)人。

Aravind認(rèn)為，RAG技術(shù)能夠連接到任何外部數(shù)據(jù)源，讓用戶幾乎可以和任何數(shù)據(jù)存儲(chǔ)庫進(jìn)行對(duì)話。

例如：在醫(yī)療領(lǐng)域，一個(gè)聊天機(jī)器人可以通過查詢醫(yī)院的數(shù)據(jù)來幫助醫(yī)生；在金融領(lǐng)域，分析師使用的機(jī)器人也可以通過訪問市場(chǎng)數(shù)據(jù)庫來提供更可靠的分析。

以O(shè)penAI為代表的公司采用“微調(diào)”方式服務(wù)于特定行業(yè)客戶，即：利用企業(yè)自己的數(shù)據(jù)，來繼續(xù)訓(xùn)練提供的基礎(chǔ)模型，從而開發(fā)出更懂該企業(yè)的專有模型。

比如：GPT-4在被訓(xùn)練了更多關(guān)于法律和財(cái)務(wù)的知識(shí)后，相較于學(xué)得較少的GPT-3.5，更容易通過法律和財(cái)務(wù)方面的考試。

而使用RAG方法不同。

雖然Perplexity也使用了一些大型模型，但并沒有繼續(xù)讓這些模型深入學(xué)習(xí)特定領(lǐng)域的知識(shí)，而是，將數(shù)據(jù)作為隨時(shí)可查詢的資源供模型參考。

什么意思呢？

當(dāng)OpenAI通過不斷喂養(yǎng)數(shù)據(jù)，讓大模型變得更聰明，使其能直接回答用戶問題時(shí)，這種做法像是在進(jìn)行閉卷考試，需要憑借已有的記憶來回答問題。

而Perplexity利用RAG技術(shù)，則相當(dāng)于開卷考試，你可以隨時(shí)查閱資料來找到答案。

也就是說，RAG技術(shù)讓Perplexity能夠利用即時(shí)的、廣泛的外部數(shù)據(jù)，為人們提供更精確、更相關(guān)的答案，這不僅提高了答案的質(zhì)量，也極大地增強(qiáng)了系統(tǒng)的應(yīng)用靈活性和實(shí)用性。

所以，讓Perplexity與Google不同的是其答案引擎，而與ChatGPT的區(qū)別則在于使用了RAG（Retrieval-Augmented Generation）技術(shù)。這種技術(shù)連接到外部知識(shí)庫，使得AI生成的內(nèi)容更加準(zhǔn)確和可靠。

雖然，最近Perplexity面臨一些技術(shù)倫理、版權(quán)爭(zhēng)議的問題，但我認(rèn)為，這并沒有影響其在提供高質(zhì)量搜索上的核心能力。

除了從谷歌、投資人、GitHub Copilot、數(shù)據(jù)庫以及RAG這六個(gè)方面得到啟發(fā)之外，國(guó)內(nèi)的創(chuàng)業(yè)者可能更關(guān)注如何賺錢。

Perplexity并沒有像其他公司那樣，先做大規(guī)模再開始收費(fèi)，而是一開始就推出了訂閱制付費(fèi)模式，每月20美刀，的確不便宜。但它的模型能力確實(shí)很強(qiáng)。

我用它來搜索國(guó)內(nèi)的信息，然后，和使用國(guó)內(nèi)AI軟件搜索的結(jié)果，以及信息來源的抓取能力進(jìn)行綜合比較，結(jié)果毋庸置疑，國(guó)內(nèi)技術(shù)還有很長(zhǎng)的路要走。

RAG已經(jīng)成了開卷考試，到底誰更勝一籌呢？

也許用戶體驗(yàn)是最好的評(píng)判標(biāo)準(zhǔn)，試一試就知道了；此外，國(guó)內(nèi)AI搜索產(chǎn)品中，很多還不支持圖片搜索功能、視頻搜索功能，并且也面臨著如何商業(yè)化的挑戰(zhàn)。

盡管這個(gè)領(lǐng)域，一些企業(yè)不差錢，不急于賺錢，但，維持AI技術(shù)的開發(fā)和運(yùn)營(yíng)燒錢迅速，也不小。

我認(rèn)為，用戶訴求會(huì)越來越多，先收費(fèi)再迭代產(chǎn)品，并非是一件壞事。反之，錢都賺不到，額外需求又進(jìn)一步增加，就會(huì)陷入一種怪圈，也許到時(shí)候，用戶的衡量標(biāo)準(zhǔn)會(huì)變得越來越琢磨不透。

05

總結(jié)

AI搜索，到了內(nèi)卷時(shí)刻。

當(dāng)產(chǎn)品、資源都在同質(zhì)化時(shí)還能拼什么？答案可能只有兩個(gè)字：速度。誰能賺到錢，更快地迭代技術(shù)、誰就更有可能領(lǐng)先。

速度的硝煙，等不到明年，也許下半年，就見分曉。祝你，卷出成績(jī)。

本文由人人都是產(chǎn)品經(jīng)理作者【王智遠(yuǎn)】，微信公眾號(hào)：【王智遠(yuǎn)】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Pixabay，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App

王智遠(yuǎn)

公眾號(hào)：王智遠(yuǎn) |暢銷書《復(fù)利思維》作者；左手營(yíng)銷方法論，右手心智成長(zhǎng)。

257篇作品 1371562總閱讀量

?兩萬多的蘋果MR，庫克又開了一個(gè)玩笑？

06-061397 瀏覽

貓狗拼「斜杠」微短?。憾舅庍€是解藥？

12-072256 瀏覽

B端产品设计思路：如何平衡大量客户需求

刚刚

微信“斷路”幕后：視頻號(hào)商業(yè)化棋至中局

09-053210 瀏覽

App自動(dòng)續(xù)費(fèi)人人喊打，終于要被滅了？

12-051709 瀏覽

淘寶，再戰(zhàn)短視頻

07-134068 瀏覽

評(píng)論

勁夫復(fù)出全場(chǎng)歡呼

RAG產(chǎn)品隨處可見，但Perplexity到底在RAG技術(shù)中用了哪些創(chuàng)新的技術(shù)達(dá)到這樣高質(zhì)量的輸出，也沒講

最近來自浙江回復(fù)
1. 汪仔8099 回復(fù)勁夫復(fù)出全場(chǎng)歡呼
  
  是的，懂RAG的人還是太少了，太多的RAG效果不好
  
  最近來自廣東回復(fù)