除了模型, GPT 們還在卷什么?

2 評論 8275 瀏覽 30 收藏 22 分鐘

ChatGPT的問世讓大模型成為了業(yè)內(nèi)關(guān)注焦點,無論是大廠還是中小企業(yè),或者獨立開發(fā)的開源程序員,都在大模型上鉚足了力。除了關(guān)注模型本身,關(guān)于AI,他們還關(guān)注在哪些領(lǐng)域?本文作者對此進行了分析,希望對你有幫助。

ChatGPT 問世后,各大公司都在「大模型」上下了苦功,模型能力也成為大家最關(guān)注的話題。ChatGPT 雖直接定義了基于大模型的生成式對話機器人這個產(chǎn)品類型,其模型的強大也導(dǎo)致大家都忽略了它在產(chǎn)品使用上的問題。

其實不管是底層模型開發(fā)的大廠還是專注于應(yīng)用層的小廠,又或者是開源的獨立開發(fā)者,都在模型能力之外的產(chǎn)品體驗上暗自較勁,以不同的姿態(tài)參與到這場能夠定義新的人機交互方式的對話革命中來。

那除了模型,他們還在「卷」些什么?

一、大廠:專注模型,體驗略顯「簡陋」,主打一個 less is more

1. ChatGPT:三件套框架定義極簡

ChatGPT 作為行業(yè)標(biāo)桿,直接定義了生成式對話機器人行業(yè)標(biāo)準(zhǔn)。免費版本的 ChatGPT?早期只有對話、對話管理以及簡單的主題設(shè)置功能,靠著模型能力席卷全球。隨著用戶的增多和抱怨,ChatGPT?的產(chǎn)品經(jīng)理也坐不住了開始逐步增加一些功能。

最令人深刻的當(dāng)屬 Upgrade to Plus,牢牢霸占左下角的設(shè)置頁,一眼望過去只有兩個字,「充錢」。除此之外,ChatGPT 也逐步增加了主題設(shè)置、隱私管理等功能,但仍然突出一個克制,頗有小龍哥真?zhèn)鳌?/p>

付費版 ChatGPT 主要的區(qū)別在于增加了模型切換的按鈕,以及在設(shè)置中增加了 Beta Features 的功能,可以使用聯(lián)網(wǎng)搜索功能 Browsing 或者使用其他插件。

2. Bard & Bing:非差異化競爭

三巨頭的剩下兩家 Google Bard 以及 Bing Chat 也都各有各自的風(fēng)格,但總體上還是維持著極簡風(fēng)。

Bard 的功能設(shè)計邏輯與 ChatGPT 幾乎一致:對話功能為主,融合必要的對話管理、賬戶管理以及界面設(shè)置功能。作為搜索大拿,Bard 在對話的基礎(chǔ)上也引入了搜索的功能,能夠自然地根據(jù)問題引入搜索,并呈現(xiàn)融合處理過的結(jié)果,體驗上更加 up to date。對于天氣、實時信息的查詢都表現(xiàn)良好。

大模型在生成答案時會有多個答案并且有相應(yīng)的權(quán)重,Bard 的「查看其他答案」功能給用戶提供了更多選擇,當(dāng)我詢問北京市天氣的時候,它甚至給出了文字版本、表格版本和極簡版本,非常驚艷。

值得一提的是,Bard 的回答生成在交互方面是一次性生成而非打字機模式(文字一個一個出現(xiàn),有打字機效果,參考 ChatGPT),缺乏了生成過程,體驗上感覺不夠絲滑。

與 ChatGPT 和 Google Bard 不同的是,Bing Chat 的定位是基于搜索的,它的工作原理是從輸入中總結(jié)搜索關(guān)鍵詞進行搜索,然后對搜索結(jié)果進行總結(jié)。每一條回復(fù)都會引用相應(yīng)的來源,這同時導(dǎo)致它在創(chuàng)造力方面更缺乏,但是來源可考、保證了準(zhǔn)確性。

Bing 同樣也是極簡風(fēng),整體的產(chǎn)品界面設(shè)計與其他兩家區(qū)別不大,但色彩上明顯更活潑一些。功能上最開始甚至連對話管理的功能都沒有,聊完了您就清空,不留下一絲痕跡。后來才增加「最近活動」的功能,用戶能夠看到自己最近的對話。

Bing 唯一的特點在于設(shè)定了三種對話樣式:更有創(chuàng)造力、更平衡、更精確,能夠根據(jù)此參數(shù)確定模型是更精確還是更有創(chuàng)造性,這與 GPT 模型中的高級參數(shù) Temperature 是對應(yīng)的。然而因為無法同時對比幾個模式,在使用體驗上用戶很難感受到差別,即使是更有創(chuàng)造力的選項,受限于 Bing 更偏向搜索的定位,搜出的結(jié)果依舊缺乏創(chuàng)造力。

對比下來,三巨頭比拼的主要還是模型能力,目前 ChatGPT 還是比較領(lǐng)先;Bard 比較好地融合了搜索和生成兩種模式,體驗上是更優(yōu)秀一些,Bing 則缺乏使用上的亮點,但靠著一句 GPT-4 模型就足以吸引大部分用戶。

二、中小廠:深耕體驗,能力之上體驗狂卷

不同于大廠卷模型能力,中小廠和個人開發(fā)者們更多將注意力放在了模型層上的應(yīng)用層,依托各家大廠的底層模型能力,在功能和體驗方面卷的飛起。

1. Perplexity:基于搜索的 AI 對話產(chǎn)品該怎么做

首先要說的就是?Perplexity,一家對話式的搜索引擎,體驗上可以說是完爆 Google Bard 和 Bing Chat。Perplexity 翻譯為「困惑度」,是人工智能領(lǐng)域用來描述語言模型效果的一個常用指標(biāo),模型困惑度越小,說明模型越強大。Perplexity 是一家只有 14 個員工的小型跨學(xué)科團隊,但在產(chǎn)品力上可以說是完爆大廠,堪稱 more is more 的典范。

在基本的 ChatGPT 式對話架構(gòu)三件套基礎(chǔ)上,Perplexity 融合了垂直領(lǐng)域搜索(學(xué)術(shù)、YouTube、Reddit、Wolfram 等)、搜索歷史、搜索熱榜、以及 Copilot(類似 AutoGPT)等功能。UI 設(shè)計采用了傳統(tǒng)的搜索布局,對話框在屏幕偏上方,而非對話類框架輸入框在下方的模式,讓人一眼就知道,這個產(chǎn)品是更「搜索」的產(chǎn)品。

從這點上來說,Perplexity 比 Google 和 Bing 更加突出了自己的搜索定位,旗幟鮮明、定位清晰。產(chǎn)品的邏輯則與 Bing 類似,是對搜索結(jié)果的總結(jié)(summerize),通過多次使用感覺對文獻的引用更加全面,比 Bing 更加具有創(chuàng)造性一些。在多輪對話當(dāng)中,Perplexity 還增加了相關(guān)話題,預(yù)測了根據(jù)答案你可能會有的其他疑問,順利的話只需要問一次,剩下的問題靠點擊就可以解決了,體驗上很順暢。

對于「如何成為一名少數(shù)派作者」,筆者分別對 Perplexity 和 Bing Chat 做了測試,從回答的內(nèi)容來說,Perplexity 的內(nèi)容更加詳實,參考來源更多,同時搜索后的界面在延伸閱讀、follow up 提問以及排版優(yōu)化上,都比 Bing Chat 體驗要好。巨硬果然是拿腳做產(chǎn)品。

2. Poe:「美國知乎」的縫合怪

Poe?是「美國知乎」Quora 推出的官方 AI 聊天應(yīng)用,接入了 GPT-3.5、GPT-4、Claude、Midjourney 等多種 AI 服務(wù),是目前最官方的「AI 縫合怪」。

其最大的營銷點:可以免費使用 GPT-4 和 Claude Instant,然而點進去你就會發(fā)現(xiàn) GPT-4 每天只能用 1 次、每個月可以使用 30 次,只能說是聊勝于無吧。另外除了縫合之外,其單個服務(wù)的產(chǎn)品體驗非常簡陋,幾乎只有對話功能,長期使用體驗較差。

其官方的 AI 對話助手 Sage 在使用體驗上沒有什么獨特之處,應(yīng)該也是用了 GPT-3.5 之類的模型。

3. Forefront:ChatGPT 最佳代替品

免費 GPT-4 幾乎是所有套殼應(yīng)用最有效的宣傳方式,只要你有這個功能,哪怕是每天只能用 1 次,你都能騙來一大波流量(鞭尸 Poe)。

而?Forefront?幾乎做到了 GPT-4 的全免費。它來自一個 GitHub 項目,通過逆向工程 Poe、Bing 等使用了 GPT-4 的大廠,為普通網(wǎng)友提供免費的 GPT-4 連接,在 GitHub 上狂砍 3.7 萬星標(biāo),幾乎是最近增長最快的項目。

Forefront 內(nèi)置了豐富的人格預(yù)設(shè),能夠滿足用戶多樣化的使用需求。人格化預(yù)設(shè)來自一個經(jīng)典的 prompt 技巧:讓 ChatGPT 扮演某一種角色,這樣它的回答能夠更加準(zhǔn)確。Forefront 可以一鍵選擇超多人格,達芬奇、喬布斯、軟件開發(fā)工程師等,提供了豐富的場景模板,編程幫助、創(chuàng)意寫作、學(xué)術(shù)研究等場景都可以滿足。

三、套殼應(yīng)用:細節(jié)爆炸,深度玩家福音

說完了官方主力軍們,接下來介紹一下依托于官方 API 的各種套殼產(chǎn)品。它們主要是在模型能力上對前端交互進行優(yōu)化并增加了一些輔助功能,用戶可以將自己的 API 填入并使用。

這類產(chǎn)品更適合深度體驗者以及當(dāng)成生產(chǎn)力工具,能夠定制化的細節(jié)非常多。

1. ChatBox:多平臺客戶端之王

ChatBox?是目前最成熟的多平臺 AI 聊天客戶端,用戶可以自主可以接入 ChatGPT、Azure ChatGPT 服務(wù)、Claude API 等,在 GitHub 上獲得了 11.7 萬星標(biāo),橫掃客戶端界。對于對客戶端有執(zhí)念的用戶,它也是 Windows 上最好的選擇。

ChatBox 的架構(gòu)也是基于 ChatGPT 的三段式架構(gòu),但每個部分都增加了更多功能,滿足多樣化的效率使用體驗。它在對話管理功能中還設(shè)置了多種預(yù)設(shè) pormpts,包括軟件開發(fā)、私人助理、夸夸機等模式。

在設(shè)置中,ChatBox 也支持高級參數(shù)和更詳細地信息顯示:首先可以自定義 temperature 參數(shù),調(diào)整模型答案的隨機性、創(chuàng)造性;同時可以顯示 API 的 token 用量,可輸入輸出的 token 數(shù)量估計,以及調(diào)整文字大小、默認語言等功能。用下來應(yīng)該算是 Windows 上用起來體驗最好的客戶端。

2. MacGPT:如果只能有一款 GPT 客戶端,那就是 MacGPT

至于為什么 ChatBox 只能是 Windows 最好用的桌面客戶端,因為 Mac 平臺上有更卷的產(chǎn)品:MacGPT。

得益于 Mac 系統(tǒng)的特點,MacGPT 支持 5 種模式:Web、API、任務(wù)欄模式、全局呼出以及 Intext。任何場景都能夠滿足需求。

Web 模式相當(dāng)于一個簡版瀏覽器窗口,整個使用體驗與 ChatGPT 一致;API 模式體驗與 ChatBox 類似,相當(dāng)于一個本地的 Mac 客戶端;任務(wù)欄模式可以支持從任務(wù)欄喚醒并且隨時開啟對話,依托于任務(wù)欄可以保證在任何場景下都可以快速啟動 ChatGPT,非常高效;全局呼出模式則支持通過熱鍵呼出置頂?shù)膶υ挋诓⒘⒖陶归_對話,用過?Alfred?應(yīng)該都能明白這種體驗是多么流暢。

Intext 模式更是 amazing,簡直是文字工作者的大殺器。當(dāng)你在任何文本輸入的環(huán)境(備忘錄、Word 等)中打出?/gpt,隨后的內(nèi)容就會被作為 ChatGPT 的輸入,并且直接在當(dāng)前文本環(huán)境中生成回答,完全無需切換應(yīng)用就能使用 ChatGPT 進行問答,并且直接插入到文檔中,簡直就是 Notion AI 的全局版本,必須吹爆。

3. ChatGPT-Next:每個人的云服務(wù) AI 助手

如果一定要選一個 Web 端 ChatGPT 的套殼客戶端,那我愿稱?ChatGPT-Next?是個人助理之王。

它的作者不僅開發(fā)了這個 Web 端應(yīng)用,還開發(fā)了一鍵部署到 Vercel(前端托管服務(wù)器)的功能。也就是說只需一個 API key 和幾次單擊,每個人都能擁有自己的專屬 ChatGPT 客戶端,自用、團隊用或者作為服務(wù)提供給其他人,都像呼吸一樣簡單。

筆者成功將自己部署的客戶端發(fā)給了爸媽和姥姥,給他們帶去了一點小小的 AI 震撼,姥姥甚至高興地給我做了一大碗紅燒肉。

產(chǎn)品功能方面 ChatGPT-Next 也是集大成者,預(yù)設(shè)了 20 種人格和應(yīng)用場景,且支持自定義;高級參數(shù)方面,模型選擇 model、隨機性 tempeture、單次回復(fù)限制 max tokens 以及話題新鮮度 presence penalty,都可以根據(jù)需求場景精準(zhǔn)調(diào)節(jié)。同時對話管理中的歷史消息長度壓縮也堪稱王炸級別功能,能夠在上下文數(shù)量達到一定的 token 時對上下文進行總結(jié),并清除之前的記憶,有效減少 token 占用,讓對話更持久。最后其界面也是所有 app 中可自定義程度最高的,字體、語音、發(fā)送預(yù)覽、緊湊邊框,全部可以自定義。

論套殼類產(chǎn)品在功能豐富度和自定義程度方面,ChatGPT-Next 是各個方向中最強的,長期使用下來感受最好,使用 API 的速度也會比各種服務(wù)的官方速度更快,是生產(chǎn)力玩家的首選。

四、國內(nèi)大廠:生態(tài)迅速接入,創(chuàng)業(yè)公司更快一步

釘釘、飛書、微信作為國內(nèi)的三大辦公 IM 巨頭,截至目前都已經(jīng)有了非官方的開源 AI 機器人接入。國內(nèi)某創(chuàng)業(yè)公司通過開源社區(qū)的馬拉松項目,開發(fā)了基于釘釘、飛書的 AI 對話機器人矩陣,融合多模態(tài)(ChatGPT、DALL·E + Whisper、Midjourney)、圖片創(chuàng)作、表格分析、文檔導(dǎo)出、多話題討論、公式計算等等功能全部可以實現(xiàn)。甚至連 API 也是免費提供的,真正實現(xiàn)了賦能業(yè)務(wù),讓國內(nèi)打工人成為第一批無縫使用 AI 的選手。

在 ToB 功能方面,國內(nèi)創(chuàng)業(yè)公司應(yīng)該是走在了世界前列,已經(jīng)完成了產(chǎn)品化的開發(fā),并且可以根據(jù)企業(yè)情況快速部署,依托 IM 實現(xiàn)辦公的 AI 提效。一鍵快速部署、企業(yè)級的AI權(quán)限管理、用戶導(dǎo)入導(dǎo)出使用記錄、風(fēng)險詞攔截等,讓企業(yè)用戶順暢使用。

微信也有相應(yīng)的開源機器人,但由于微信平臺本身的限制,微信機器人的功能就限制較強了,基本也就是官方的功能移植到了微信對話框中。

據(jù)悉美團內(nèi)部也在進行對話機器人的接入,幫助員工提升工作效率。其小美助手內(nèi)置了多個量身定制的場景和 prompts,幫助員工能夠快速上手。整體體驗上與 ChatGPT 無異。

國內(nèi)其他模型大廠的官方客戶端整體都還在狂卷模型能以趕上 GPT-3 的水平,目前也都還處在遮遮掩掩的狀態(tài),想要獲得體驗資格的難度比成熟產(chǎn)品要高的多,因此暫且不做評論,但應(yīng)該可以確認不會有更令人驚喜的功能。

五、ChatGPT:App Store 登頂,移動 AI 時代到來

最后聊聊 ChatGPT 本尊。

5 月 18 日,ChatGPT 上線了 App Store 并迅速登頂 iOS 下載榜第一名。移動端的 ChatGPT 也是突出一個簡潔,但整體交互看得出來下了一些功夫:常規(guī)對話界面加入了回復(fù)的震動反饋,感覺到對面的 AI 真的在打字,體驗爆棚;同時左滑交互可以呼出對話管理功能,右滑交互能夠新開對話,邏輯清晰;整體使用的流暢程度也非常優(yōu)秀,比 Web 端的體驗好很多。

然而目前手機端的應(yīng)用場景非常有限,周圍的人也大多將其當(dāng)成 wiki 問答來用,沒有插件和聯(lián)網(wǎng)的加持,移動端目前并沒有太多應(yīng)用場景,而生產(chǎn)力場景 Web 端效率更高,協(xié)作也更加流暢——畢竟我不能上班的時候一直扣手機吧。

但 iOS 客戶端解決了 ChatGPT 充值 plus 難的痛點,可以通過 App Store 直接訂閱,讓不少用戶終于能夠方便地用上 GPT-4。

移動端的潛力當(dāng)然是巨大的,現(xiàn)在 ChatGPT 剛剛下場,但其戰(zhàn)略上的「我全都要」是可以窺探到的。在前有 Poe、Snapchat 移動端的情況下,ChatGPT 無疑讓移動端的競爭格局一下子不同了起來,未來會發(fā)展成什么樣子我們拭目以待。

六、小結(jié)

ChatGPT 帶來的 AI 變革將深刻改變社會的發(fā)展方向,現(xiàn)在是混沌的亂斗局面,大家都卯著勁想做出點什么。但模型又不是普通人能做的,所以出現(xiàn)了更多以場景應(yīng)用為主的產(chǎn)品,也給創(chuàng)業(yè)者和開發(fā)者們提供了許多 AI 應(yīng)用的思路。

另外本土化是另一個重要的課題,國內(nèi)大廠在進度上明顯落后,但應(yīng)用層已經(jīng)先行并且有了很多好用的產(chǎn)品,這將來也會是競爭最激烈同時機會最多的地方。乘上這波 AI 的大浪吧,不妨做一頭飛起來的豬。

最后歡迎關(guān)注 PandorAI,我們致力于幫助 AI 創(chuàng)業(yè)者獲得更多洞察。

本文由 @PandorAI 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于 CC0 協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 關(guān)注的所謂功能點還是在殼子上,這類產(chǎn)品核心功能是策略,即能問什么,會有什么特點的回復(fù)、效果好不好。

    來自北京 回復(fù)