a16z:巧用“幻覺”的應(yīng)用架構(gòu)思考
就在最近,a16z發(fā)布的文章里提出了“概率性產(chǎn)品”這一概念,那么,什么是“概率性產(chǎn)品”?在生成式AI的發(fā)展背景下,產(chǎn)品開發(fā)者、設(shè)計師們又該如何看待“概率性產(chǎn)品”的出現(xiàn)?一起來看看作者的解讀。
生成式 AI 作為一種概率計算機,能夠產(chǎn)生多樣且不確定性的輸出。這些多樣的輸出開啟了一個新的產(chǎn)品類別:概率性產(chǎn)品。a16z 最近發(fā)布文章提出“概率性產(chǎn)品”,并根據(jù)用戶對不確定性的接受度將產(chǎn)品分為三類。筆者希望借這篇文章帶來 Gen-AI 技術(shù)對產(chǎn)品設(shè)計和用例的思考,生成式 AI 的不確定性正在成為和用戶交互的變量。
生成式內(nèi)容不確定性下的三類產(chǎn)品:
受益于不確定性的產(chǎn)品/可容忍概率性輸出的產(chǎn)品/需要準(zhǔn)確輸出的產(chǎn)品。
1)當(dāng)我們還在詬病大模型會產(chǎn)生幻覺的時候,未曾想象概率性的不確定內(nèi)容恰恰會成為其區(qū)別于冰冷計算機的變量所在。生成式內(nèi)容的概率性像是賦予了 AI 以意識,更適用于與人更近的交互層和更需要創(chuàng)造力的領(lǐng)域(游戲、藝術(shù)創(chuàng)造、創(chuàng)新研究等)。
2)在 AI 的世界里,硬幣有了多面。在產(chǎn)品設(shè)計的不同架構(gòu)層或流程服務(wù)里,大模型的應(yīng)用會更組合模塊化,用模糊理解模糊,在非關(guān)鍵點上提供更多新鮮感,提取的信息在精確層上進行數(shù)理計算,相信會很快看到這樣的產(chǎn)品。
3)當(dāng)人的創(chuàng)造力枯竭,大模型成為早期的腦洞來源。然而像科學(xué)家異想天開的創(chuàng)造同樣需要依賴長期探索的積累,通過訓(xùn)練領(lǐng)域模型讓其產(chǎn)生更高質(zhì)量的不確定性內(nèi)容,是創(chuàng)業(yè)者值得思考的事情。
4)對于一個產(chǎn)品架構(gòu)而言,隨機與確定解決不同的問題,應(yīng)當(dāng)互補融合。平衡也是一門藝術(shù)。
生成式人工智能的一個顯著特點是它是“概率計算機”的首批產(chǎn)物,能夠產(chǎn)生多樣且非確定性的輸出。有些人期望這些系統(tǒng)表現(xiàn)得像傳統(tǒng)系統(tǒng)一樣,對其產(chǎn)生的“幻覺”提出了抱怨,然而,這些抱怨忽略了關(guān)鍵點。輸出的多樣性(包括幻覺)恰恰是這里的特別之處。事實上,它們開啟了一個全新的產(chǎn)品設(shè)計類別:概率性產(chǎn)品。
所謂概率性產(chǎn)品,指的是具有非確定性和經(jīng)常出現(xiàn)新特性的產(chǎn)品。社交網(wǎng)絡(luò)就是概率性產(chǎn)品的一個例子。這些網(wǎng)絡(luò)上出現(xiàn)的新行為通常是無法預(yù)測的,只能被觀察到。a16z 將產(chǎn)品類別和產(chǎn)品用例分為三類來思考:
- 受益于不確定性的產(chǎn)品;
- 可容忍概率性輸出,但不一定從不確定內(nèi)容收益的產(chǎn)品;
- 需要準(zhǔn)確性輸出的產(chǎn)品。
第一類是那些受益于不確定性的產(chǎn)品。比如像 Midjourney 和 Stable Diffusion 這樣的熱門圖像模型,它們之所以神奇,是因為它們會生成各種各樣的輸出。
這整個生成式媒體類別之所以能夠產(chǎn)生驚人的結(jié)果,正是因為平臺是非確定性的。
AI 伴侶類別也屬于這一組,因為產(chǎn)品的整體價值在于其與人類非常相似的不可預(yù)測的互動;失去非確定性的輸出將削弱產(chǎn)品體驗。該領(lǐng)域中的另一個例子可能包括輔助購物,因為 AI 提供的意外和不尋常的服裝推薦正是能夠塑造個人風(fēng)格和品味的關(guān)鍵。
第二類產(chǎn)品可以容忍概率性輸出,但不一定從平臺的非確定內(nèi)容中受益。例如,考慮那些生成現(xiàn)有內(nèi)容的產(chǎn)品,只要生成內(nèi)容的要點準(zhǔn)確無誤,生成內(nèi)容的方式變化通常是可以接受的。
舉個例子,預(yù)測數(shù)值(例如股票組合表現(xiàn))需要更高的準(zhǔn)確性,而生成書面內(nèi)容可以具有更大的變化范圍而不會損失價值。甚至代碼生成也能容忍一定的變化,只要代碼按預(yù)期工作即可。
最后,還有大量需要確定性輸出的用例。這些例子包括從財務(wù)預(yù)測到稅務(wù)計算再到駕駛路線等,基本上涵蓋了所有需要明確答案的領(lǐng)域。
我們還可以將個別產(chǎn)品分為根據(jù)對概率性輸出的容忍程度進行劃分的產(chǎn)品架構(gòu)。
例如,想象一個旨在幫助您申報稅務(wù)的 AI 助手。這樣的助手可以分為三個子系統(tǒng),各個子系統(tǒng)對底層平臺有不同的期望。
- 在人機交互界面,自帶不確定性基因的 LLM 能夠完成與用戶更彈性的聊天并收集用戶稅收相關(guān)信息。
- 其次,將用戶信息作為背景信息能夠作為稅務(wù)引擎輸入系統(tǒng),而對用戶背景信息的整理具有一定的包容性,可以接受不確定信息的輸入。
- 最后,實際的稅務(wù)計算可以且應(yīng)該在一個傳統(tǒng)引擎上完成,該引擎不受 LLM 的限制,從而確保輸出的準(zhǔn)確性。
一句話,新的計算架構(gòu)需要新的產(chǎn)品架構(gòu),LLM 和生成式 AI Pipeline 平臺的不確定性創(chuàng)造了獨特的機遇和要求,產(chǎn)品和用例在設(shè)計輸出多樣性時要仔細考慮。尤其對于產(chǎn)品研究者和設(shè)計師們,在利用并設(shè)計這些新功能的交互體驗時,需要認(rèn)真考慮這一點。
參考材料:https://t.co/MHEajKedFW
作者:Vela,Yihao,Leo
來源公眾號:深思SenseAI(ID:gh_a54fc6d3826c);關(guān)注全球 AI 前沿,走進科技創(chuàng)業(yè)公司,提供產(chǎn)業(yè)多維深思。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @深思SenseAI 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
說到底,概率性產(chǎn)品能否被接受還是要取決于其輸出是否對用戶有價值