范式的轉(zhuǎn)變:一個(gè)AI產(chǎn)品經(jīng)理對(duì)類ChatGPT產(chǎn)品形態(tài)的思考

3 評(píng)論 7694 瀏覽 32 收藏 34 分鐘
🔗 产品经理在不同的职业阶段,需要侧重不同的方面,从基础技能、业务深度、专业领域到战略规划和管理能力。

如今,AI已經(jīng)深入尋常百姓家,這個(gè)轉(zhuǎn)變,對(duì)于產(chǎn)品經(jīng)理來說更是一個(gè)設(shè)計(jì)產(chǎn)品范式得到根本性轉(zhuǎn)變。新一代的AI會(huì)帶來哪些新屬性呢?本文作者從產(chǎn)品/軟件設(shè)計(jì)的范式轉(zhuǎn)變、交互范式的轉(zhuǎn)變和PMF范式的轉(zhuǎn)變這3個(gè)維度,對(duì)LLM給我們帶來的影響進(jìn)行了分析,一起來看一下吧。

最近大家都很興奮,ChatGPT的出現(xiàn)帶火了知識(shí)博主,增加了變現(xiàn)機(jī)會(huì)。很多人都在討論LLM和AI infra,如何寫詩如何畫畫,真正討論應(yīng)用的很少,討論行業(yè)應(yīng)用的就更少了。但是看了YC去年的List后覺得AI-Native應(yīng)用的前景已經(jīng)非常明朗了,AI已經(jīng)深入尋常百姓家。這個(gè)普世的轉(zhuǎn)變,對(duì)產(chǎn)品經(jīng)理來說更是一個(gè)設(shè)計(jì)產(chǎn)品范式的根本性轉(zhuǎn)變,而這個(gè)轉(zhuǎn)變帶來的軟件設(shè)計(jì)模式(Design pattern)都會(huì)發(fā)生根本性的變化(后面我們會(huì)單獨(dú)討論)。

結(jié)論:

經(jīng)過在自己研發(fā)的產(chǎn)品上幾個(gè)月的試錯(cuò)和調(diào)整,我們也形成了行業(yè)軟件/SaaS對(duì)LLM能力的應(yīng)用的“Best” practice。我們將從以下幾個(gè)角度來探討。

  1. 產(chǎn)品/軟件設(shè)計(jì)的轉(zhuǎn)變,在這一部分我們要探討如何利用LLM的特性來改造我們?cè)械墓诺滠浖袠I(yè),我們哪些要LLM化,哪些要堅(jiān)守古典的結(jié)構(gòu)化思維。
  2. 交互范式的轉(zhuǎn)變,在這個(gè)部分我們要一起探討交互和用戶體驗(yàn)的大幅變化,如何利用LLM來大幅度降低使用成本,并大幅度提高使用體驗(yàn),古典和LLM怎樣融合,CUI是最終的交互形態(tài)么?或者說CUI的最終交互形態(tài)是什么?
  3. 產(chǎn)品的PMF范式的轉(zhuǎn)變,這個(gè)部分我們會(huì)把我們對(duì)LLM會(huì)從產(chǎn)品落地到用戶需求匹配,門檻降低帶來的競爭格局的變化,以及LLM會(huì)促進(jìn)什么樣的PMF,會(huì)打破什么樣的PMF。

讓我們首先來看一下LLM的能力和特性。

從 PC 到移動(dòng)設(shè)備,智能手機(jī)的新特性帶來了重大機(jī)遇,LBS 帶來了美團(tuán)和滴滴,通訊錄帶來了微信,Camera 帶來抖音和快手,語音帶來全民K歌,刷屏動(dòng)作帶來今日頭條。

與手機(jī)相比,微信的新特性是擴(kuò)大了通訊錄,使通訊錄中的聯(lián)系人數(shù)量增加了百倍,更能夠進(jìn)行面對(duì)面的溝通。正是這種能力的增強(qiáng)才使得拼團(tuán)、分銷、砍價(jià)成為可能,其中最大的應(yīng)用是拼多多。

那么,現(xiàn)在新一代的AI又帶來了哪些新屬性呢?我想到了一些,也歡迎大家補(bǔ)充。

首先是語言 language,自然語言的交互方式,很底層的人類交互手段。

其次是生成式的交互方式 generative,它能夠以人類易于理解的方式進(jìn)行實(shí)時(shí)生成。從生成文本和代碼,到圖像、聲音和視頻,甚至未來會(huì)生成機(jī)器人的動(dòng)作。

第三是多模態(tài),輸入input/輸出output 變得極為豐富,但豐富也意味著極為不可控。

從工程角度來看,實(shí)際上是對(duì)一些專業(yè)概念進(jìn)行了對(duì)應(yīng),以便于產(chǎn)品經(jīng)理和研發(fā)人員的理解。

  1. 輸入request,現(xiàn)在系統(tǒng)可以理解直接的對(duì)話了,你說什么它都能理解,或者裝作理解。這樣系統(tǒng)的輸入方式和形式以及效率都會(huì)得到大幅度的提升。但是系統(tǒng)邏輯不一定是最優(yōu)的,或者效率最高的。
  2. 輸出response,輸出的內(nèi)容產(chǎn)生了極大的不確定性,雖然可能是更好的輸出,但是不可控性增強(qiáng),原來返回的數(shù)據(jù)都是預(yù)設(shè)的,根據(jù)返回值要調(diào)用函數(shù)的,現(xiàn)在要用新的辦法來解決,我預(yù)判未來在這部分會(huì)產(chǎn)生很多的中間件產(chǎn)品,可能以開源的為主。
  3. 數(shù)據(jù)格式data format,數(shù)據(jù)格式可以是各種媒體格式,就算是文本也可能是組織好的表格,同樣增加了顯示層的設(shè)計(jì)和實(shí)現(xiàn)的難度,這塊我就不展開了,但是后續(xù)還會(huì)基于這部分內(nèi)容延展出更加有意思的思考和話題。

基于以上內(nèi)容,我來拋個(gè)磚,4個(gè)月前開始考慮LLM對(duì)于我們的影響以及如何擁抱并形成或擴(kuò)大自身產(chǎn)品的差異和壁壘。經(jīng)過這4個(gè)多月的時(shí)間,很多原來的工作習(xí)慣被迭代,很多原來的認(rèn)知被重置,很多原來的范式被改變。不夸張的說,這可能是,或者至少是科技行業(yè)的“人類的群星閃耀時(shí)”,而且后續(xù)也將影響更多行業(yè)和從業(yè)者。下面我們從三個(gè)維度來具體分析一下。

一、產(chǎn)品/軟件設(shè)計(jì)的范式轉(zhuǎn)變

基于以上的特性,SaaS/軟件行業(yè)對(duì)AI的垂直integration,我預(yù)想大概是可以分成三步,每一步都比上一步更深入,對(duì)AI模型能力的使用也更充分。

1. 知識(shí)類

第一步是知識(shí)庫類功能的整合,訓(xùn)練或者fine-tune自己的模型,用一些內(nèi)部或者行業(yè)的knowhow,可以用開源模型,也可以用商業(yè)化模型,這個(gè)其實(shí)不重要,重要的是內(nèi)部結(jié)構(gòu)化數(shù)據(jù)和行業(yè)knowhow以及best practice的提煉和抽象。

比如Gonex的AI全球HR合規(guī)引擎IRIS,HR可以每天基于對(duì)全球HR法律法規(guī)以及全球各行各業(yè)HR最佳實(shí)踐進(jìn)行檢索,并對(duì)自己的任務(wù)進(jìn)行分解和實(shí)現(xiàn)。

就目前而言,AI 更適用于一些需要或者近似于閱讀理解類的預(yù)期結(jié)果,而已經(jīng)被結(jié)構(gòu)化的事實(shí)類內(nèi)容在現(xiàn)在已經(jīng)被索引過,使用傳統(tǒng)的方法可以實(shí)現(xiàn)高效率,并且對(duì)算力的要求也低得多。但并不是所有的任務(wù)都適合使用 AI,因?yàn)橛行┤蝿?wù)用 AI 完成的效率并不一定高,比如查詢中國的最低年假。在這種情況下,直接從本地?cái)?shù)據(jù)庫檢索可能更加高效,對(duì)算力的要求也更低。因此,在選擇使用 AI 還是傳統(tǒng)方法完成任務(wù)時(shí),我們需要具體考慮任務(wù)類型和預(yù)期結(jié)果,避免浪費(fèi)。

2. 工作/業(yè)務(wù)流

第二步是利用AI的識(shí)別和推斷進(jìn)行任務(wù)和功能的調(diào)度。

利用AI都予以理解和上下文能力,實(shí)現(xiàn)更流暢的用戶體驗(yàn),逐步替換掉傳統(tǒng)的線性多級(jí)的工作流,實(shí)現(xiàn)一步到位的功能或者任務(wù)的調(diào)度。

比如我要查一下自己的工資,我到登陸系統(tǒng),點(diǎn)開我的(my account), 查看工資單,選擇某一個(gè)月或者當(dāng)月,然后顯示自己的工資單,這些步驟是傳統(tǒng)的線性工作流。AI可以替代這些工作流,直接問一下我的工資,返回具體的工資數(shù)據(jù)。如果需要更多交互,可以打開完整功能。

很多流程會(huì)從線性的變成星形的。

線行流程配圖

星型流程配圖

大多數(shù)功能都可以用類似的方式完成調(diào)度,只有極少數(shù)需求需要權(quán)限和分組等功能在授權(quán)的時(shí)候需要一些傳統(tǒng)的驗(yàn)證和流程,其他的應(yīng)該都可以滿足需求。這個(gè)就需要要對(duì)功能做基于語意和上下文分析的mapping,相當(dāng)于做配置文件以及對(duì)prompts的管理,需要把語意的分析抽象到具體的功能。而業(yè)務(wù)邏輯依然依靠現(xiàn)有的系統(tǒng)來完成。

個(gè)人覺得替代工作流更像一個(gè)trade off是兼容之前的古典軟件設(shè)計(jì)范式,而不是新的范式,新的范式是下面的第三步,完全的業(yè)務(wù)邏輯AI化。

3. 復(fù)雜業(yè)務(wù)邏輯

第三步是利用AI來整合業(yè)務(wù)邏輯(甚至整個(gè)SaaS的業(yè)務(wù)邏輯就是依靠AI,而不需要重新定義和開發(fā)),而不僅是進(jìn)行功能和數(shù)據(jù)的調(diào)度。

LLM會(huì)逐步的部分或者全部替代掉SaaS的業(yè)務(wù)邏輯,但是傳統(tǒng)的業(yè)務(wù)邏輯是不是更高效這點(diǎn)需要針對(duì)不同的業(yè)務(wù)邏輯單獨(dú)的比較和驗(yàn)證。

而且很多業(yè)務(wù)邏輯用自然語言描述和用數(shù)學(xué)函數(shù)描述效率并不一樣,因?yàn)樽匀徽Z言對(duì)復(fù)雜功能的描述其實(shí)不如直接抽象出來的邏輯和算法更高效,而且自然語言本身也需要被轉(zhuǎn)換成機(jī)器能理解的邏輯和算法才可以被機(jī)器識(shí)別和運(yùn)行。

不過有一些傳統(tǒng)業(yè)務(wù)功能的局限卻可以用自然語言的形式來實(shí)現(xiàn),比如輸入基礎(chǔ)考勤和稅務(wù)信息根據(jù)每個(gè)國家工資的算法進(jìn)行月度工資的計(jì)算是非常復(fù)雜的邏輯和算法,用自然語言是不容易實(shí)現(xiàn)的,但是基于這個(gè)算薪結(jié)果進(jìn)行比較又是用傳統(tǒng)的邏輯和算法無法完成的,而一般都需要人為的查詢和比較,并解釋。

例如:請(qǐng)問為什么上個(gè)月工資和這個(gè)月差這么多?

產(chǎn)品原型圖截圖

這個(gè)功能如果用傳統(tǒng)的方式是無法實(shí)現(xiàn)的,但是用LLM似乎是可以實(shí)現(xiàn)的,但是需要把現(xiàn)有系統(tǒng)的數(shù)據(jù)和算法給到模型并訓(xùn)練才有可能。

基本上做到了第三步才是真正的用AI/LLM來定義和實(shí)現(xiàn)完整的軟件功能和邏輯,而不僅是交互方面的調(diào)度,我覺得可能在相當(dāng)長的一段時(shí)間內(nèi)都是用第二步和第三步之間的方式來實(shí)現(xiàn)軟件/SaaS的AI/LLM化,而不是Native AI/LLM軟件/SaaS。

關(guān)于LLM:

除了大家現(xiàn)在比較關(guān)心的基礎(chǔ)LLM外,未來可能會(huì)有很多的LLM:

  • 從業(yè)務(wù)場景的角度會(huì)有,比如完成電商業(yè)務(wù)的模型,完成ERP業(yè)務(wù)的模型,完成CRM業(yè)務(wù)的模型等。
  • 從知識(shí)的專業(yè)性角度可能會(huì)有,比如HR行業(yè)模型,財(cái)務(wù)行業(yè)模型,法務(wù)行業(yè)模型等。
  • 從數(shù)據(jù)私有性的角度,可能還有各個(gè)公司/組織自己的LLM,當(dāng)然也可以基于開源LLM來搭建。甚至也會(huì)由于數(shù)據(jù)合規(guī)性的考慮會(huì)出現(xiàn)個(gè)人LLM。

每個(gè)模型都抽象了很多的業(yè)務(wù)邏輯,而這些業(yè)務(wù)邏輯是依靠LLM來完成功能的實(shí)現(xiàn)的,針對(duì)這些業(yè)務(wù)邏輯都需要對(duì)模型進(jìn)行單獨(dú)的訓(xùn)練,而不是簡單的用一個(gè)超大泛化模型可以實(shí)現(xiàn)的(除非超大模型用各行各業(yè)的數(shù)據(jù)進(jìn)行訓(xùn)練和修改,這樣其實(shí)對(duì)于基礎(chǔ)模型可能是非常不經(jīng)濟(jì)的,不過也可能跟軟件行業(yè)一樣,很多軟件公司的增長也是通過收購和整合來實(shí)現(xiàn)的)。

未來的LLM可能的分層形態(tài):

二、交互范式的轉(zhuǎn)變

交互方式的改變,從抽象流程到自然語言,conversational user interface(CUI)。

實(shí)際上人類日常的最自然的交互方式就是肢體語言,表情和對(duì)話,而古典軟件都是靠業(yè)務(wù)流程抽象化來完成目標(biāo)任務(wù)的,而LLM的方式可以從更貼近于人類習(xí)慣的方式使用軟件功能,因此極大的降低了學(xué)習(xí)成本,未來的AI Native行業(yè)軟件大概率是類似的這樣的三段式 three stages CUI.

  • 左側(cè)是傳統(tǒng)的抽象流程的快捷方式。
  • 中間是對(duì)話功能框,未來很多的工作流都是基于對(duì)話和上下文在對(duì)話框里直接完成的。
  • 右側(cè)是功能調(diào)用,限制于對(duì)話框的大小不容易完成的操作可能還是要有一個(gè)地方呼出并實(shí)現(xiàn)操作。
  • 左側(cè)和右側(cè)會(huì)隨著LLM的進(jìn)化逐步弱化或者消失。
  • 中間的對(duì)話框的下一代 conversational user interface會(huì)隨著多模態(tài)的發(fā)展,或許更多的輸入格式,比如攝像頭來收集body language,表情等更底層的交流,麥克風(fēng)來收集不僅是對(duì)話,還有環(huán)境音。

因此我認(rèn)為未來可能會(huì)爆發(fā)的移動(dòng)設(shè)備并且可以一定程度替代掉手機(jī)的,就是具有邊緣計(jì)算能力的LLM,耳機(jī),現(xiàn)在的耳機(jī)已經(jīng)可以透明收聲,如果耳機(jī)具有一定的LLM能力,《Her》的電影場景就可以實(shí)現(xiàn)了,基于語音的交互是最自然的對(duì)話。關(guān)于耳機(jī)的暢想我們可以后面進(jìn)一步討論。

我們現(xiàn)在用簡單的示例來解釋一下以上ChatGPT在軟件工程以及CUI設(shè)計(jì)上的一些基礎(chǔ)邏輯:

首先為什么是three stages,三段式設(shè)計(jì),不光是PC,其實(shí)在移動(dòng)設(shè)備上也是一樣,因?yàn)槿绻徊贿^根據(jù)屏幕大小很多內(nèi)容是折疊起來的,但是大概率都要有這三段:

  1. 快捷方式,用古典的方式可以找到古典的邏輯,主要為了幫助用戶適配古典邏輯,但是古典邏輯會(huì)存在多久,這個(gè)不好說,也可能要很久。畢竟也有很多時(shí)候自然語言不一定是效率最高的方式。
  2. 中間是CUI,主要的交互和任務(wù)都在這里完成。
  3. 右側(cè)的部分是一些無法在對(duì)話框里完成的任務(wù)或者目標(biāo),比如顯示的不全,比如需要單獨(dú)的視圖等。

比如在GONEX-IRIS這個(gè)工資查詢的場景下,用戶需要調(diào)用一些本地?cái)?shù)據(jù),而對(duì)話框只能顯示一部分,如果回答太長,用戶容易miss掉上下文,因此需要有個(gè)地方單獨(dú)呼出,右側(cè)就是一個(gè)比較理想的方式。當(dāng)然也不一定是左右的形態(tài),也可以是下上,或者上下的形態(tài)。

中間的對(duì)話框不止是一個(gè)傳統(tǒng)軟件的rich text area,這里包含的很多的元素,類似微信對(duì)話框里不同的format,比如一個(gè)網(wǎng)頁、一個(gè)文件、一個(gè)小程序,其實(shí)企業(yè)微信和叮叮也都有類似的設(shè)計(jì),只不過通訊/協(xié)同軟件更多的還是人和人對(duì)話。

而現(xiàn)在的對(duì)話框不再是或者不僅限于人和人了,更多的是人和LLM,對(duì)話框里要可以顯示和處理更多的格式,比如微信不支持markdown(因?yàn)檎H瞬粫?huì)用這種格式跟別人交互),現(xiàn)在需要支持更多的文本格式,因?yàn)橛脩舨粌H是要在對(duì)話框里完成對(duì)話,更重要的是要在對(duì)話框里完成任務(wù),完成指令,而不只是把對(duì)話框當(dāng)作信息的傳遞,具體的任務(wù)要跳出對(duì)話。

比如,我要查steve的工資,LLM會(huì)返回給我工資的具體內(nèi)容,比如我問LLM有什么的需要審批的工作,LLM直接給我返回5個(gè)審批列表,我可以直接在對(duì)話框里審批。比如我要LLM幫我請(qǐng)假,但是一些具體請(qǐng)假原因和流程都要在對(duì)話框里完成。

對(duì)于CUI,我認(rèn)為未來的交互可能不僅僅是typing,還有聲音,圖像/視頻等輸入形式。人類科技最大目標(biāo)就是模仿人類自己,機(jī)器總要加個(gè)“人”在后面,是為機(jī)器人。而AI的目標(biāo)是最大限度的讓用戶感覺坐在對(duì)面跟你對(duì)話的是人,而不是機(jī)器。因此我們應(yīng)該不僅限于打字,因?yàn)榇蜃直旧硎怯蠵C了以后才有的形式,幾千年的人類溝通方式是語音。

因此我自己做的是行業(yè)軟件,但我依然認(rèn)為未來最大機(jī)會(huì)是更自然的溝通方式是voice,因此在UI和工程領(lǐng)域如何更快的把rich text area這個(gè)component變成 rich voice area component是更底層的更有意思的機(jī)會(huì),甚至可以支持手勢,表情等,更多的輸入形式從而變成rich communication area component,這也是我思考了很久的領(lǐng)域,現(xiàn)在已經(jīng)有了結(jié)論,不過我們就不在這里展開了。

這里我依然要老生常談的一個(gè)點(diǎn)是,古典軟件工程更重要的是基于任務(wù)和流程的抽象,而LLM的產(chǎn)品要基于對(duì)話,對(duì)話不僅是文字也可以是很多其他的模態(tài)或者格式。因此這個(gè)是產(chǎn)品設(shè)計(jì)范式的轉(zhuǎn)變。iPhone的早期,很多人吐槽當(dāng)點(diǎn)iPhone上的app都很PC,直到有的app用手勢gesture來做交互才逐漸有了現(xiàn)在的樣子。AI-Native的軟件也是一樣,都要有這個(gè)過程,這個(gè)過程不會(huì)很久,正在發(fā)生。

三、PMF范式的轉(zhuǎn)變

從蒸汽機(jī)開始替代一些體力勞動(dòng)者開始,社會(huì)的演進(jìn)就變成了人要操作機(jī)器,因此人要受教育,學(xué)更多的知識(shí),然后用這些知識(shí)去操作效率更高的機(jī)器。機(jī)器取代了一些初級(jí)的勞動(dòng)者,而大家踴躍通過教育變成高級(jí)的勞動(dòng)者去操作和管理機(jī)器,這樣就形成了一個(gè)正向的循環(huán)。

突然之間,ChatGPT的出現(xiàn),讓大家對(duì)這個(gè)社會(huì)秩序迭代的公式產(chǎn)生了動(dòng)搖。但是如果大家看過那段資本主義萌芽的歷史就知道,當(dāng)時(shí)的人們其實(shí)也找不到這個(gè)現(xiàn)在大家公認(rèn)的路徑,大量的工人失業(yè),社會(huì)甚至還造成了某種程度的動(dòng)蕩。但是后續(xù)的故事我們都已經(jīng)知道。所以大家一定要?jiǎng)討B(tài)的看問題,焦慮往往是人類對(duì)未知的恐懼形成的潛意識(shí),靜態(tài)的思維方式和常規(guī)的套用往往會(huì)加速這種潛意識(shí)的形成。

因此用所謂動(dòng)態(tài)的站在歷史的角度出發(fā)的思考,AGI確實(shí)會(huì)取代一些初級(jí)的腦力勞動(dòng)(機(jī)械的腦力勞動(dòng),甚至知識(shí)/事實(shí)的學(xué)習(xí)),但是用新的教育方式來產(chǎn)生創(chuàng)造性的思維,就可以指揮或者操作AI來提升效率,我們的教育體系也會(huì)從知識(shí)灌輸變成思考方式和創(chuàng)造潛力的涌現(xiàn),教育出來的這些四有新人再去創(chuàng)造更高維的AGI。

就好像沒有蒸汽機(jī)就沒有機(jī)械工,沒有電腦就沒有程序員,那么出現(xiàn)了AGI會(huì)不會(huì)就出現(xiàn)了新的職業(yè)呢?(也許就是prompt engineer,誰知道呢)

討論完以上的論述,再看看那些特性適合你現(xiàn)有的用戶場景。

如前所述,操作系統(tǒng)的機(jī)會(huì)只有少數(shù)人,但是應(yīng)用的機(jī)會(huì)是給大多數(shù)人的,而對(duì)于LLM而言,上層的應(yīng)用形態(tài)是多樣的,但是不是所有形態(tài)都是適合應(yīng)用層的。

現(xiàn)在看來,不論2B和2C:

  1. 只要你的數(shù)據(jù)是公開的,泛行業(yè)的,你的替代性就越高。
  2. 只要你的value只是線上薄薄的一層,哪怕再高的知識(shí)密度,你的可替代性也不會(huì)很低。

這里說的可替代性就是被LLM的進(jìn)化替代。當(dāng)然LLM自身的競爭不在考慮范圍內(nèi)。

因此2C/2B級(jí)別的應(yīng)用,如果你的交付是純信息的形式,開放形式的,范知識(shí)類的,那么長期看大概率都是有風(fēng)險(xiǎn)的。如果你的交付不是純信息類的,是封閉的,是專有知識(shí)類的,那么長期看是非常有價(jià)值的,不僅沒有風(fēng)險(xiǎn),而且LLM會(huì)大幅度的提高你的生產(chǎn)效率。

基于以上的場景和分析。

1. 從模型的角度

除了大家現(xiàn)在比較關(guān)心的基礎(chǔ)通用型LLM外,未來可能會(huì)有很多的行業(yè)/場景型LLM。

從業(yè)務(wù)場景的角度會(huì)有,比如完成電商業(yè)務(wù)的模型,完成ERP業(yè)務(wù)的模型,完成CRM業(yè)務(wù)的模型等。

從知識(shí)的專業(yè)性角度可能會(huì)有,比如HR行業(yè)模型,財(cái)務(wù)行業(yè)模型,法務(wù)行業(yè)模型等。

從數(shù)據(jù)私有性的角度,可能還有各個(gè)公司/組織自己的LLM,當(dāng)然也可以基于開源LLM來搭建。甚至也會(huì)由于數(shù)據(jù)合規(guī)性的考慮會(huì)出現(xiàn)個(gè)人LLM和邊緣LLM。

每個(gè)模型都抽象了很多的業(yè)務(wù)邏輯,而這些業(yè)務(wù)邏輯是依靠LLM來完成功能的實(shí)現(xiàn)的,針對(duì)這些業(yè)務(wù)邏輯都需要對(duì)模型進(jìn)行單獨(dú)的訓(xùn)練,而不是簡單的用一個(gè)超大泛化模型可以實(shí)現(xiàn)的(除非超大模型用各行各業(yè)的數(shù)據(jù)進(jìn)行訓(xùn)練和修改,這樣其實(shí)對(duì)于基礎(chǔ)模型可能是非常不經(jīng)濟(jì)的,不過也可能跟軟件行業(yè)一樣,很多軟件公司的增長也是通過收購和整合來實(shí)現(xiàn)的)。

跟AI 1.0的狀態(tài)差不多,可能有很多垂類模型,也有很多行業(yè)模型,當(dāng)然也有可能出現(xiàn)AI四小龍或者N小龍的情況,因?yàn)楹芏鄶?shù)據(jù),比如比銀行數(shù)據(jù),火車數(shù)據(jù),民航數(shù)據(jù),都不可能被放到公有LLM上,還是要在自己的私有LLM才可行。

2. 從平臺(tái)的角度

LLM還解決不了線下交付的問題,理論上只要不是專有數(shù)據(jù),LLM的用戶體驗(yàn)可能會(huì)產(chǎn)生一些虹吸效應(yīng),讓用戶更多的訪問LLM而不是傳統(tǒng)的平臺(tái),平臺(tái)當(dāng)然可以自己做LLM,但是投入和效果上不一定比類似的百度的或者泛化LLM更有優(yōu)勢。

個(gè)人感覺如果百度未來的搜索結(jié)果可以放更多的軟廣,在上下文中,讓用戶更加接受,而不是現(xiàn)在的搜索廣告形式。但是傳統(tǒng)的對(duì)話方式的微信可能可以更軟,畢竟它可以直接做個(gè)人助理,助理就是個(gè)人的推薦引擎。

當(dāng)然比如對(duì)于專業(yè)的訂票,旅游,吃飯類的平臺(tái)可能就是比較負(fù)面的例子了,因?yàn)槠脚_(tái)只需要或者只能做交付,平臺(tái)的議價(jià)空間就更少了,但是不擁抱共有LLM也不行?,F(xiàn)在在百度上只是做廣告買流量,后面百度通過文心一言的小程序或者Plugin直接就把前置的所有事情都干了,只需要下單API。不過這個(gè)完全是個(gè)人腦爆,畢竟旅游行業(yè)的供應(yīng)鏈管理是相當(dāng)復(fù)雜和高壁壘的,我們有相當(dāng)長的時(shí)間可以觀察,思考和應(yīng)對(duì)。

總體上講,LLM對(duì)未來的或現(xiàn)存的平臺(tái)類應(yīng)用是比較負(fù)面的。原因是如果出現(xiàn)超級(jí)LLM,那LLM本身就有是平臺(tái),對(duì)現(xiàn)有平臺(tái)產(chǎn)品來說可能會(huì)損失品牌,躲到LLM后面,淪為工具,但不管怎么樣,平臺(tái)還是應(yīng)該擁抱LLM,利用好LLM的能力,也可能走出一條不一樣的路。

對(duì)初創(chuàng)公司反而是有利的,降低的競爭的門檻,增加了市場的活力,流量的獲取更加的容易,而初創(chuàng)公司可以專注在專業(yè)范疇內(nèi)。

所以符合私有數(shù)據(jù)和線下交付中的一項(xiàng)的LLM應(yīng)用已經(jīng)很有生命力了,符合兩項(xiàng)的又有專有數(shù)據(jù)又有線下交付的應(yīng)用肯定是極大的利好,線下交付的能力不是短時(shí)間可以培養(yǎng)出來的。其實(shí)很多應(yīng)用會(huì)產(chǎn)生大量的專有數(shù)據(jù),比如購物網(wǎng)站產(chǎn)生的用戶購買行為和偏好,比如社交應(yīng)用產(chǎn)生的用戶行為和交互的偏好,這些其實(shí)都有很大的價(jià)值,LLM其實(shí)是反向逼迫大家來審視自己的數(shù)據(jù)資產(chǎn),以及如何更好的利用它。

3. 從交互的角度

盡管我之前提到了交互式用戶界面(Conversational UI),這種界面最自然的表現(xiàn)形式仍然是對(duì)話(conversation)。如果這樣想的話,微信可能會(huì)成為下一個(gè)時(shí)代的王者,甚至可以取代百度,因?yàn)槿藗兛梢栽谖⑿派辖鉀Q所有問題,包括像對(duì)話一樣自然的搜索,而不需要切換功能和場景。

然而,如果只考慮到這一點(diǎn),那么你對(duì)于使用場景的了解可能還不夠深入。因?yàn)樽畲蟮牟町愂?,微信是與人進(jìn)行交流,而新的交互方式是與語言模型進(jìn)行對(duì)話。在這種對(duì)話場景中,聊天和表達(dá)情感只是場景的一部分,更多的場景涉及任務(wù)下達(dá)、目標(biāo)達(dá)成、情況分析和模式識(shí)別等工作,這些任務(wù)的業(yè)務(wù)邏輯比傳統(tǒng)的聊天要復(fù)雜和抽象得多。因此,解決這些問題需要依靠對(duì)話式用戶界面(CUI)的發(fā)展,我相信很快就會(huì)出現(xiàn)AI的類似于iPhone誕生后的Gesture時(shí)刻。

從個(gè)人的角度,我覺得CUI的可見模式還是會(huì)長期存在的,畢竟很多的場景都是需要操作的,但是我更進(jìn)一步的認(rèn)為LLM的Gesture時(shí)刻可能不是在可見的部分,而是源于人類更底層更自然的溝通方式,conversation最初的方式并不是typing,而是聲音,用嘴發(fā)聲,用耳朵收聲。我覺得未來的會(huì)有一波重大的突破在耳機(jī)上,耳機(jī)可能會(huì)取代或者部分替代現(xiàn)有的手機(jī),而且手機(jī)也是可移動(dòng)的設(shè)備,比手機(jī)還自然的攜帶體驗(yàn),具備各種傳感器的能力,手機(jī)能有的傳感器,耳機(jī)都可以有。耳機(jī)不再只有降噪這個(gè)賣點(diǎn),而是交互的終端,是conversation的承載,是任務(wù)指令的下達(dá)?,F(xiàn)在的耳機(jī)已經(jīng)可以透明收聲,如果耳機(jī)具有一定的邊緣LLM能力,《Her》的電影場景就可以實(shí)現(xiàn)了,基于語音的交互是最自然的對(duì)話。

4. 主動(dòng)與被動(dòng)

其實(shí)大家日常使用的AGI應(yīng)用無論2B還是2C,幾乎所有的場景下的應(yīng)用都是被動(dòng)呼出的,也就是說都用戶提出問題,LLM被動(dòng)回答。用戶是initiator,這就造成了使用場景相對(duì)單一。但是反過來想一下日常的對(duì)話都是自己發(fā)起的么?顯然不是,實(shí)際生活中不同的場景,很多都是用戶是被動(dòng)應(yīng)答的。微信之所以使用時(shí)間長,并不是因?yàn)楸榷兑粲懈5某两酵扑]算法,而是因?yàn)槟愕闹鲃?dòng)是對(duì)方的被動(dòng),對(duì)方的主動(dòng)是你的被動(dòng),通訊錄聯(lián)系人互相成為對(duì)方的initiator。

因此AGI的出現(xiàn),就可以根據(jù)設(shè)備的感知能力主動(dòng)發(fā)起對(duì)話,比如中午,可以問用戶吃了么,沒吃趕緊吃,想吃啥附近直接找到,并導(dǎo)航到餐館。主動(dòng)發(fā)起對(duì)用戶體驗(yàn)來說是一個(gè)很大的飛躍,(這里主動(dòng)發(fā)起不是類似手機(jī)的push msg)尤其是情感領(lǐng)域,被動(dòng)和主動(dòng)區(qū)別很大,大多數(shù)國人在現(xiàn)代社會(huì)中都是社交被動(dòng)型的,社牛太少了。很多傳統(tǒng)的社交軟件也都在利用數(shù)據(jù)來降低社交成本,比如點(diǎn)個(gè)贊,比如用手滑照片。如果能通過耳機(jī)+各種sensors,還有環(huán)境音的透明收聲,則可以有更多的應(yīng)用場景被挖掘出來。而不僅是任務(wù)型或者事務(wù)性的應(yīng)用場景。

寫在最后

以上都是我?guī)讉€(gè)月以來的思考在當(dāng)下這個(gè)時(shí)間點(diǎn)的總結(jié),未來會(huì)發(fā)生什么,也很可能會(huì)推翻現(xiàn)有的結(jié)論甚至思考框架,未來一定是薛定諤的貓,LLM這個(gè)變量將讓很多人的思考框架發(fā)生了巨大的變化。在這個(gè)Sternstunden der Menschheit,我們可能有的只是時(shí)間。

浪潮中,有些人追求宏大的敘事,有些人忙于性感的故事,有些人揮起鋒利的鐮刀。面對(duì)誘惑大多數(shù)人都會(huì)放棄堅(jiān)守,但我還是希望大家在設(shè)計(jì)產(chǎn)品時(shí)問自己一個(gè)問題,我的產(chǎn)品能不能帶來10倍體驗(yàn)提升,能不能帶來10倍成本的降低,普通人只能點(diǎn)滴的改變。Make a better life for all people and their families.

關(guān)于GONEX- IRIS:

GONEX-IRIS是全球首創(chuàng)的AI Native的人工智能HR合規(guī)服務(wù)引擎,可以幫助HR團(tuán)隊(duì)輕松應(yīng)對(duì)日益增長的挑戰(zhàn),提高工作效率和便利性。我們的LLM大模型可以利用自然語言處理技術(shù)快速處理各種HR數(shù)據(jù),并自動(dòng)化處理各種復(fù)雜的海外HR流程,如入職、離職,算薪,發(fā)薪,社保繳納等。同時(shí),我們還可以利用機(jī)器學(xué)習(xí)進(jìn)行員工滿意度和工作績效分析,提供數(shù)據(jù)驅(qū)動(dòng)的洞察和建議。

使用GONEX-IRIS,您可以在幾秒鐘內(nèi)獲得關(guān)于海外員工雇傭、福利等方面的專業(yè)建議,而無需倒時(shí)差或花費(fèi)大量資金雇傭當(dāng)?shù)貙<?咨詢公司。我們的服務(wù)涵蓋從高端咨詢到日常服務(wù),幫助您快速解決業(yè)務(wù)問題,從而實(shí)現(xiàn)更高的工作效率和便利性。GONEX-IRIS還可以讓您成為一個(gè)全球HR問題專家,幫助您從事事求人的HR文盲秒變專業(yè)的HR領(lǐng)域?qū)<摇?/p>

作者:溫夢(mèng)飛,郵箱:mengfei@letsgonex.com

本文由 @溫夢(mèng)飛 投稿發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 很牛,讀完收獲很多

    來自四川 回復(fù)
  2. 你的這篇文章寫的挺好,就是中英夾雜有翻譯成本,閱讀體驗(yàn)有點(diǎn)差

    來自廣東 回復(fù)
  3. 寫的很專業(yè)的

    來自上海 回復(fù)
专题
14362人已学习10篇文章
聚合支付作为对银行和第三方支付平台服务的拓展,能够提供多渠道支付方式,简化商家的支付对接。本专题的文章分享了聚合支付的设计思路。
专题
13895人已学习12篇文章
本专题的文章分享了供应链系统设计指南。
专题
13601人已学习12篇文章
本专题的文章分享了CRM的入门知识,分享了CRM是什么。
专题
43314人已学习21篇文章
优惠券的知识点非常丰富,而且随着运营方式的增多, 不同运营目标所使用的优惠券也是不一样的。
专题
16614人已学习12篇文章
供应链管理系统是最早期面向企业的软件解决方案之一,供应商管理又是供应链链条中的上游部分。本专题的文章分享了供应商管理设计指南以及供应链的基础知识。