誰在布局生成式AI?

0 評論 8906 瀏覽 37 收藏 25 分鐘
B端产品经理要负责对目标行业和市场进行深入的分析和调研,了解客户的需求、痛点、期望和行为,找到产品的价值主张 🔗

本文概述了生成式人工智能(Generative AI或AIGC)的起源和發(fā)展歷程,特別強調了文生圖應用和ChatGPT對其發(fā)展產生的重要推動作用,并從大模型生態(tài)構建和行業(yè)應用兩個方面剖析了其商業(yè)應用前景和技術挑戰(zhàn)。

縱覽生成式人工智能(Generative AI或AIGC,兩種表述均可,國內更多用AIGC)進化史。從AI誕生之始,人們就試圖讓機器生成內容,與其對話,并誕生了最早的圖靈測試標準。

多年來,生成式AI的發(fā)展一直不溫不火。直到去年Midjourney、Stable Diffusion等文生圖應用點燃了大眾的熱情,再到11月ChatGPT的橫空出世,更是引發(fā)了現象級熱潮,讓生成式AI走入了億萬用戶的視野。

本文結合國際企業(yè)實踐經驗,從大模型生態(tài)構建方式、行業(yè)應用的切入路徑這兩個視角切入,描繪生成式AI的行業(yè)應用版圖,分享我們初步的觀察與思考。

一、大模型的生態(tài)

1. 模型即服務(MaaS)的新生態(tài)加速形成

結合目前行業(yè)“基礎設施層-模型層(MaaS)-應用層”三層結構,我們預計未來可能形成一個模型即服務(MaaS)的新生態(tài)。

自下而上,三層結構的構成如下:

  1. 基礎設施層:GPU芯片、AI芯片、超級計算機等算法基礎設施,以及機器學習框架、云操作系統(tǒng)等軟件。
  2. 模型層(MaaS):通用AI大模型,以及基于大模型在垂直領域訓練生成的行業(yè)模型(中間層),即在預訓練AI大模型基礎上,可以快速微調或使用嵌入等方式、開發(fā)出場景化、定制化、個性化的中小模型,實現在不同行業(yè)、垂直領域、功能場景的工業(yè)流水線式部署,同時兼具按需使用、高效經濟的優(yōu)勢。
  3. 應用層:AIGC技術面向終端用戶帶來的新的功能、產品、服務和應用等;正如之前的“互聯(lián)網+”一樣,“AIGC+”或者說“AI+”將來有望和各行各業(yè)深度結合,持續(xù)帶來新的應用形式。未來,一方面,現有的APP都可以用大模型重做一遍,另一方面,還會出現更多新的AI原生類APP,從而誕生更多新的獨角獸甚至巨頭企業(yè)。

2. 大模型走向通用性和垂直性并重的縱深布局

在AIGC技術應用布局上,通用性和垂直性并重。

所謂“通用性”指的是橫向能力,適用于各個行業(yè),具體而言包括語義多輪對話、知識庫構建、智能搜索、企業(yè)級RPA、多模態(tài)內容生成、代碼生成等方面:

  1. 語義多輪對話:AIGC技術在語義多輪對話中發(fā)揮著巨大的優(yōu)勢,尤其是在高客單價銷售和私域交流場景下。例如,直播話術中,AIGC能夠迅速學習并掌握最佳實踐,如各類Chatbot和IQ for sales。
  2. 知識庫構建:AIGC技術從簡單的資料概括整理發(fā)展到幫助用戶閱讀理解、生成個性化資料庫,以及基于高效資訊歸納的新搜索功能。這使得AIGC既可應用于企業(yè)級人工智能,也可成為個人助理(如Mem)。
  3. 智能搜索:AIGC在智能搜索領域的應用也取得了顯著成果,如New Bing、Perplexity等。凡積累了知識庫的系統(tǒng),都可以借助AIGC實現語義搜索功能。
  4. 企業(yè)級RPA(Robotic Process Automation):結合LLM(Large Language Models)技術和RPA,AIGC在企業(yè)級應用中發(fā)揮著重要作用。典型應用包括微軟的Copilot以及CRM領域的Salesforce等,它們緊密結合行業(yè)場景,為用戶賦能。
  5. 多模態(tài)內容生成:在智能寫作助手、廣告主視覺創(chuàng)作、智能NPC等領域,AIGC技術帶來了創(chuàng)新應用,除了文字,還可以生成圖片、視頻,甚至3D數字內容。
  6. 代碼生成:代碼作為一種更標準化的文本,AIGC在代碼生成方面具有巨大潛力,如GitHub Copilo已經有很不錯的表現,在這個領域,正在有更多的代碼生成工具出出現,有望大幅提升碼農的生產力,也為普通的非技術工作者提供了更為便捷的工具,大幅降低了編程門檻。

所謂“垂直性”指的是縱向能力,通過對不同行業(yè)Know-how的學習,AIGC技術可以進化為行業(yè)專家,從而大幅加速各行業(yè)的數字化轉型。

結合國外企業(yè)的投融資信息,我們列舉了醫(yī)療、金融、零售和制造幾個行業(yè)的典型例子:

  1. 醫(yī)療(Zebra Medical Vision ,Aidoc 等使用AGI進行醫(yī)學圖像分析)。
  2. 金融(Bloomberg發(fā)布Terminal AI大模型提供金融智能化服務)。
  3. 零售(Stitch Fix 等公司使用生成式人工智能來實現個性化購物體驗、庫存管理和需求預測)。
  4. 制造(通用電氣等公司利用生成式人工智能優(yōu)化生產流程、預測性維護和供應鏈管理)。

3. 國外科技企業(yè)紛紛“卷”出了新高度

在OpenAI的直接帶動(微軟)或刺激(谷歌等)下,大模型已經成為巨頭軍備競賽新的殺手锏。不僅加速大煉“大模型”,還在原有的產品中快速加入大模型的能力,以期在新的范式轉換和技術浪潮中占得先機。

先是5月初,谷歌I/O大會推出PaLM2大模型,其對話產品Bard未來也能像ChatGPT一樣,接入網絡,實時搜索網頁。同時推出Duet AI,給谷歌的辦公套件Workspace全新升級。

近日,微軟開發(fā)者大會則推出了Windows Copilot,打造每個人的AI助手。

Windows Copilot將直接集成到Windows 11中,在所有應用和程序中都可使用,就像我們在Edge、Office程序和GitHub中看到的Copilot側邊欄一樣。

除了傳統(tǒng)科技巨頭,創(chuàng)業(yè)企業(yè)同樣表現出極高的市場活力和技術實力,各模態(tài)應用快速落地,爆款產品不斷推出。

隨著技術不斷演進,尤其是Diffusion、Transformer和Clip等模型的提出,AIGC的商業(yè)化在多個領域開始落地,其中代碼生成、文本生成、圖像生成、音視頻/游戲等領域已有不少爆款級產品。

  1. 代碼領域,Github推出的Copilot用戶量破百萬。
  2. 文本領域,微軟已經在Bing和Dynamic365等應用已接入ChatGPT/GPT-4接口。
  3. 圖像領域, Stable diffusion等文生圖應用已突破千萬級用戶量。
  4. 音視頻/游戲領域,起步較晚,對模型和算力要求更高,出現了不少Start-up。

更多頭部企業(yè)創(chuàng)新產品和解決方案可參見下表:

4. 大模型生態(tài)合作的5種典型方式

目前,大模型可能的生態(tài)合作和商業(yè)模式正在漸次展開,我們梳理了主要的5種。

其中API調用和插件是大多數公司接入大模型能力的主要方式。

1)API調用:大多數公司使用大模型的主要方式

在當前的技術環(huán)境下,API調用被廣泛應用于知識庫和客戶服務領域。

公司通過利用ChatGPT開放的Fine Tuning API,將自有的Knowledge Base(包括產品文檔、常見問答、客服歷史對話等)上傳到ChatGPT,從而建立私有模型。

值得注意的是,盡管如此,創(chuàng)業(yè)公司仍無法擁有該模型的所有權。

通過這種方式,ChatGPT的用戶可以擁有專屬的Chat Bot,它不僅具備常規(guī)對話功能,還可以利用企業(yè)自有、甚至非公開的訓練數據來提供高度針對性的服務。

以OpenAI的GPT-3/3.5/4為技術基礎,一些創(chuàng)新公司如QUANTUM ENGINE(類似Character.ai和Inworld,由創(chuàng)始人Jesse Lyu于2023年創(chuàng)建)旨在基于ChatGPT改善玩家體驗并提升生產環(huán)節(jié)效率。

這些公司通過引入開放式對話,重新探索NPC的價值,以提升沉浸感與交互方式。同時,實現了開放式游戲視覺引擎聯(lián)動的三個步驟:生成對話、行為與藍圖的自動化。

一個典型的示例是“當馬斯克想把特斯拉賣給比爾蓋茨”的Demo,該Demo展示了如何自由選擇角色并自動生成對話。價格方面,盡管不同類型、不同公司的定價方式各有千秋,但整體上大模型日益向生態(tài)擴展方向發(fā)展。

典型如OpenAI開放了GPT-4(純文本)、ChatGPT API和WhisperAPI(應用程序接口),允許開發(fā)者將ChatGPT集成至他們的應用程序和服務中。

2023年3月1日,OpenAI基于GPT 3.5 Turbo模型開放了ChatGPT API,API收費模式為0.002美元/1000tokens。相較于前一代開放接口GPT 3.5,性能更強的同時,價格下降90%,進一步加速了ChatGPT相關應用生態(tài)的發(fā)展。

2)插件模式:Plugin讓大模型有望成為新的OS

除API調用外,2023年3月24日,OpenAI公布了重磅消息:ChatGPT支持接入第三方插件,并一口氣上架了11個插件。

通過這些插件,用戶可以用ChatGPT購買商品,預定酒店、機票,搜索專業(yè)數據等,這大大解放了ChatGPT的生產力,為其發(fā)展帶來了更多的可能性。

這種插件模式為Plugin可能的應用方式和影響提供了豐富的發(fā)展前景。

總之,不管是作為操作系統(tǒng)還是應用商店,AI的轉折點已經到來。

3)進一步的探討:機遇還是陷阱?護城河在哪里?

綜合上述API調用方式的分析,我們不禁產生一個靈魂之問:模型是OpenAI的,核心技術不在自己手里,AIGC應用層企業(yè)的護城河在哪里?

PitchBook調查數據顯示,僅在2022年,生成式AI(即AIGC)賽道就發(fā)生了78筆投資,總融資金額超過13.7億美元,幾乎相當于過去5年的融資總和。同期,出現了OpenAI、Stability AI、Jasper等估值超過10億美元的獨角獸。

預計2023年,生成式AI賽道的融資次數、額度將會更多。

然而,“GPT狂飆,AI投資突進,整個創(chuàng)投市場都熱得發(fā)燙。稀缺的公司分分鐘獨角獸,做大模型的人才出500萬年薪也難招,但與此同時,有的創(chuàng)業(yè)公司還沒來得及在市場上露出鋒芒,就已經被一日千里的OpenAI倒在PPT階段,難以翻身”——AIGC應用層融資過熱,是否“虛假繁榮”?

換言之,ChatGPT“更強、更快、更便宜”了,現有應用還有市場嗎?

關于這個問題的回答我們將以Grammarly、Jasper.ai 的使用體驗及 Quantum-engine創(chuàng)始人的現身說法為例嘗試做出回答:

Q1: ChatGPT對Grammarly說:我干掉你,與你無關?

Grammarly為全球每天的3000萬用戶(包括50000個專業(yè)機構)提供語法校對服務。然而,在ChatGPT出現后,這一市場格局可能面臨挑戰(zhàn),據悉reddit、twitter 等地充滿了正在認真考慮退訂 Grammarly 。

Q2:Jasper“真香”,為什么?

Jasper支持各平臺廣告/博客圖文內容生成,截至2022年12月底,Jasper付費用戶達到7萬,估值已達15億美元,旗下有多款產品接入GPT-3進行商業(yè)性文字創(chuàng)作。

雖然底層模型是OpenAI的(親測調整設問方式后可在ChatGPT中得到高度一致的營銷文案結果輸出,核心功能可替代),且Jasper定價更高。但截至目前Jasper的估值和用戶量并未受到影響,這引發(fā)了關于其發(fā)展和市場競爭力的思考。

A3:創(chuàng)始人視角:應用層壁壘在于前端用戶體驗

QUANTUM ENGINE 創(chuàng)始人表示ChatGPT在游戲行業(yè)的應用呈現出巨大潛力,包括游戲角色對話生成、劇情編寫、游戲元素創(chuàng)意等方面,為游戲開發(fā)者提供強大的支持。

作為對話生成應用,低延時性對用戶體驗至關重要,類似于在弱網條件下云視頻會議產品Zoom適當犧牲視頻質量以優(yōu)先保障音頻流暢以保證用戶通話體驗。AIGC應用也需要關注此類需求,為用戶精準提供更舒適的前端用戶體驗。

由此觀之,行業(yè)應用層的獨特優(yōu)勢決定了未來百花齊放的生態(tài),深耕行業(yè)特性、優(yōu)化前端體驗才能應對大模型飛速迭代帶來的潛在危機。

二、行業(yè)應用的6類切入路徑

按用戶側類型劃分,生成式人工智能(AIGC)在C端和B端市場呈現出兩類路徑,其中C端已經達到可用、甚至好用的臨界點,B端將從高價值先導領域向MaaS生態(tài)擴展。

1. C端市場已經達到可用的臨界點

C端應用包括效率工具的下一代產品、游戲未來的新形態(tài)和制作新方式,以及為數字人、元宇宙、機器人等交叉領域帶來新空間。

此外,AIGC還帶來了內容創(chuàng)作領域的大爆發(fā)。

2. B端市場,從高價值先導領域向MaaS生態(tài)擴展

1)生成式AI從效率角度切入,提升寫作和生產力。例如,會議、招聘、各類辦公助手(文檔助手、編程助手)等應用場景。

2)生成式AI在高價值領域如營銷、金融育等領域率先切入

以營銷為例,AIGC技術可以大幅降低創(chuàng)意成本、大量生成廣告素材和文案。Jasper作為市場上最為火爆的廣告、營銷圖文生成產品,在截至2022年12月底時,付費用戶達到7萬,2022年年收入7500萬美元,估值已達15億美元。

在金融領域中,AIGC應用探索方向集中在智能客服、智能投顧、商戶入網、欺詐檢測、智能營銷等領域。

然而,在算法風險、隱私保護、信息安全等方面仍然面臨較大的挑戰(zhàn)。

3)知識密集型領域蘊含著生成式AI應用的巨大潛力

在醫(yī)療領域,GPT-4作為一種醫(yī)學AI聊天機器人,在醫(yī)學領域的潛在應用方式主要包括醫(yī)療記錄、醫(yī)學知識和醫(yī)療咨詢,可以幫助醫(yī)護人員提升工作效率和患者問診體驗。

但它也存在局限性,并可能帶來系列潛在風險。

在教育領域的應用已較為成熟。以Duolingo為例,他們利用GPT-4推出了新產品“Duolingo MAX”學習平臺,提供了“解釋答案”和“角色扮演”兩項全新的AI功能。

在這些領域中,AIGC技術不斷拓展應用場景,為各行各業(yè)帶來了前所未有的效率提升和創(chuàng)新機遇。

但我們也應當關注到其中的挑戰(zhàn)與風險,確保技術在發(fā)揮潛能的同時,也能保障用戶的利益和安全。

除了千行百業(yè)的多模態(tài)應用,在B端市場,如下圖所示的模型層中AIGC技術業(yè)在逐漸圍繞頭部幾家大模型形成的MaaS生態(tài)發(fā)展:

三、進一步的探討

暢想未來,生成式人工智能將進一步與生產、生活深度融合。而大模型帶來的變革才剛剛開始。也特別歡迎大家聯(lián)系我們,一起探討大模型在行業(yè)應用主戰(zhàn)場落地的機會和挑戰(zhàn)。

1. 企業(yè)級RPA+大模型的AutoGPT方式可能顛覆現有的軟件模式

產業(yè)層面,企業(yè)級RPA(Robotic Process Automation)結合大模型的方式將在更多行業(yè)實現落地(譬如金融、零售、政府、制造、物流、地產、教育等),并財務,HR,客服等應用場景展現極為出色的能力,從而實現更高效的工作流程和業(yè)務處理。

譬如說AutoGPT已昭示Prompt 工程的下一個前沿,即便是非科班出身的小白,借助 AutoGPT不到 3 分鐘就能成功建立一個網站,完成一份詳實的市場調研也可以在彈指間輕松實現。

2. 組織變革和個人自雇等興起,將帶來應用軟件的全新革命

當一個人就能成為一支團隊,這將有可能誕生具有To C體驗的B端現象級產品。在產業(yè)變革的加速驅動下,未來在組織層面業(yè)將發(fā)生深刻變革,個人和小團隊模式可能成為重要形態(tài),引發(fā)To B和To C軟件的邊界進一步模糊……

當然這還只是我們的初步的思考,生成式AI技術影響下的未來勢必繼續(xù)顛覆我們的認知、持續(xù)突破想象的邊界,帶來生產力的新革命。無論如何,未來已呼嘯而至。

作者:白惠天,王強。

來源公眾號:騰訊研究院(ID:cyberlawrc),騰訊研究院是騰訊公司設立的社會科學研究機構。

本文由人人都是產品經理合作媒體 @騰訊研究院 授權發(fā)布,未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協(xié)議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
13861人已学习12篇文章
一张逻辑清晰、层次明确的产品架构图,能够给观者讲述一个产品的业务流程、功能框架和设计思路,也是一个产品必不可少的可视化工具。
专题
13305人已学习13篇文章
本专题的文章分享了搜索策略产品经理必读系列。
专题
15097人已学习14篇文章
RBAC是一套成熟的权限模型,在传统权限模型中,我们直接把权限赋予用户。而在RBAC中,首先把权限赋予角色,再把角色赋予用户。本专题的文章分享了基于RBAC模型的权限设计。
专题
50336人已学习25篇文章
在产品初期,有什么方法能获取及维护高质量的种子用户呢?
专题
15349人已学习12篇文章
本专题的文章分享了互联网金融风控体系的设计指南。
专题
53568人已学习14篇文章
标题党,又爱又恨。但是如果你是运营,连标题都起不好,那就呵呵哒了。