AIGC 中的大模型摩爾定律與范式轉(zhuǎn)移

0 評(píng)論 4801 瀏覽 9 收藏 16 分鐘

AIGC的發(fā)展,將使得知識(shí)性與創(chuàng)造性工作的邊際成本降至0,從而產(chǎn)生巨大的生產(chǎn)效率和經(jīng)濟(jì)價(jià)值,每一個(gè)需要我們?cè)瓌?chuàng)的領(lǐng)域都或多或少將有AI的參與。AIGC 的產(chǎn)品形態(tài)未來(lái)會(huì)是什么樣的呢?它的細(xì)分機(jī)會(huì)又在哪里?本文作者對(duì)此進(jìn)行了分析,一起來(lái)看一下吧。

本文核心觀點(diǎn)來(lái)自紅杉在 9 月發(fā)布的一篇文章《Generative AI: A Creative New World》,我按大白話翻譯并做了刪減和補(bǔ)充。

原文想要表達(dá)的意思是——“隨著 AIGC(AI Generative Content)變得更快更強(qiáng)以及更低成本,在某些程度上將比人類(lèi)手工創(chuàng)作得更好,AIGC 將使得知識(shí)性與創(chuàng)造性工作的邊際成本降至 0 ,從而產(chǎn)生巨大的生產(chǎn)效率和經(jīng)濟(jì)價(jià)值,它將有潛力產(chǎn)生數(shù)萬(wàn)億美元的經(jīng)濟(jì)價(jià)值,這些領(lǐng)域不限于社交媒體、游戲、廣告、建筑、設(shè)計(jì)、法律、銷(xiāo)售以及營(yíng)銷(xiāo),每一個(gè)需要我們?cè)瓌?chuàng)的領(lǐng)域都或多或少將有 AI 的參與?!?/p>

01 Why Now?為什么是現(xiàn)在

原作者將 AI 模型的發(fā)展劃分為四波浪潮:

1)2015 年以前,小模型占優(yōu)

小模型在當(dāng)時(shí)被認(rèn)為是最優(yōu)選,它們擅長(zhǎng)分析任務(wù),并應(yīng)用在各類(lèi)預(yù)測(cè)和欺詐分類(lèi)的工作上,但是這些模型對(duì)通用任務(wù)的處理表現(xiàn)并不好,想要讓 AI 輸出人類(lèi)水平的內(nèi)容或者代碼是不可能的。

2)2015 年至今,大模型發(fā)展

Google Research 在 2017 年發(fā)表了一篇里程碑意義的論文《Attention is All You Need》,通過(guò)被稱為 Transformer 的神經(jīng)網(wǎng)絡(luò)架構(gòu)來(lái)生成高質(zhì)量的語(yǔ)言模型,同時(shí)提高了并發(fā)處理能力,降低了訓(xùn)練時(shí)間,這些模型可以容易地針對(duì)特定領(lǐng)域進(jìn)行定制。

AIGC 中的大模型摩爾定律與范式轉(zhuǎn)移

隨著這些 AI 模型變得越來(lái)越大,開(kāi)始提供人類(lèi)水平的處理能力。在 2015 年~2020 年期間,這些模型的計(jì)算量提高了 6 個(gè)數(shù)量級(jí),這意味著在輸出結(jié)果上超過(guò)了人類(lèi)在書(shū)寫(xiě)、語(yǔ)音、圖像識(shí)別、閱讀和語(yǔ)言理解上的基準(zhǔn)。

AIGC 中的大模型摩爾定律與范式轉(zhuǎn)移

Source:公開(kāi)網(wǎng)絡(luò)

2020年 5月,OpenAI 推出的 GPT-3 模型從中脫穎而出,相對(duì)于此前的 GPT-2 是一個(gè)巨大的飛躍,它的參數(shù)量是前代的百倍之多,達(dá)到 1750 億個(gè)參數(shù)量, GPT-3 能通過(guò)輸入的自然語(yǔ)言判斷和生成我們想要的內(nèi)容,從某種意義上說(shuō)它更像人類(lèi)了,但是該模型并沒(méi)有人類(lèi)那樣的價(jià)值觀和約束,只是在形式上依靠龐大的數(shù)據(jù)量和更優(yōu)的算法更加接近人類(lèi)智能。

當(dāng)然,這類(lèi)模型取得了研究上的進(jìn)展,但離商業(yè)普及仍然有一段距離,無(wú)非是部署起來(lái)成本高,存在諸多方面的商業(yè)化限制。

3)2022年開(kāi)始,多快好省

2022 年開(kāi)始至今的數(shù)月,AIGC 的發(fā)展可以說(shuō)是超預(yù)期的,先是去年 10月一名叫 Somnai 的工程師在 Github 上發(fā)布了名為 Disco Diffusion 的 text2img (文本到圖像)項(xiàng)目開(kāi)始走紅網(wǎng)絡(luò),再是今年 4 月 OpenAI 發(fā)布了 DALL.E 2 模型,一款融合了藝術(shù)家達(dá)利+機(jī)器人瓦力能力,能夠生成高度逼真的原創(chuàng)圖像的模型。

再到 5 月,Google 推出了在精度和質(zhì)量上更出色的 Imagen 模型,7 月原 Leap Motion 聯(lián)創(chuàng) David Holz 的項(xiàng)目 Midjourney 開(kāi)始走進(jìn)大眾視野,例如少楠的《產(chǎn)品沉思錄》近期的封面創(chuàng)意就來(lái)源于此,還是宮崎駿風(fēng)味的:

AIGC 中的大模型摩爾定律與范式轉(zhuǎn)移

Source:shaonan with Midjourney

接下來(lái)是 8 月 Stable Diffusion 項(xiàng)目開(kāi)源,Stable Diffusion 項(xiàng)目帶來(lái)的主要革新是大幅降低了模型對(duì)內(nèi)存和計(jì)算的要求,舉個(gè)例子,原先 512 x 512 對(duì)圖像一下子變成了 64 x 64,需要的內(nèi)存減少了 98%!這就像是在上世紀(jì)把一臺(tái) Eniac 計(jì)算機(jī)塞到了喬布斯的 Apple II 個(gè)人電腦里,這種普及為技術(shù)的商業(yè)化提供了合適的條件。

Stable Diffusion 的革新或許刺激到了資本們敏銳的神經(jīng),今年以來(lái) AIGC 的概念也是非常火,感興趣的朋友可以訪問(wèn)我近日寫(xiě)的這篇《從 Stability AI 和 Stable Diffusion 看 AIGC》展開(kāi)閱讀。

4)當(dāng)前,殺手應(yīng)用的養(yǎng)料

就像是 4G 移動(dòng)網(wǎng)絡(luò)的成熟,千元機(jī)、網(wǎng)絡(luò)速度提升以及網(wǎng)絡(luò)資費(fèi)下降,讓大眾進(jìn)行短視頻內(nèi)容消費(fèi)成為可能,隨之出現(xiàn)的一波短視頻&直播創(chuàng)業(yè)中殺出了抖音和 Tiktok,在 AIGC 領(lǐng)域預(yù)計(jì)或許也會(huì)出現(xiàn)這樣的押韻,甚至也會(huì)有平臺(tái)的出現(xiàn),但紅杉認(rèn)為這個(gè)機(jī)會(huì)還是比較小的,更偏向于垂直應(yīng)用。

02 市場(chǎng)生態(tài)和細(xì)分機(jī)會(huì)

AI 不僅影響業(yè)務(wù)和行業(yè)層面,按照技術(shù)語(yǔ)言叫多模態(tài),按照大白話就是文字、代碼、聲音、圖像、視頻、3D 模型以及其它基礎(chǔ)性載體,如生物化學(xué)分子等產(chǎn)生碰撞,這些不同的內(nèi)容載體在更好的 AI 模型加持下,產(chǎn)生質(zhì)量更高、容量更大、領(lǐng)域更垂直以及更創(chuàng)意有趣的市場(chǎng)機(jī)會(huì)。

AIGC 中的大模型摩爾定律與范式轉(zhuǎn)移

Source:Sequoia

如果把這些參數(shù)量和晶體管對(duì)照,將大模型對(duì)照成 AI 領(lǐng)域的摩爾定律,紅杉美國(guó)的觀點(diǎn)是在 2025 年及以后看到較為成熟的商業(yè)化案例。

以下是紅杉觀察到的幾個(gè)場(chǎng)景案例供參考:

  • 文案(Copywriting):隨著個(gè)性化和電子郵件需求增長(zhǎng),銷(xiāo)售、營(yíng)銷(xiāo)以及客戶支持這些場(chǎng)景都是 AI 模型的用武之處,這些場(chǎng)景下對(duì)文本的要求簡(jiǎn)潔明了,對(duì)時(shí)間和成本有一定要求, 在這些 B 端領(lǐng)域做自動(dòng)化和增效解決方案是一個(gè)不錯(cuò)的機(jī)會(huì);
  • 專(zhuān)業(yè)寫(xiě)作(Vertical specific writing assistants):不像是通用的文本創(chuàng)作,在專(zhuān)業(yè)領(lǐng)域如法律合同起草和劇本創(chuàng)作會(huì)有機(jī)會(huì),當(dāng)然不同的垂類(lèi)其工作流程和用戶體驗(yàn)會(huì)有差異;
  • 代碼生成(Code generation):GitHub Copilot 是一款 AI 編程工具,它為當(dāng)前使用這款工具的開(kāi)發(fā)者創(chuàng)造了近 40% 的代碼,未來(lái)將有機(jī)會(huì)服務(wù)于更廣大的消費(fèi)者,而不僅僅是軟件工程師,畢竟在硅谷,工程師是個(gè)創(chuàng)造型的職業(yè)「doge」;
  • 藝術(shù)生成(Art generation):目前藝術(shù)和潮流內(nèi)容都已經(jīng)可以通過(guò) AI 大模型去完成,人人都可以通過(guò)這些模型創(chuàng)作以前只有專(zhuān)業(yè)藝術(shù)人員才能完成的風(fēng)格,例如騎馬的宇航員和在古埃及買(mǎi)面包的泰迪熊;
  • 游戲(Gaming):理想情況是通過(guò)自然語(yǔ)言腳本敘述來(lái)創(chuàng)建復(fù)雜的游戲場(chǎng)景或模型,但這是最終狀態(tài),從當(dāng)前看還有很長(zhǎng)的路要走,當(dāng)然短期來(lái)講也有可行的機(jī)會(huì),例如在微觀的素材創(chuàng)作上,生成紋理這些;
  • 媒體/廣告(Media/Advertising):這是非常好的落地場(chǎng)景,將銷(xiāo)售信息與動(dòng)態(tài)視覺(jué)效果以多模態(tài)的形式展現(xiàn)在消費(fèi)者面前,我展開(kāi)舉個(gè)栗子(未經(jīng)嚴(yán)格驗(yàn)證)——抖音里的廣告都是廣告商的分發(fā),或許未來(lái)是通過(guò)算法根據(jù)你的數(shù)據(jù)推薦生成展現(xiàn)在你面前,而不是推薦分發(fā);
  • 設(shè)計(jì)(Design):對(duì)于像我這樣學(xué)設(shè)計(jì)和藝術(shù)背景的同學(xué)太有感觸了,你還在為賽博網(wǎng)絡(luò)畫(huà)線搭模型而煩惱么?動(dòng)嘴就能生成的模型誰(shuí)不喜歡,無(wú)論是交給你的導(dǎo)師還是交給老板,AI 模型為你省去了繁重的執(zhí)行工作,剩下需要的只是你的創(chuàng)意!最近在建筑領(lǐng)域已經(jīng)看到了不少的案例,以及你或許有一天在 Photoshop、Figma 以及 Sketch 這些平面設(shè)計(jì)領(lǐng)域通過(guò) AI 插件或者小功能一句話找到你心水的素材;
  • 社交媒體和數(shù)字社區(qū)(Social media and digital communities):這個(gè)我就直接以國(guó)內(nèi)的場(chǎng)景和個(gè)人理解表述吧,比如我在某博某紅書(shū)某刻發(fā)一個(gè)有趣的圖文動(dòng)態(tài),這個(gè)圖可能是平臺(tái)提供給我的有趣 AI 小工具,它可能是集成在表情包下面,我原來(lái)的搜索動(dòng)作變成了即時(shí)的 AI 生成,可能有一天我的微信容量也不用這么大了……

03 產(chǎn)品形態(tài)與技術(shù)趨勢(shì)

AIGC 的產(chǎn)品形態(tài)未來(lái)會(huì)是什么樣的?以下是紅杉的預(yù)測(cè):

1)關(guān)于模型

AIGC 的產(chǎn)品構(gòu)建在 GPT-3 或者 Stable Diffusion 等大模型上面,并且隨著產(chǎn)品的應(yīng)用以及用戶數(shù)據(jù)的增長(zhǎng),將會(huì)反過(guò)來(lái)促進(jìn)模型的優(yōu)化:

  1. 模型在特定問(wèn)題上的質(zhì)量與性能
  2. 模型的大小和成本優(yōu)化

2)關(guān)于產(chǎn)品

部分 AIGC 產(chǎn)品將作為現(xiàn)有軟件生態(tài)系統(tǒng)中的插件存在,融入在 IDE、Figma 和 Discord中,例如 Midjourney 就一款依托于 Discord 的文本到圖像創(chuàng)作工具,另外還有少量以獨(dú)立形態(tài)存在的產(chǎn)品,例如:

  • 文案創(chuàng)作:Jasper 和 Copy.ai
  • 視頻編輯:Runway
  • 記筆記的:Mem

從現(xiàn)有的軟件生態(tài)以插件形式存在,然后獨(dú)立出來(lái)或許是一個(gè)冷啟動(dòng)的好方式,紅杉表示已經(jīng)在消費(fèi)和社交領(lǐng)域觀察到這種策略的成功。

3)關(guān)于交互

當(dāng)前許多 AIGC 的 Demo 產(chǎn)品幾乎是一次性完成的,即用戶輸入內(nèi)容,模型輸出結(jié)果,這些結(jié)果可以自動(dòng)保存,又或者放棄重新生成,模型也在持續(xù)迭代,用戶也可以將模型生成的結(jié)果進(jìn)行進(jìn)一步編輯、優(yōu)化或二創(chuàng)。

今天,AIGC 的結(jié)果可以被用在原型或初稿制作中,這類(lèi)產(chǎn)品很擅長(zhǎng)將不同的創(chuàng)意點(diǎn)子融入其中,以推進(jìn)整個(gè)創(chuàng)作過(guò)程,例如在建筑設(shè)計(jì)領(lǐng)域或者平面設(shè)計(jì)中起草各種 Logo 方案,然后由用戶來(lái)做進(jìn)一步“精修”。

隨著模型越來(lái)越聰明,并積累了使用者越來(lái)越多的數(shù)據(jù),這些原型或初稿也將越來(lái)越完善,直到縮短整個(gè)創(chuàng)作周期,甚至被作為成品。

4)關(guān)于品類(lèi)

最好的 AIGC 公司通過(guò)打造用戶使用數(shù)據(jù)與模型性能之間的飛輪來(lái)持續(xù)建立競(jìng)爭(zhēng)優(yōu)勢(shì)。初創(chuàng)企業(yè)想要贏得這一勝利,必須建立這樣的商業(yè)模型:

  • 第一步:更多用戶參與,迭代產(chǎn)品與數(shù)據(jù)積累;
  • 第二步:更好的模型,反哺更好的產(chǎn)品體驗(yàn);
  • 第三步:進(jìn)一步用戶增長(zhǎng)和更多參與。

這樣的商業(yè)模型將會(huì)誕生在比較垂類(lèi)的市場(chǎng)中,比如代碼、設(shè)計(jì)或者游戲,而不是妄想做個(gè)大產(chǎn)品,什么群體都想服務(wù)。最好的切入方式還是在一些現(xiàn)有的應(yīng)用體系中深嵌來(lái)得到增長(zhǎng),然后通過(guò)原生的 AI 方式慢慢替代落后的服務(wù)流程,當(dāng)然積累數(shù)據(jù)和用戶是需要花時(shí)間的,相信這是一種行之有效的增長(zhǎng)策略。

04 風(fēng)險(xiǎn)提示

最后,紅杉在文章中提示—— 雖然 AIGC 具有很大的潛力,但是就當(dāng)前而言還有很多商業(yè)模式和技術(shù)上的問(wèn)題沒(méi)有解決,例如在版權(quán)、隱私安全和成本等方面。

總的來(lái)說(shuō),AIGC 還處在一個(gè)早期階段,平臺(tái)層的發(fā)展還不錯(cuò),應(yīng)用層還有很大的發(fā)揮空間;需要澄清的是,用戶并不需要一些大的語(yǔ)言模型來(lái)長(zhǎng)篇大論寫(xiě)一篇托爾斯泰式的小說(shuō),現(xiàn)有的模型已經(jīng)足夠創(chuàng)作一些博客初稿了,后期還有很多可以被釋放與創(chuàng)造的價(jià)值。

第一波 AIGC 的產(chǎn)品猶如 iPhone 剛剛誕生的那樣,充滿噱頭但還沒(méi)有明確的商業(yè)模式和差異價(jià)值,雖然我們能從現(xiàn)有的產(chǎn)品和技術(shù)中對(duì)未來(lái)管中窺豹,例如刷到一些 AI 生成的精美圖片。

最后,談一點(diǎn)個(gè)人理解,這里的機(jī)會(huì)可能是模型在某個(gè)垂類(lèi)上的內(nèi)容供給效率高于當(dāng)前人類(lèi)工作人員的效率才會(huì)出現(xiàn),就像推薦算法當(dāng)初改變了傳統(tǒng)的內(nèi)容和商品分發(fā)效率那樣,但就當(dāng)前而言還不會(huì)有一個(gè)通用大模型一招吃遍鮮去生產(chǎn)所有各種形態(tài)的內(nèi)容、腳本、方案、配方、公式、素材等等。

Reference:

[1] 《Generative AI: A Creative New World》,Sequoia

免責(zé)聲明:在任何情況下,本文信息或表述,不構(gòu)成任何投資建議;若有侵權(quán),請(qǐng)后臺(tái)聯(lián)系刪除。

作者:TimJ;來(lái)源公眾號(hào):江天Tim

本文由 @江天Tim 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!