亚洲精品一区二区三区在线看,九九精品一区二区三区无码吞精

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

開通會(huì)員

發(fā)布

注冊(cè) | 登錄

Runway：AI Native Tools工廠，下一個(gè)時(shí)代的視頻創(chuàng)作工具

海外獨(dú)角獸

2023-04-13

1 評(píng)論 13043 瀏覽 13 收藏

🔗 产品经理在不同的职业阶段，需要侧重不同的方面，从基础技能、业务深度、专业领域到战略规划和管理能力。

本文作者從Runway公司的產(chǎn)品著手進(jìn)行講解，介紹了Runway的產(chǎn)品歷程及公司特色，分析了其市場(chǎng)定位與外部競(jìng)爭(zhēng)，并在最后研究探討了Runway公司的未來發(fā)展，推薦給感興趣的伙伴們閱讀~

Runway 是什么？是 Stable Diffusion model 背后的研究團(tuán)隊(duì)的公司；是目前最受關(guān)注的 AI native 視頻創(chuàng)作軟件；是新產(chǎn)品 demo 總是很酷炫，但用戶很難拿到內(nèi)測(cè)的“最強(qiáng)廣告公司”；是基于云端和瀏覽器的團(tuán)隊(duì)協(xié)作產(chǎn)品——視頻編輯領(lǐng)域的 figma。

但更進(jìn)一步看，我們認(rèn)為 Runway 的模式是一個(gè) AI native tools 工廠，和字節(jié)的路徑很像。字節(jié)以推薦算法+資訊作為載體，制造了段子、新聞、貼圖、短視頻、中視頻等一系列產(chǎn)品，爆款程度不一。而 Runway 以“AI + 視覺創(chuàng)作”為載體，隨著 AI 技術(shù)每一次浪潮的迭代推出了 30 多個(gè)圖像視頻編輯工具，也有不少在業(yè)界成為爆款。

Runway 的產(chǎn)品哲學(xué)很清晰：一直站在 AI 技術(shù)演進(jìn)的前沿，始終基于 AI 新技術(shù)的邊界，尋找視頻和圖像編輯的全新方法。他們不希望做一個(gè)更好的 Photoshop 或 Premiere，而是希望借助云計(jì)算和 AI 的力量塑造全新的工作流。

從技術(shù)和產(chǎn)品結(jié)合的角度看，Runway 不斷把最前沿的計(jì)算機(jī)視覺技術(shù)封裝成工具，裝入自己的云端視頻編輯平臺(tái)，可以說抓住了每次 AI 技術(shù)進(jìn)步的機(jī)會(huì)：

在 StyleGAN 等生成技術(shù)成熟時(shí)，Runway 做了一個(gè)機(jī)器學(xué)習(xí)模型平臺(tái)，讓用戶可以方便地訓(xùn)練、部署視覺模型，許多用戶在 Runway 上調(diào)用 StyleGAN 模型生成肖像；
在圖像語義理解、分割等技術(shù)成熟時(shí)，Runway 選擇不斷優(yōu)化綠幕、圖像修復(fù)等技術(shù)，大幅節(jié)省視頻編輯時(shí)間，服務(wù)于專業(yè)的視頻編輯師；
如今 Stable Diffusion 為代表的圖像生成技術(shù)成熟，Runway 于是開始發(fā)力生成相關(guān)技術(shù)，目前 Runway 的 Gen-2 模型是市場(chǎng)上最好的視頻生成模型，用戶已經(jīng)可以在簡(jiǎn)單場(chǎng)景生成效果驚艷的短視頻。
也正因?yàn)?Runway 總想走在技術(shù)最前沿，而 AI 生成的技術(shù)成熟度還不高，Runway 的產(chǎn)品也面臨挑戰(zhàn)；
視頻編輯工具層面，Runway 不適合精細(xì)度要求高、特別專業(yè)的場(chǎng)景，更多專業(yè)用戶把它的 tools 當(dāng)成 Adobe 的補(bǔ)充而非替代；而中小客戶方面又面臨剪映（Capcut）這種更方便、更移動(dòng)原生產(chǎn)品的競(jìng)爭(zhēng)；
在圖像生成方面，雖然 Runway 是 Stable Diffusion 的早期作者，圖片生成質(zhì)量落后于 Midjourney 和 Stability AI，目前內(nèi)測(cè)的視頻生成產(chǎn)品，效果還待更多用戶來驗(yàn)證。

以下為本文目錄，建議結(jié)合要點(diǎn)進(jìn)行針對(duì)性閱讀。

Thesis
全新的 AI 創(chuàng)作方式
Runway 產(chǎn)品歷程
Runway 公司特色
定位與競(jìng)爭(zhēng)
團(tuán)隊(duì)與融資
關(guān)鍵討論與未來

一、Thesis

我們認(rèn)為，Runway 的模式是一個(gè) AI native tools 工廠，是否能從好用的單點(diǎn)工具閉環(huán)成用戶不可或缺的工作流產(chǎn)品，值得長(zhǎng)期關(guān)注。

1. Runway 的模式是一個(gè) AI native tools 工廠，有利于在目前技術(shù)更迭較快的背景下快速發(fā)布產(chǎn)品，獲得用戶反饋和迭代方向。

他們已經(jīng)發(fā)布了 30 多個(gè) AI Magic Tools，包括文本生成、圖像生成、音頻處理、視頻摳圖等市面上主流 AI 功能：

基于 AI tools ，他們研發(fā)了一套基于 Web 端的視頻編輯軟件，主打“協(xié)作”和“快”，試圖幫助視頻后期編輯和特效師提高生產(chǎn)效率；
在圖像生成技術(shù)成熟后，Runway 基于 Stable Diffusion 模型開發(fā)了圖像生成、無限圖像，類似 Lensa 魔法頭像的 Customer AI Training 等功能，又在近期開始內(nèi)測(cè)視頻生成模型 Gen-1 和移動(dòng) APP。

2. Runway 面臨專業(yè)工具 Adobe 和輕量級(jí)產(chǎn)品剪映的競(jìng)爭(zhēng) ：

在專業(yè)視頻編輯場(chǎng)景，Runway 難以撼動(dòng) Adobe 的護(hù)城河，其編輯工具目前無法應(yīng)對(duì)專業(yè)精細(xì)化的要求，同時(shí)專業(yè)編輯軟件 Adobe 和達(dá)芬奇（Davinci Reslove）也在 Runway 發(fā)布的新功能半年后就更新 AI 工具插件；
在輕量化視頻制作場(chǎng)景，Runway 面對(duì)高度嵌入抖音（TikTok）工作流體系的剪映（Capcut）；
在圖像生成領(lǐng)域，Runway 在生成圖像的質(zhì)量上落后于 Midjourney，Stability AI。

3. 從近期發(fā)布看，Runway 有望將單點(diǎn)的 AI Tools 組合成團(tuán)隊(duì)協(xié)作產(chǎn)品，提高對(duì)用戶工作流的介入：

他們最近發(fā)布的 Custom AI Training 和 Gen-2 視頻生成功能都很適合移動(dòng)端，比如拍攝一張照片或一段視頻后經(jīng)過簡(jiǎn)單的特效處理和編輯就可以分享至社交和內(nèi)容平臺(tái)；
Gen-2 功能目前是市場(chǎng)上最好的視頻生成模型，能夠在簡(jiǎn)單場(chǎng)景生成令人驚艷的效果，有可能會(huì)引起一波熱潮；
同時(shí)團(tuán)隊(duì)正在 APP 中內(nèi)測(cè) Image to Image 功能，這與上面兩種功能有著相同的技術(shù)棧，倘若未來 Runway 可以將視頻生成功能和編輯工具形成閉環(huán)的產(chǎn)品，那么將有大量 Youtube、Tiktok 用戶完全基于 Runway 進(jìn)行視頻制作創(chuàng)作。

二、全新的 AI 創(chuàng)作方式

Generative AI 的本質(zhì)是創(chuàng)造性任務(wù)的民主化，新的 AI 工具將原本需要多年專業(yè)學(xué)習(xí)、歷時(shí)數(shù)個(gè)小時(shí)的創(chuàng)造性工作壓縮到了幾秒，如今任何人都可以借助 Runway、Midjourney 在專業(yè)廣告、產(chǎn)品攝影等場(chǎng)景里打開創(chuàng)作空間。

Runway CEO 在訪談中表示，圖像的生成問題可能會(huì)在幾個(gè)月內(nèi)解決（“解決 ”，表示任何人都可以從電腦和瀏覽器中獲得專業(yè)級(jí)視覺效果），而視頻將會(huì)趕上。

從各種公開演講我們都沒有看到 Runway CEO 討論新時(shí)代內(nèi)容平臺(tái)的問題，他們似乎只想成為未來的內(nèi)容創(chuàng)作工具，如果我們假設(shè)未來十年會(huì)有全新的內(nèi)容形態(tài)和內(nèi)容平臺(tái)，未來的年輕人會(huì)希望使用 Runway 來制作視頻， 就像 Primere 和剪映（CapCut）之于Youtube 和 Tiktok 一樣。

1. AI 對(duì)視頻編輯的優(yōu)化

傳統(tǒng)的視頻制作分為前期和后期：

在視頻制作的前期工作中，首先需要經(jīng)驗(yàn)豐富的人進(jìn)行劇本創(chuàng)作和分鏡規(guī)劃，通常由 excel 完成，而如今剪映（CapCut）也將其作為前期功能集成進(jìn)軟件中，未來有望通過聊天形式輔助完成文案、劇本創(chuàng)作。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

分鏡規(guī)劃完成后，接下來就是素材拍攝、制作和整理工作：

素材管理的相關(guān)工作耗時(shí)、枯燥、繁重，一方面需要將各類素材進(jìn)行文件格式的統(tǒng)一，各類視頻素材庫檢索效率較低，難以滿足需求，另一方面面臨設(shè)備、時(shí)間約束，甲方需求等挑戰(zhàn)。

而未來我們可以通過多模態(tài)生成模型針對(duì)圖片、視頻素材進(jìn)行管理，對(duì)圖像進(jìn)行語義理解，翻譯成文本 Prompt，每次只需要一個(gè)聊天框入口，輸入你想要的圖片內(nèi)容。算法一方面可以大大提高檢索效率、另一方面可以隨時(shí)生成所需的圖片視頻素材，比如我們可以通過 Runway 的特效視頻生成作為某一段視頻的素材。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

（圖源：Runway 官網(wǎng)）

視頻制作的后期則包括了邏輯剪輯、音樂制作、粗調(diào)成片、細(xì)調(diào)和字幕添加等工作，它們占據(jù)了專業(yè)視頻編輯工作的 80％，Runway 有提供音頻去噪、自動(dòng)風(fēng)格變換等功能。

不僅如此，許多專業(yè)視頻還要包括視覺特效的制作，而在特效制作過程中，最費(fèi)力的工作便是 Green Screen（綠幕摳圖）及 Inpainting（圖像修復(fù)），這也是 Runway 的主打的兩項(xiàng)功能。

綜上，我們可以總結(jié)出生成式 AI 技術(shù)對(duì)于當(dāng)下視頻創(chuàng)作工作流的優(yōu)化：

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

三、Runway 產(chǎn)品歷程

1. 從 ML 模型平臺(tái)到 AI Tools 工廠

Runway 創(chuàng)業(yè)之初的產(chǎn)品形態(tài)是一個(gè)關(guān)于 ML（機(jī)器學(xué)習(xí)）模型的應(yīng)用商店，用戶可以在這上面使用數(shù)百個(gè)模型。就像我們可以很方便地在 Hugging Face 平臺(tái)使用不同的 NLP 模型一樣，用戶可以在 Runway 平臺(tái)上方便地調(diào)用流行的圖像處理模型，比如 StyleGAN 模型。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

在 5 分鐘內(nèi)將機(jī)器學(xué)習(xí)模型從 GitHub

移植到 RunwayML

GAN （對(duì)抗生成網(wǎng)絡(luò)）是早期圖像生成的主流算法，基于 GAN 模型發(fā)展出了許多人臉生成的玩法，2018 年 12 月，Nvidia 的研究人員發(fā)表 StyleGAN 相關(guān)論文，該模型可以生成無限張假的肖像畫。

在圖像生成方面，GAN 模型在生成內(nèi)容無法同時(shí)滿足高度可控性和高分辨率，而如今的圖片生成模型主流技術(shù)是 Diffusion 模型。

隨后 Runway 開始基于最新的 AI 算法開發(fā)相應(yīng) AI magic tools，目前已發(fā)布 30 余個(gè) AI 創(chuàng)作工具，包含音頻、圖片、視頻、3D 和生成五個(gè)大類，涵蓋了幾乎所有的音視頻內(nèi)容生成和處理工具。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

2. 從單點(diǎn) AI 工具到云視頻編輯套件

在深度學(xué)習(xí)的研究過程中，Runway 發(fā)現(xiàn)大約 80% 的視頻編輯時(shí)間都是那些逐幀編輯的非創(chuàng)造性操作，并且也有許多視頻制作行業(yè)里的制作人對(duì) Runway 的技術(shù)感興趣，于是基于視頻摳圖類的 AI Tool 打造了一套云原生的視頻編輯工具。

Video Editing 是 Runway 目前的主打功能，在產(chǎn)品形態(tài)上，Runway 基于 Web 打造了一個(gè)視頻編輯軟件，前端頁面依然遵循著一些傳統(tǒng)視頻創(chuàng)作的用戶習(xí)慣，保持了底部界面的軌道，帶有多編輯系統(tǒng)，音軌、關(guān)鍵幀動(dòng)畫以及對(duì)文本、圖像的支持。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

Runway 的前端界面

視頻后期特效/微調(diào)中，最耗時(shí)費(fèi)力的便是：Green Screen（綠幕摳圖）、Inpainting（圖像修復(fù)）這兩項(xiàng)工作，而 Runway 通過三個(gè) AI Tool 的幫助，可以節(jié)省大量的時(shí)間：

1）Green Screen，可以把選擇的對(duì)象以綠幕的方式作為視頻主題剪裁出來，通過點(diǎn)選的方式 AI 自動(dòng)幫你補(bǔ)全貼合主題的輪廓；

2）Inpainting，視頻修復(fù)功能，類似圖片的 PS 功能，通過手動(dòng)選擇對(duì)象范圍，將選定范圍內(nèi)的主題刪除，并用周圍的背景通過 AI 計(jì)算進(jìn)行填充；

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

（內(nèi)容源：Runway 官網(wǎng)）

3）Motion Tracking，選定一個(gè)視頻內(nèi)的主體，當(dāng)你添加其他的效果（比如標(biāo)題）時(shí)可以跟隨這個(gè)主體運(yùn)動(dòng)。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

（內(nèi)容源：Runway 官網(wǎng)）

Ruwnay 在官網(wǎng)上展示了兩個(gè)案例：

使用 Adebo AE 軟件需要多次手工處理修正的人物選框工作，Runway 通過簡(jiǎn)單的點(diǎn)擊，整個(gè)過程只需要 5s；
將一個(gè)動(dòng)態(tài)的人物從背景中剪輯出來加上火焰特效，協(xié)作使用 Runway 和 Adobe 的兩個(gè)人只用了 6 分鐘就完成了制作并導(dǎo)出結(jié)果，而只用傳統(tǒng)軟件的對(duì)照組進(jìn)度則遠(yuǎn)遠(yuǎn)落后。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

（圖源：Runway官網(wǎng) ）

但在產(chǎn)品的實(shí)際體驗(yàn)效果中，比如主推的視頻修復(fù)功能，我們發(fā)現(xiàn)只有在環(huán)境單一，光源固定，人群稀少的情況下，這個(gè)功能可以最大限度的發(fā)揮，但依然穩(wěn)定地?zé)o法完成高度精細(xì)化的任務(wù)，只能作為專業(yè)剪輯軟件的補(bǔ)充，所以在 Runway 推出類似功能后不到半年的時(shí)間里，專業(yè)剪輯軟件Davinci和 Adobe 就加入了類似功能。

3. 編輯視頻到生成視頻

團(tuán)隊(duì)在基于 GAN 模型尋找圖像生成方法的時(shí)候發(fā)現(xiàn)了 Diffusion模型，于是在團(tuán)隊(duì)算法科學(xué)家在 Disco Diffusion 基礎(chǔ)上進(jìn)行迭代優(yōu)化，構(gòu)建了 Stable Diffusion 的早期版本。

基于 Stable Diffusion 模型，團(tuán)隊(duì)開發(fā)了 text to image、image to image、無限圖像、Custom Training 等一系列 Magic Tools：

1）“無限圖像”功能

用戶可以通過文字編輯，為世界名畫拓展邊界，也可以生成各種沒有邊界的圖像。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

（圖源：Runway 無限圖像功能）

2）Custom AI training 功能

基于 Image to Image tools ，Runway 將過去模型托管平臺(tái)的服務(wù)升級(jí)為 Custom AI Training 產(chǎn)品，這類似于 Lensa AI 去年所推出的魔法頭像服務(wù)，用戶只需要上傳特定肖像、動(dòng)物、物品的多張照片，便可以直接進(jìn)行生成模型的訓(xùn)練，相當(dāng)于將 Fine-tune 民主化：

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

以前的 Runway ML lab

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

如今的 Runway AI Training

以肖像為例，用戶需要上傳 15-20 張個(gè)人照片，就可以支付 10 美元進(jìn)行訓(xùn)練，生成上百張生成圖片。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

放入 15-20 張個(gè)人照片

（圖源：Runway 官網(wǎng)展示肖像）

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

可生成上百張不同風(fēng)格照片

（圖源：Runway 官網(wǎng)展示肖像）

每次訓(xùn)練完成，除了一次性生成上百張肖像照，系統(tǒng)還會(huì)生成一個(gè)標(biāo)簽化的 prompt，之后可以在 Runway 文生圖平臺(tái)調(diào)用該 prompt 生成新肖像。

3）視頻生成功能

2023 年 2 月 6 日， Runway 推出 Gen-1 功能，并在 Discord 中開啟內(nèi)測(cè)，用戶可以在服務(wù)器里上傳一段視頻，并 @Gen-1 機(jī)器人后輸入風(fēng)格 Prompt，然后就可以得到相應(yīng)風(fēng)格的視頻，在社區(qū)中，我們可以看到用戶的三種輸入形式。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

（圖源：Discord 社區(qū)用戶 vkuoo）

用戶也可以在輸入視頻的同時(shí)，輸入風(fēng)格圖片作為參考，可以得到效果更好的視頻。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

（圖源：Discord 社區(qū)用戶 TecateVirus ）

當(dāng)然，同時(shí)輸入風(fēng)格圖片和文字描述也是允許的：

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

（圖源：Discord 社區(qū)用戶 FARGO）

在活躍的社區(qū)氛圍加持下，Gen-1 模型飛速迭代，并在 3 月 20 日發(fā)布升級(jí)版 Gen-2，展現(xiàn)出模型的巨大提升，目前已經(jīng)能夠很好地將場(chǎng)景、色調(diào)簡(jiǎn)單的幾何體變成酷炫的視頻，但對(duì)于復(fù)雜場(chǎng)景的視頻無法達(dá)到精細(xì)化的處理。

近期 Runway 開啟了手機(jī) APP 內(nèi)測(cè)，將 Image to Image 功能引入移動(dòng)端，模型會(huì)將用戶上傳的圖片解碼成 prompt 文本，用戶可以對(duì) prompt 進(jìn)行編輯，應(yīng)用也提供了多種風(fēng)格 prompt 模版。Runway APP 內(nèi)測(cè)版 UI 界面，目前只有圖像編輯功能。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

（圖源：Runway APP 截屏）

四、Runway 公司特色

1. AI 研究驅(qū)動(dòng)產(chǎn)品

Runway 的產(chǎn)品哲學(xué)很清晰：一直站在 AI 技術(shù)演進(jìn)的前沿，始終基于 AI 新技術(shù)的邊界尋找視覺創(chuàng)作的全新方式。

Runway 除了在 CVPR 和 NeurIPS 等會(huì)議上發(fā)表文章，還會(huì)舉辦講座和輔導(dǎo)，保持和學(xué)界的緊密聯(lián)系，并參與公共社區(qū)的建設(shè)，去年 Runway 的研究科學(xué)家 Patrick Esser 與德國慕尼黑大學(xué)的學(xué)者共同撰寫了 Stable Diffusion 的初始論文，Runway 隨后幫助構(gòu)建了 Stable Diffusion 的原始版本，并將該技術(shù)集成進(jìn)設(shè)計(jì)軟件的功能中。

Runway 團(tuán)隊(duì)不僅重視底層模型的研究，還十分崇尚全面的技術(shù)堆棧，團(tuán)隊(duì)希望能夠完全了解和控制產(chǎn)品部署及與用戶交互的方式，同時(shí)，在 CEO Cristóbal 看來，未來的單位算力成本會(huì)急劇下降，隨著硬件和軟件的優(yōu)化，我們將持續(xù)看到訓(xùn)練和模型運(yùn)行成本隨著時(shí)間推移而降低，在工程技術(shù)方面的投資是值得的。

Runway 采用 Pytorch 框架建立自己的模型，使用 AWS 的集群，同時(shí)會(huì)自建系統(tǒng)優(yōu)化模型訓(xùn)練流程，并且會(huì)采用 WebGL 加速器完成前端的優(yōu)化。在推理端，他們使用 C++ 技術(shù)棧，以方便實(shí)時(shí)對(duì)視頻編碼解碼過程，同時(shí)建立了一整套流媒體系統(tǒng)，并不斷地權(quán)衡模型的精度和速度，這保證了 Runway 對(duì)于自家產(chǎn)品的控制和表現(xiàn)力。

2. 云原生驅(qū)動(dòng)協(xié)作

在產(chǎn)品體驗(yàn)方面，Runway 的套件基于 Web 和云原生，同 Figma 和 Canva 一樣，這帶來了三個(gè)非常重要的好處：降低本地計(jì)算機(jī)性能要求，便于跨平臺(tái)協(xié)作，便于內(nèi)容分發(fā)。

CEO 在訪談中提到，希望未來大家制作視頻的感覺應(yīng)該類似于在 Google Docs 上的協(xié)作一樣，沒有必要下載和更新軟件，在合作者之間自由分享創(chuàng)作靈感，基于此，Runway 打造了基于合作為中心的一套自動(dòng)化創(chuàng)作工具。

Runway 關(guān)于 AI 相關(guān)的計(jì)算都是在云端遠(yuǎn)程處理的，為此公司針對(duì)音視頻的網(wǎng)絡(luò)端傳輸做了大量?jī)?yōu)化，可以預(yù)見，這家基于 AI 的云產(chǎn)品公司未來將會(huì)面臨巨大的網(wǎng)絡(luò)和服務(wù)器開銷。

五、定位與競(jìng)爭(zhēng)

1. 市場(chǎng)定位

從 CEO 的分享、客戶訪談綜合來看，Runway 的定位是專業(yè)級(jí)、電影級(jí)視頻制作，并希望在未來得到更廣泛用戶的青睞，Runway 目前在主推 AI 創(chuàng)作電影節(jié) 和 Gen-2 社群。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

（圖：Runway AI 電影節(jié)網(wǎng)站）

CEO 在最近的訪談中提到，Runway 的產(chǎn)品哲學(xué)不是做一個(gè)更好的 Photoshop 或者 Premiere ，它只是在尋找一種制作視頻、編輯圖像、音頻的新方法，其中的關(guān)鍵是 ML 驅(qū)動(dòng)，云原生，讓每個(gè)人都可以輕松在電腦和瀏覽器中制作專業(yè)級(jí)視頻特效。對(duì)于產(chǎn)品定位，Runway 的團(tuán)隊(duì)主要提到四點(diǎn)：專業(yè)、協(xié)作、快、很多 AI Magic Tools。

Runway 目前的客戶主要是電影級(jí)視頻編輯和特效制作者，他們的主要優(yōu)勢(shì)是更輕便、更高效，但其產(chǎn)品能力尚不足以撼動(dòng)專業(yè)軟件，他的機(jī)會(huì)在于基于視頻生成技術(shù)，讓更多的年輕人基于 Runway 進(jìn)行視頻創(chuàng)作和編輯，成為新一代的創(chuàng)作工具甚至內(nèi)容平臺(tái)。

客戶和從業(yè)人員這樣評(píng)價(jià) Runway：

? 一位主要在 TikTok 平臺(tái)創(chuàng)作視頻的特效編輯師：

Runway 的體驗(yàn)就是速度，我們想做一些看起來需要很長(zhǎng)時(shí)間才能完成的東西，但它可能只需要一兩天，擁有能夠非?？焖俚刂谱鞒稣嬲哔|(zhì)量的東西的工具是非常重要的，它改變了我的過程很多，當(dāng)您的項(xiàng)目截止日期非常緊迫，并且需要交付高質(zhì)量的東西時(shí)，您不想花時(shí)間在沒有成效的地方上，你不想做任何動(dòng)態(tài)描寫和清理工作，只希望專注于添加素材庫、添加所有效果，為了能夠在幾分鐘而不是幾天內(nèi)清理一些東西，它節(jié)省了項(xiàng)目。

? 一支負(fù)責(zé) The Late Show with Stephen Colbert （一檔 CBS 綜藝節(jié)目）的專業(yè)特效團(tuán)隊(duì)：

我們?cè)?jīng)用 Runway 拍攝了 Stephen Colbert 紀(jì)念 Americone Dream 冰激凌周年的音樂視頻，有一個(gè)場(chǎng)景是需要把冰淇淋放在不同背景中以夸大冰淇淋的影響力，但由于冰淇淋和背景顏色均過于復(fù)雜，團(tuán)隊(duì)嘗試了很多方法，都不是很成功，Runway 的圖像修復(fù)技術(shù)拯救了我們，將數(shù)小時(shí)的工作降低到幾分鐘，目前 Runway 已經(jīng)融入進(jìn)入團(tuán)隊(duì)的工作流。

? 一位自由職業(yè)戲劇導(dǎo)演、編輯和特效藝術(shù)家：

他主要使用 Premiere 做編輯和視覺特效，但會(huì)在大多數(shù)專業(yè)項(xiàng)目中使用 Runway ，Runway 可以幫助節(jié)約大量制作時(shí)間，雖然 Adobe 做了類似的功能，但體驗(yàn)不如 Runway，相比于雇很多專業(yè)的摳圖人員，日薪資 600-800 美元，Runway 每月低廉的訂閱費(fèi)讓人值得一試。

? 前 Netflix 制片人：

我會(huì)主要使用 Runway 的團(tuán)隊(duì)協(xié)作功能，但 Runway 這種基于新技術(shù)驅(qū)動(dòng)的編輯軟件，難以撼動(dòng) Adobe 。該項(xiàng)目有機(jī)會(huì)像曾經(jīng)的 Instagram 一樣，從圖片墻成為新一代社交或者內(nèi)容平臺(tái)。

基于上文的 AI 內(nèi)容生成對(duì)于視頻制作流程的增益和客戶的反饋，我們列出以下表格，并認(rèn)為 Runway 的客戶主要是專業(yè)影視制作用戶、業(yè)余用戶與潛在用戶：

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

業(yè)余用戶指的是平均每個(gè)月都會(huì)制作并在社交媒體發(fā)出一些非專業(yè)化的小視頻，潛在用戶指的是幾乎很少制作視頻，但目前是 Instagram 等社交軟件的用戶，目前除中國外 Instagram 月活用戶為 20 億，而 Tiktok 用戶為 10 億。

2. 競(jìng)爭(zhēng)分析

在視頻編輯產(chǎn)品層面，Runway 的主要競(jìng)爭(zhēng)對(duì)手既包括 Adobe 這種巨頭公司，也有 Descript、CapCut 類的輕量化視頻制作產(chǎn)品。

1）Premiere/Davinci

Premiere 是 Adobe 旗下的專業(yè)視頻編輯軟件，Davinic 是由 Blackmagic Design 公司開發(fā)的專業(yè)編輯軟件。在實(shí)際的工作流中，Runway 和 Premiere/Davinci 往往是相互補(bǔ)充的關(guān)系，而非競(jìng)爭(zhēng)關(guān)系，Runway 主打的是云端協(xié)作，便捷快速，在一些特定功能比如綠幕、摳圖，Runway 往往做得更好讓很多專業(yè)團(tuán)隊(duì)愿意為它付費(fèi)。

2）CapCut

CapCut 是剪映海外版，字節(jié)跳動(dòng)旗下的免費(fèi)視頻編輯和創(chuàng)作軟件，擁有各種娛樂性質(zhì)的視頻編輯功能，目前全球擁有數(shù)億用戶，Runway 目前與其沒有直接競(jìng)爭(zhēng)關(guān)系，但他們同時(shí)在搶奪未來的“潛在客戶”，隨著 Runway 的發(fā)展，未來勢(shì)必要正面挑戰(zhàn) CapCut，而 CapCut 的產(chǎn)品核心競(jìng)爭(zhēng)力其實(shí)是與 TikTok 的強(qiáng)綁定，所以在未來的戰(zhàn)場(chǎng)，Runway 需要綁定或者成為新的內(nèi)容平臺(tái)，才有機(jī)會(huì)成為最后的贏家。

3）Descript

Descript 是一款可以用文字編輯音頻和視頻的軟件，主推通過編輯文本來編輯視頻，是現(xiàn)在企業(yè)辦公方向視頻制作首選，和 Runway 的客戶群體并不相同，雖然 Runway 也期待面向企業(yè)級(jí)用戶，但 Runway 主推的是藝術(shù)類的視頻制作，而非辦公場(chǎng)景的視頻。

4）Veed

這是一家倫敦的初創(chuàng)公司，創(chuàng)始人 Keynejad 曾經(jīng)在設(shè)計(jì)工作室時(shí)要處理很多在線視頻，但他發(fā)現(xiàn)視頻處理軟件都龐大而臃腫，便開始構(gòu)建網(wǎng)頁視頻編輯器 Veed。截至 2022 年 2 月，Veed 有 100 萬用戶和 700 萬美元的 ARR，主要用戶是社交媒體視頻的創(chuàng)作者，從客群和面向的產(chǎn)品屬性看，目前該項(xiàng)目和 Runway 不構(gòu)成直接競(jìng)爭(zhēng)。

5）Vidyo.ai

是一個(gè)在線視頻編輯平臺(tái)，它使用 AI 技術(shù)幫助用戶從長(zhǎng)視頻中快速制作出適合在 TikTok、Instagram、LinkedIn 和 Facebook 等平臺(tái)分享的短視頻，在 2021 年 11 月獲得了 110 萬美元的種子輪融資，目前用戶數(shù)量不詳。Vidyo和 Runway 二者之間的競(jìng)爭(zhēng)關(guān)系是 Generative AI 應(yīng)用層和全棧應(yīng)用公司之間的競(jìng)爭(zhēng)，由于視頻生成和編輯的模型層仍舊在劇烈的變化，所以掌握核心的 AI 技術(shù)是更加穩(wěn)妥的選擇。

3. Text to Video 技術(shù)進(jìn)展

在 Diffusion 模型在圖片生成領(lǐng)域取得了重大成功后，各家研究團(tuán)隊(duì)都對(duì) Text to Video 展開了研究，目前比較領(lǐng)先的有：

1）Meta 于 2022 年 9 月發(fā)布了其下一代內(nèi)容制作工具 “Make-A-Video”。

他們主要將時(shí)間維度引入擴(kuò)散模型，基于對(duì)于圖片中關(guān)鍵語義生成幾個(gè)視頻特定幀，進(jìn)而通過插幀補(bǔ)全的方式完成視頻生成，目前沒有發(fā)布產(chǎn)品，官網(wǎng)展示了三個(gè)方向的 Demo：

通過輸入行為文字直接生成視頻；
將一張靜態(tài)圖片轉(zhuǎn)變成短視頻；
為一個(gè)視頻做背景、風(fēng)格切換。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

Meta 視頻生成技術(shù)架構(gòu)，采用先生成幾個(gè)關(guān)鍵幀，

再進(jìn)行插幀優(yōu)化方案

2）Google 在 2022 年 11 月份發(fā)布了 Google Imagen 視頻生成功能。

他們一方面和 Meta 一樣將時(shí)間維度引入擴(kuò)散模型，另一方面采用先生成低分辨率視頻，再進(jìn)行優(yōu)化的技術(shù)方案，目前還沒有公開內(nèi)測(cè)，從 demo 看效果優(yōu)于 Meta 的模型，但依舊存在可控性差、分辨率差、時(shí)間較短等各種問題。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

Google Imagen 視頻生成系統(tǒng) demo

3）Runway 于 2023 年 2 月發(fā)布了基于擴(kuò)散器模型的視頻生成模型 Gen-1。

不同于 Meta 和 Google ，他們摒棄了文本直接生成視頻的技術(shù)路線，而是將輸入的視頻的進(jìn)行逐幀風(fēng)格遷移，最后再將風(fēng)格進(jìn)行統(tǒng)一優(yōu)化的方案，這大大降低了視頻生成的難度，可以讓用戶更好地控制視頻的生成效果，并在和用戶的數(shù)據(jù)高效迭代六周后發(fā)布升級(jí)版 Gen-2 模型，可以說這是目前最領(lǐng)先的視頻生成模型：

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

Runway Gen-1 論文展示案例，

基于時(shí)序擴(kuò)散模型進(jìn)行視頻風(fēng)格遷移

OpenAI 在視頻制作和生成角度并沒有過多的進(jìn)展，但從內(nèi)部員工了解，他們已經(jīng)有一個(gè)更好的 DALL·E 模型，效果超越 Stable Diffusion，OpenAI 目前具有領(lǐng)先的大模型訓(xùn)練基礎(chǔ)和多模態(tài)技術(shù)，同時(shí)堅(jiān)持“大力出奇跡”的長(zhǎng)期戰(zhàn)略，沒有人知道他們未來將視頻數(shù)據(jù)引入大模型后，還會(huì)給公眾釋放什么樣的驚喜。

OpenAI 投資了視頻編輯軟件公司 Descript，并提供了 GPT4 接口的優(yōu)先使用權(quán)，Descript 的技術(shù)原理是將文本切片、音頻切片、視頻切片一一對(duì)應(yīng)，在用算法相關(guān)技術(shù)進(jìn)行快速匹配，而非大家所想象的 text to video 功能。

六、團(tuán)隊(duì)與融資

1. 公司發(fā)展

Cristóbal Valenzuela 是 Runway 項(xiàng)目的 CEO， 他本科就讀于智利排名第一的私立院校阿道夫伊瓦涅斯大學(xué) (AIU) ，獲得經(jīng)濟(jì)學(xué)和工商管理學(xué)士學(xué)位，并于 2012 年獲得了設(shè)計(jì)藝術(shù)碩士學(xué)位，畢業(yè)后留校任教。

從 2016 年開始，深度學(xué)習(xí)的進(jìn)展給了 Cristóbal Valenzuela 極大的震撼，他便選擇辭職去紐約大學(xué)進(jìn)行深造，成為了 Tisch 藝術(shù)學(xué)院 ITP （Interactive Telecommunications Program）項(xiàng)目的研究生，并開始尋找制作藝術(shù)、生成內(nèi)容和講述故事的新方法。

而 Runway 則是Cristóbal Valenzuela 的論文項(xiàng)目，在項(xiàng)目的開發(fā)過程中，他遇到了智利同胞 Alejandro Matamala，后者擁有過兩段創(chuàng)業(yè)經(jīng)歷，他隨后加入項(xiàng)目擔(dān)任聯(lián)合創(chuàng)始人，在畢業(yè)后，紐約大學(xué)為他們提供了一個(gè)研究實(shí)習(xí)機(jī)會(huì)，他們?cè)谀抢镉龅搅司哂胸S富開發(fā)經(jīng)驗(yàn)的智利同胞 Anastasis Germanidis，并說服他加入 Runway 擔(dān)任 CTO。

2022 年 12 月 5 日，Runway 的 CEO Cristóbal Valenzuela 在公司博客上宣布完成了 5000 萬美元 C 輪融資，估值 5 億美元。除著名風(fēng)險(xiǎn)機(jī)構(gòu) Felicis、Amplify Partners、Lux Capital、Coatue、Compound 和 Madrona 投資外，還有一批豪華天使陣容 —— Guillermo Rauch（Vercel CEO）、Amjad Masad（Replit CEO）、Howie Liu（Airtable CEO）、Soumith Chintala（PyTorch 負(fù)責(zé)人）、Lukas Biewald（Weights & Biases CEO）以及 Jay Simons（ex Atlassian 總裁）。

截止到目前，Runway 團(tuán)隊(duì)已經(jīng)有 42 人，與開源社區(qū)和許多研究機(jī)構(gòu)保持著良好的關(guān)系。

2. 收入預(yù)測(cè)

雖然 Runway 沒透露公司 2022 年的營收，根據(jù)福布斯的信源推斷其年?duì)I收可能不足五百萬美元，甚至僅有一百萬美元營收，由于最近半年 Runway 的產(chǎn)品形態(tài)發(fā)生了巨大的變化，所以往期收入并沒有足夠的參考價(jià)值。

Runway 收費(fèi)方式是個(gè)人專業(yè)版 12 美元/月，團(tuán)隊(duì)版 28 美元/月。

視頻編輯訂閱維度，Runway 可以成為 Adobe 的良好補(bǔ)充，相比于 Adobe 全家桶 110 美元/月的價(jià)格，Runway 的價(jià)格便宜了十倍左右，而傳統(tǒng)視頻后期團(tuán)隊(duì)的一個(gè)資深編輯的后期制作費(fèi)用大概在 250 美元/小時(shí)，一個(gè)只負(fù)責(zé)摳圖的編輯費(fèi)用也需要 60-80 美元/小時(shí)，而 Runway 可以在這一領(lǐng)域?yàn)樗麄児?jié)省幾個(gè)小時(shí)甚至幾天的工作，所以在專業(yè)領(lǐng)域?qū)用?，用戶有為其付費(fèi)的理由。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

在業(yè)余用戶和潛力用戶客群，Gen-2 目前是市場(chǎng)上最好的視頻生成模型，如果 Runway 可以將視頻生成功能和編輯工具形成閉環(huán)的產(chǎn)品，那么將吸引大量的 Youtube、Tiktok 視頻制作團(tuán)隊(duì)完全基于 Runway 進(jìn)行視頻制作。

參考 Adobe 、Canva、剪映（CapCut）的總用戶數(shù)和付費(fèi)人群，可以估計(jì)視頻編輯領(lǐng)域擁有潛力客戶有一個(gè)億左右，他們會(huì)傾向于嘗試免費(fèi)版的輕量化軟件，而潛在付費(fèi)用戶預(yù)計(jì)和 CapCut 同一數(shù)量級(jí)，為百萬數(shù)量級(jí)。

Runway：AI Native Tools工廠，視頻生成領(lǐng)域的字節(jié)跳動(dòng)

Canva、Figma 付費(fèi)用戶數(shù)量計(jì)算方法：基于年?duì)I收和客單價(jià)進(jìn)行估算；剪映（CapCut）付費(fèi)用戶量無數(shù)據(jù)來源，按總用戶量 1% 進(jìn)行估算；Davinci 商業(yè)模式更側(cè)重于軟硬協(xié)同，財(cái)報(bào)顯示客戶每年會(huì)使用 Davinci 平臺(tái)制作 150 萬個(gè)項(xiàng)目。

從成本角度，相比于 GPT 動(dòng)輒千億參數(shù)，Stable Diffusion 模型參數(shù)量并不大（8.9 億參數(shù)），同時(shí)其推理速度在快速優(yōu)化，所以相比于傳統(tǒng)的 SaaS 產(chǎn)品，引入 Stable Diffusion 模型并不會(huì)給成本帶來顯著增加。

七、關(guān)鍵討論與未來

1. 如何打造 AI Native 公司

AI-Native 的公司核心是能夠深入理解模型的能力，讓他們變得更加可控，方便與產(chǎn)品的深入結(jié)合。

Runway CEO 說：“多數(shù)追求‘一鍵生成視頻’制作工具的人都沒有經(jīng)歷過甲方的摧殘，盡管一些人將 Runway 當(dāng)成一站式的視頻制作工具，但 Runway 并不期待這樣，它應(yīng)該允許其他人使用不同的軟件組合，也可以成為別人工作流的一部分，Runway 主要幫助人們提高視頻制作的效率，降低重復(fù)勞動(dòng)?！?/p>

同時(shí) Runway 希望將人類的創(chuàng)造性引入創(chuàng)作環(huán)節(jié)，形成一個(gè)持續(xù)的反饋系統(tǒng)，這一方面要摒棄端到端的產(chǎn)品設(shè)計(jì)，另一方面需要掌握全棧 AI 技術(shù)。

但在語言模型層面，CEO 認(rèn)為 OpenAI 已經(jīng)創(chuàng)造了足夠好的模型，沒有必要自己從零開始訓(xùn)練，團(tuán)隊(duì)?wèi)?yīng)該專注于如何讓大模型變得更加可控，以期待更好的表現(xiàn)能力。

當(dāng)你有大型的語言模型，能夠?qū)⑾敕ㄞD(zhuǎn)化為內(nèi)容，你以你想要的方式在特定的空間或矢量方向上導(dǎo)航和移動(dòng)，你需要新的隱喻，你需要新的抽象。真正有趣和具有挑戰(zhàn)性的是，這些隱喻是什么？那些接口是什么？你如何確保你所建立的系統(tǒng)是真正具有表現(xiàn)力的？

2. Runway 的未來可能性

Runway 一直站在 AI 技術(shù)演進(jìn)的前沿，始終在基于 AI 新技術(shù)的邊界尋找創(chuàng)造、編輯圖像和視頻全新的方式。他們不希望做一個(gè)更好的 Photoshop 或 Premiere，而是希望借助云計(jì)算和 AI 的力量塑造全新的工作流。

Runway CEO 在接受訪談中表示：

“未來每一家公司都將會(huì)成為一家媒體公司，各種規(guī)模的公司都需要源源不斷的內(nèi)容來建立敘述，接觸他們的受眾和市場(chǎng)，特別是許多小型企業(yè)，他們的業(yè)務(wù)依賴于此。而當(dāng)涉及到客戶參與時(shí)，視頻的轉(zhuǎn)化效率比任何其他格式都要好得多。

Runway 的核心就是速度，未來創(chuàng)造專業(yè)的視頻，未必需要專業(yè)的機(jī)構(gòu)和工作室，和編輯過程打交道時(shí)昂貴且冗長(zhǎng)的，這就需要一款快速輕量化的工具軟件，我們看到了視頻領(lǐng)域強(qiáng)勁的長(zhǎng)尾效應(yīng)，因?yàn)楦骷?xì)分市場(chǎng)的大量客戶始終將視頻列為未來投資和工作的最重要的創(chuàng)意媒介?！?/p>

從近期發(fā)布看，Runway 有望成為下一個(gè)時(shí)代的內(nèi)容創(chuàng)作工具：

他們最近發(fā)布的 Custom AI Training 和 Gen-2 視頻生成功能都很適合移動(dòng)端，比如拍攝一張照片或一段視頻后經(jīng)過簡(jiǎn)單的特效處理和編輯就可以分享至社交和內(nèi)容平臺(tái)；
同時(shí)團(tuán)隊(duì)正在 APP 中內(nèi)測(cè) Image to Image 功能，這與上面兩種功能有著相同的技術(shù)棧；
倘若未來Runway 可以將視頻生成功能和編輯工具形成閉環(huán)的產(chǎn)品，那么將吸引大量的 Youtube、Tiktok 視頻制作團(tuán)隊(duì)完全基于 Runway 進(jìn)行視頻制作。