淺談當前的AI剪輯工具

3 評論 3375 瀏覽 11 收藏 37 分鐘

隨著AI技術(shù)的不斷進步,其在視頻制作領(lǐng)域的應用也日益廣泛。本文將探討當前AI在視頻制作中的應用,包括視頻分析、素材搜索匹配、視頻生成和剪輯工具等方面。同時,也將對比幾家主要的AI剪輯工具廠商的產(chǎn)品特點和發(fā)展思路,為讀者提供對AI在視頻制作領(lǐng)域應用的全面了解。

半年前,我寫了篇文章——《淺淡游戲行業(yè)當前的AI視頻工具》,將視頻制作流程分成了尋找靈感、制作草稿、收集素材、剪輯成稿。

其中需要的AI視頻能力分為了以下4類方向。

  1. 視頻分析:利用人工智能的分析和理解能力,提煉出美術(shù)設計所關(guān)注的核心信息,將大量縮成關(guān)鍵要點,從而提高尋找靈感的效率。
  2. 素材搜索匹配:基于視頻分析的AI技術(shù),通過對素材庫中的視頻進行分析、解構(gòu)和標記,再根據(jù)用戶提供的關(guān)鍵詞匹配最適合的視頻內(nèi)容,提高視頻類資源制作的效率。
  3. 視頻生成:基于生成式AI技術(shù),能夠通過文本和圖像內(nèi)容生成視頻內(nèi)容。
  4. 剪輯工具類:輔助視頻資源的制作,提高制作效率。

而最近在“視頻生成”方向,各家“視頻生成”廠商接連內(nèi)卷,先是快手可靈公布,然后是Luma公布,緊接著Runway公布了Gen3模型。用戶能夠在“沒有素材”或者“僅有圖片素材”時,使用這些工具進行“文生視頻”、“圖生視頻”生成視頻素材,隨著行業(yè)的發(fā)展,當前“視頻生成”也已發(fā)展到“抽多幾次還勉強能用”的階段。加上目前各家視頻生成能力平均成本為幾毛錢/1s,也就意味著平均幾塊錢能生成一個能用于生產(chǎn)的視頻素材片段,相比以前“將靜態(tài)圖片變成動態(tài)”的“K幀”動作“1人1天的工作量”成本,AI現(xiàn)在已經(jīng)能在某些場景下起到替代人力的作用了。

但是,這只是理想情況,在實際的業(yè)務中,AI視頻生成還是存在諸多問題的。

在和業(yè)務同事訪談時,問到“如何看待當前AI視頻生成能力時”,業(yè)務同事是這樣表示的,“偶爾抽多幾次,能抽到自己想要的東西。但有時候還是抽到想砸電腦,生成的東西總差點意思,想改又改不了?!?/p>

以下幾個例子,或許能幫助大家更直觀地認知。

可見,雖然AI能生成視頻片段素材,但是存在“指令識別不準”、“無法修改”、“模糊”、“主體不一致”、“物理運動BUG”等問題。這導致“視頻生成”僅僅能在“視頻質(zhì)量”要求較低的場景發(fā)揮作用。對于像是高精度的視頻訴求,AI無法滿足。

那么,像是“視頻分析、素材搜索匹配、剪輯工具類”的發(fā)展情況如何呢?這些能力或多或少有在目前的AI剪輯工具上有體現(xiàn),因此我特地研究了幾家AI剪輯相關(guān)的廠商的產(chǎn)品,下面我淺淺盤下。各AI剪輯廠商的發(fā)展情況

由于認知和精力有限,僅僅選取了幾個個人接觸較多的AI剪輯工具。?

01 剪映?

提到AI剪輯,第一個肯定是字節(jié)旗下的剪映。背靠字節(jié)的大模型底層能力、抖音系視頻生態(tài)提供的龐大剪輯需求量、多年的產(chǎn)品積累,剪映是所有AI工具中較為突出的那一個。下面我盤點下其部分部分AI能力。

1. 營銷成片

該功能可以基于輸入視頻素材片段和文案生成,對畫面內(nèi)容進行分析并裁剪,匹配最合適的視頻片段進行混剪視頻,然后加上BGM、字幕、配音,并支持導出與繼續(xù)編輯。

其中文案支持AI生成,用戶只需要提供產(chǎn)品名稱和相關(guān)的屬性,AI便能生成多個文案供用戶挑選。但個人覺得這個功能只能用于輔助激發(fā)創(chuàng)意,AI生成的結(jié)果往往不能直接使用,或者說生成的效果比較差。

選擇好文案后,AI會生成多個結(jié)果供用戶挑選,用戶可選中需要的內(nèi)容進行繼續(xù)編輯或者直接導出。

體驗下來,個人覺得這功能有點別扭,可能只能滿足非企業(yè)用戶(ToC)和成片質(zhì)量較低的企業(yè)用戶(ToB)的需求。(不是說功能不好,因為我是B端用戶,不滿足我的需求。)

“營銷成片”這個功能,很明顯是面向企業(yè)用戶(ToB)的。企業(yè)會需要在批量產(chǎn)生視頻素材的時候需要這類功能,那么企業(yè)的核心訴求是“較低成本產(chǎn)出符合業(yè)務最低限度訴求的大批量素材”,其中的要點是“低成本”、“符合業(yè)務最低限度訴求”、“大批量”。

剪映的“營銷成片”這里有個問題,在生成時可配置的內(nèi)容太少了,比如混剪邏輯、字體顏色、BGM這些內(nèi)容都無法配置,用戶只能按AI識別的內(nèi)容獲得生成的結(jié)果,這是個不可控的“黑盒”。對非企業(yè)用戶(ToC)來說,這是個很好的功能,他能降低使用門檻。但是對企業(yè)用戶(ToB)來說,這些不能配置的內(nèi)容會降低AI成品的質(zhì)量,導致不符合“業(yè)務最低限度訴求”。假設業(yè)務需要按音樂節(jié)拍混剪、字體使用制定字體、配音需要使用不那么呆AI配音,那么現(xiàn)在的“營銷成片”便無法滿足,需要人力額外花費時間修改。

所以ToB是最好能夠提供配置能力,在一開始預設好該配置的參數(shù),然后提交生成任務給計算機,人力就釋放出來去干其他事情了。而不是讓人力守在電腦前,一個個審核,然后去一個個編輯。如果用戶有精力一個個編輯修改,還不如從一開始就自己混剪,批量混剪一批視頻,也才幾個小時的工作量,都能和一個個編輯修改持平了。

對于成片質(zhì)量要求較高的企業(yè)用戶來說,AI的“高黑盒程度”導致AI成片無法滿足“符合業(yè)務最低限度訴求”,因此需要額外的人力成本進行修正,所以也無法滿足“低成本”和“大批量”的需求了。

2. 智能裁剪

該功能可以識別視頻人物主體位置,從而修改視頻的運鏡,保證人物主體在中心位置。這適用于運鏡較多的人物視頻,用于跟蹤人物主體。

視頻片段來自于B站主頁推薦的up“芋圓有點甜-”

3. 圖文成片

“圖文成片”這個功能有點和“營銷成片”類似,但是生成的是圖片拼成的視頻,而且更多面向于非企業(yè)用戶(ToC)。

該功能也是基于AI生成或者自己撰寫的腳本文案,再選上合適的AI音色,最后選擇自行上傳素材匹配 或是 交給剪映智能識別匹配。剪映匹配的內(nèi)容支持表情包和素材,這明顯是給非企業(yè)用戶生成娛樂向內(nèi)容用的。

嘗試了下,剪映匹配的素材能一定程度上匹配文本內(nèi)容,給到對應的圖片素材。我試了下生成絕區(qū)零的宣傳視頻,結(jié)果生成的靜態(tài)圖片素材帶有水印,多少有點尷尬。

而試了下生成螺螄粉的宣傳視頻,其中也出現(xiàn)了不知名品牌的片段。

這說明這里的圖文成片所匹配的素材庫,多少有點版權(quán)相關(guān)的風險,所以這項能力并不能用于企業(yè)用戶(ToB)的設計場景,還需要等圖片素材庫和AI匹配算法再發(fā)展一會兒。

而且如果要企業(yè)用戶(ToB)使用,這項能力和“營銷成片”存在同樣的問題,其可配置的內(nèi)容太少了,AI的“高黑盒程度”導致AI成片無法滿足“符合業(yè)務最低限度訴求”,因此需要額外的人力成本進行修正,所以也無法企業(yè)用戶(ToB)滿足“低成本”和“大批量”的需求了。

4. 視頻翻譯

這項能力可以在用戶上傳本人視頻的時候,將用戶口播的內(nèi)容翻譯成指定語言,并將口型轉(zhuǎn)換成對應語言的口型。在上傳視頻時候,需要進行本人認證,所以導致無法使用他人的視頻,避免直接搬運他人的視頻翻譯后上傳到別的網(wǎng)絡。

目前功能僅支持6種語言,而且轉(zhuǎn)換口型之后,在人物動作幅度或者角度不正的時候,嘴部有一些明顯的瑕疵。(有點好奇,后續(xù)剪映上線某些較長的語種的時候,會采用怎么樣的翻譯方案。)

5. 編輯器中的能力

剪映除了上面提到的AI功能,在視頻編輯器中也融入了AI能力,用于輔助視頻生產(chǎn)者提效。

這里涉及到的功能很多,比如生成文本、文本生成配音、識別字幕、識別音樂、鏡頭分割、人生分離,就不一一贅述了。

02 即創(chuàng)?

即創(chuàng)是巨量引擎旗下的“一站式智能創(chuàng)意生產(chǎn)與管理平臺”,用于幫助企業(yè)用戶在營銷場景下提供AI幫助的。相比起剪映,即創(chuàng)的能力直接面向企業(yè)用戶(ToB)。

其中的AI工具有視頻創(chuàng)作、圖文創(chuàng)作、直播創(chuàng)作模塊,而視頻創(chuàng)作相關(guān)的僅有“智能成片”和“AI視頻腳本”。

1. 智能成片

該功能通過添加腳本、音樂、口播等配置能力,利用AI生成多個版本的成片視頻。為了方便入門用戶和高度自定義用戶,即創(chuàng)還提供了“一鍵成片”和“高階成片”模式。

“一鍵成片”和前面提到的剪映的“營銷成片”一樣,可控制的元素太少了(混剪邏輯、BGM、聲音等都不可控),只能滿足成片質(zhì)量較低的企業(yè)用戶(ToB)的需求。而且相比起剪映,即創(chuàng)還無法二次修改,AI生成錯誤的內(nèi)容,想救也救不了。

比如下面的案例,即創(chuàng)會識別腳本中的關(guān)鍵文案,然后生成一些奇怪的特效。關(guān)鍵是這個特效抓得也不準,在成品中意義不明,也無法去掉。

“高階成片”在“一鍵成片”的基礎(chǔ)上增加了視頻前后貼、數(shù)字人、配音、音樂、字幕等的自定義選項,這較大程度上解決了“一鍵成片”和剪映的“營銷成片”的問題,使得企業(yè)用戶能“較低成本產(chǎn)出符合業(yè)務最低限度訴求的大批量素材”。

2. AI視頻腳本

該功能分為“腳本生成”和“腳本裂變”。

“腳本生成”是基于輸入的信息,利用AI生成腳本文案,支持跳轉(zhuǎn)到“智能成片”中進行快速生成。

就是個人感覺AI生成的腳本,估計只能滿足成片質(zhì)量較低的企業(yè)用戶(ToB)的需求。

“腳本裂變”則是基于已有的腳本進行派生,用AI模仿已有腳本批量生成更多的腳本。相對來說,“腳本裂變”生成的效果會相對更好,因為等于進行了提示詞工程,減少了AI發(fā)散的情況。

3. AI靈感

AI靈感功能會根據(jù)用戶當前主體下,歷史觸達人群、售賣商品、素材偏好、品牌調(diào)性、營銷偏好等多維歷史信息為用戶推薦素材內(nèi)容,以便激發(fā)用戶靈感創(chuàng)作。其中AI靈感功能便捷地提供了素材投放數(shù)據(jù)、視頻要點拆解和一鍵生成類似腳本的能力,方便用戶進行創(chuàng)作。

03 智能創(chuàng)作云?

智能創(chuàng)作云是火山引擎旗下的AI剪輯工具,也是一款面向企業(yè)用戶(ToB)的AI剪輯工具。其中涵蓋的能力有視頻混剪、智能腳本工具、自動剪輯成片、視頻拆條、視頻編輯器、視頻裁剪、虛擬背景、智能配音、添加品牌等。

由于能力有點多,下面挑一些重點來講解。

1. 視頻混剪

該能力可對目標混剪素材進行分組,并對每組素材進行排列/組合+內(nèi)容算法的智能拼接。根據(jù)多素材進行視頻混剪,裂變出更多視頻。適用于矩陣號投放場景,大幅降低營銷成本,迅速起號轉(zhuǎn)化。

相比起剪映和即創(chuàng)的能力,智能創(chuàng)作云的配置項更多,能力更抽象,能滿足更多B端業(yè)務場景。比如其支持按鏡頭組設置混剪,而不像剪映和即創(chuàng)完全依賴AI進行視頻編排。

2. 自動剪輯成片

自動剪輯成片支持用戶自定義導入圖片/視頻素材一鍵生成精美視頻,提供卡點、運鏡、動畫、特效等多種視頻效果元素,降低創(chuàng)作門檻,賦能創(chuàng)作表達。

但是測試了下,成品效果比較一般,里面由AI控制的部分太多了。

3. 其余能力

剩下這些能力就簡單文字概況下好了,和剪映、即創(chuàng)的能力有所重合。

  • 視頻編輯器:類似于剪映的視頻編輯器,提供包含音視頻裁剪、文字、特效、濾鏡、貼紙、轉(zhuǎn)場、字幕、配樂等常用能力。
  • 視頻裁剪:可更改視頻尺寸,并在部分有主體的視頻中,識別主體位置(類似于剪映的“智能裁剪”能力)。
  • 視頻拆條:可以結(jié)合視頻內(nèi)容進行拆分,可將長視頻分成多個短視頻。
  • 智能配音:將輸入的文字轉(zhuǎn)化為智能虛擬人聲配音,并支持添加背景音樂,生成MP3或WAV格式的音頻。

04?其他AI剪輯工具?

除了上面提到的剪映、即創(chuàng)、智能創(chuàng)作云,AI剪輯工具還有很多,比如:匯量科技的playturbo、美圖的奇覓、網(wǎng)易的見外工作室、筷子科技……

05 AI剪輯工具的發(fā)展思路

我們可以整體發(fā)現(xiàn),各家AI剪輯工具廠家提供的能力,其實和剪映、即創(chuàng)、智能創(chuàng)作云的大同小異。而且,個人覺得大體的功能建設思路差不多,都是:

  • 結(jié)合業(yè)務流程提供AI能力支持,積累AI單點能力。
  • 結(jié)合高頻需求串聯(lián)多個AI單點能力,構(gòu)建工作流能力。

“結(jié)合業(yè)務流程提供AI能力支持,積累AI單點能力”這個很好理解。

工具類產(chǎn)品目的是在業(yè)務流程上提供“使能”與“提效”的輔助。但是直接給整個業(yè)務流程進行輔助難度很大。所以我們需要“把復雜的問題簡單化”。我們可以將業(yè)務流程拆解成多個核心環(huán)節(jié),同時拆解出每個核心環(huán)節(jié)所需的能力,并基于這些能力需求提供AI單點能力。相比起直接提供面向整個流程的能力,基于單點訴求提供AI支持反而很簡單。因此這種基于業(yè)務流程提供AI單點能力支持是很好的AI功能切入點。

視頻制作的業(yè)務流程可分為“尋找靈感、制作草稿、收集素材、剪輯成稿”這四個階段。

  1. 尋找靈感:該環(huán)節(jié)重點是知道要做一個怎么的視頻,這個視頻需要達到什么樣的目的,并構(gòu)思其題材、內(nèi)容、音樂、字幕等相關(guān)內(nèi)容。因此能激發(fā)創(chuàng)作者靈感的功能都可視為該環(huán)節(jié)的內(nèi)容,比如即創(chuàng)的“靈感庫”。
  2. 制作草稿:將靈感構(gòu)思落地成腳本稿或者分鏡稿,形成視頻的主體框架大綱,并與相關(guān)的業(yè)務人員進行確認與核對。利用AI生成腳本稿的功能屬于該環(huán)節(jié),比如即創(chuàng)的“AI視頻腳本”、剪映“營銷成片”中的AI生成腳本稿能力。
  3. 收集素材:該環(huán)節(jié)需要收集用于成片的素材內(nèi)容,包括但不限于圖片、視頻片段、特效、配音、字幕、BGM等等。其中AI生成的圖片、視頻工具都屬于該環(huán)節(jié)。
  4. 剪輯成稿:基于收集到的素材,基于大綱進行剪輯,從而輸出成品稿。剪映的各項視頻剪輯工具就屬于該環(huán)節(jié)。

如下圖,基本上AI剪輯工具都能對應上一個環(huán)節(jié)。

基于這四個階段的能力建設,各家廠商還會提供將多個流程串聯(lián)起來的自動化能力。這便是前面提到的“結(jié)合高頻需求串聯(lián)多個AI能力,構(gòu)建工作流能力”思路。

比如各家廠商都有將“制作草稿、收集素材、剪輯成稿”三個環(huán)節(jié)串聯(lián)起來,提供一鍵生成成品的能力。

如果AI生成的成品準確度夠高,那么用戶只需要收集到靈感,就可以快速走完“制作草稿、收集素材、剪輯成稿”三個環(huán)節(jié),大批量低成本地生成符合需求的視頻內(nèi)容了。

因為單點AI能力的輔助提升是有限的,用戶一般在實際的業(yè)務中會使用到多個單點能力。假設用戶使用了AI腳本制作視頻的腳本稿,然后使用AI配音能力生成配音,緊接著使用視頻拆條功能剪輯視頻,最后到視頻剪輯器上完成剪輯。在多個功能上跳轉(zhuǎn)、傳輸素材文件十分耗費人力,而且其中存在很多機械的重復工作。

因此,基于這些機械重復的場景,將多個AI單點能力串聯(lián)成工作流,能進一步提升業(yè)務的效率,讓用戶做到一站式輸入輸出,極大釋放生產(chǎn)力。

06 后續(xù)思路推測

前兩個階段是當前能從市面上AI剪輯工具看出的建設思路,那在這之后呢?

個人覺得后續(xù)的思路會和我之前思考過的作文《淺談數(shù)字員工的實現(xiàn)路徑問題》有點類似。

之前梳理到的數(shù)字員工建設四個階段:

  1. 從“實習生”到“核心成員”。
  2. 將數(shù)字員工拆解成“技能”,把復雜問題簡單化。
  3. 業(yè)務流程數(shù)字化、線上化,并貼合業(yè)務流程聚合“員工技能”。
  4. 行為數(shù)據(jù)采集,用于進一步訓練AI模型,實現(xiàn)AI數(shù)字員工。

當前AI剪輯工具的兩個階段可以理解為各家廠商在嘗試構(gòu)造“AI數(shù)字員工”的各項剪輯能力,各家廠商需要持續(xù)發(fā)力,將AI剪輯能力建設到一定程度,以讓AI能夠覆蓋各個視頻制作流程,并一定程度能夠替代人力。這等同于跑通了數(shù)字員工的前三個階段。

然后各家AI剪輯廠商可以采集用戶AI的使用數(shù)據(jù)、參數(shù)設置、成品數(shù)據(jù)等內(nèi)容,用于訓練AI數(shù)字員工所需的AI模型。AI數(shù)字員工適用于“AI Agent”框架,即感知、計劃、行動三個模塊。

各家廠商實現(xiàn)的“AI剪輯能力”屬于“行動”模塊的構(gòu)建。

“感知”模塊則是用戶的需求輸入、素材輸入、業(yè)務的數(shù)據(jù)等外部情況。

“計劃”模塊則是我們所訓練的AI模型,“計劃”模塊需要感知用戶的需求、素材輸入、業(yè)務的數(shù)據(jù)等外部信息,輸出所需要產(chǎn)出的視頻內(nèi)容需求,然后調(diào)用合適的AI剪輯能力,進行視頻的產(chǎn)出,實現(xiàn)視頻的“無中生有”。

如此一來,各家AI剪輯廠商就可以配備自己的AI視頻員工能力,幫助各行各業(yè)自動化、智能化生產(chǎn)視頻內(nèi)容了。

07 誰更容易卷成

既然各家的核心思路都一致,小的就產(chǎn)生了一個新的疑惑——那么最終哪家能在這場AI剪輯領(lǐng)域的內(nèi)卷中勝出呢?

小的無法準確了解到每家公司的實際情況,但是個人覺得,能夠在這場競爭中卷成功的AI剪輯工具必定滿足以下條件:

  1. 用AI剪輯工具能吸引到足夠的目標用戶。(有用戶)
  2. 能夠跑通與用戶價值交換的商業(yè)邏輯。(能賺錢)
  3. 在前兩個過程中構(gòu)建自己的競爭壁壘,以源源不斷進行價值交換。(有壁壘)

先講講第一點“有用戶”的思考。

雖然AI剪輯工具都是為了視頻制作業(yè)務服務,但是也會根據(jù)對用戶進行細分,這里有四個分類方向。

  1. 按用戶類型:按用戶類型可分為非企業(yè)用戶(ToC)和企業(yè)用戶(ToC),非企業(yè)用戶會更傾向于制作內(nèi)容向的視頻,企業(yè)用戶則會有較大一部分是制作營銷向的視頻。
  2. 按行業(yè)類型:指比如游戲、動漫、電商等行業(yè)。
  3. 按視頻類型:可分為內(nèi)容向和營銷向。內(nèi)容向是指有進行非營銷目的內(nèi)容輸出與表達的視頻,比如游戲解說、電影解說、舞蹈、動漫混剪、vlog等。而營銷向則是指有一定營銷目的的視頻,比如產(chǎn)品推廣、品牌宣傳等視頻。當然,視頻可以同時屬于內(nèi)容向和營銷向兩個類別。
  4. 按視頻質(zhì)量:視頻也是有高低質(zhì)量之分的,有些視頻會包含良好的創(chuàng)意腳本、精美的畫面、優(yōu)秀的分鏡、動聽的BGM等內(nèi)容,這項視頻可視為高質(zhì)量的視頻。但是有些視頻腳本粗糙、畫面低劣、分鏡簡陋,是低質(zhì)量的視頻。不過,低質(zhì)量視頻并不意味著這些視頻沒用,低視頻也是有能發(fā)揮作用的地方,比如在廣告投放場景上,低質(zhì)量也能起到低成本獲客的作用。

AI剪輯工具會有自己的目標人群、所服務行業(yè)、視頻類型/視頻質(zhì)量制作傾向。

比如剪映的官網(wǎng)標語是“輕而易剪”,其目的是提供簡單的易用的剪輯工具,因此剪映的服務群體會相對更泛,各種用戶、行業(yè)、視頻類型都會涵蓋。

而即創(chuàng)和智能創(chuàng)作云是ToB的AI剪輯工具,一個是掛在廣告買量平臺上,一個作為SaaS工具被售賣,可見主打的就是給企業(yè)提供視頻制作服務。

不同的群體意味著有不同傾向的剪輯需求。AI剪輯工具如何把AI能力點(比如混剪、文生腳本、AI配音、視頻拆條等)結(jié)合用戶的需求和場景提供合適的工作流能力支持?并平衡好功能的標準化與定制化建設?這個問題是吸引用戶留存的關(guān)鍵。

比如面向C端用戶,功能不能太復雜,最好是一鍵式的傻瓜操作。而面向B端用戶,功能要有較好的標準化程度,才能更多地滿足企業(yè)在不同場景下的需求。

就拿各家都有的“混剪成片”能力來舉例說明,即剪映的“營銷成片”、即創(chuàng)的“智能成片”、智能創(chuàng)作云的“視頻混剪”,這幾個能力都是基于“混剪”這個AI能力點進行產(chǎn)品功能設計的。

所謂標準化,在B端產(chǎn)品設計中經(jīng)常用到,是指將多個類型的業(yè)務按統(tǒng)一的標準進行規(guī)范,使得在業(yè)務流程進行的過程中,不同類型的業(yè)務能按統(tǒng)一的標準進行,從而減少效率的損失。

如果在“混剪成片”能力上進行高度標準化建設,能使得“混剪成片”能力可滿足大部分的混剪需求。

在研究到的示例中,智能創(chuàng)作云的“視頻混剪”、即創(chuàng)的“智能成片”是標準化程度較高的,其中的混剪邏輯、視頻前后貼、數(shù)字人、配音、音樂、字幕等選項都可以自定義。但這樣帶來一個問題——功能復雜度提高,這導致用戶的學習成本變高了,實際生產(chǎn)中的操作成本也變高了。

所謂定制化,是指給特定的場景進行功能定制,使得在某些特定場景上做到“低配置成本的輸入和輸出”。而剪映的“營銷成片”能力就是相對定制化的能力,其可配置的輸入項做了減法,意在讓更多人上手這項功能能力。這也可能和“剪映的用戶群體涵蓋更多的非企業(yè)用戶”有關(guān)系,所以他們的功能需要更簡單、更容易上手,從而讓更多人能用上這些能力。

可見目前看到的各家剪輯工具,AI剪輯功能呈現(xiàn)上大體上都是較為符合用戶群體的需求的,差距就在于后續(xù)的功能推出、產(chǎn)品運營、產(chǎn)品營銷方面的手段差距了,這一塊暫時未能看出任何結(jié)論。

那么接下來是“能賺錢”這一點。

個人覺得,AI剪輯工具的商業(yè)模式是:AI剪輯工具通過提供視頻制作流程上的“使能”和“提效”服務,用戶為這項服務能力進行付費。只要AI剪輯能力能給到業(yè)務“使能”和“提效”的幫助,并且這個成本低于產(chǎn)出同等質(zhì)量和量級內(nèi)容的人力成本。

BTW,剪映在這一塊還會有點區(qū)別,因為剪映背后有抖音,其核心目的還有“為抖音的短視頻內(nèi)容生態(tài)提供生產(chǎn)輔助”,所以付費盈利不一定是剪映的核心商業(yè)模式。

目前各家AI剪輯工具都是直接開啟商業(yè)化,要么是按點數(shù)收費、要么是會員制,不存在虧本獲客,除非后續(xù)運營手段層面搞價格戰(zhàn)、搞買量、搞政策扶持,搞到ROI為負數(shù)、無法回本。

最后就是“有壁壘”這一點。

值得一提的是,除開自行訓練的大模型,AI剪輯中的大多數(shù)能力其實算不上“壁壘”。因此這些能力大多數(shù)都有開源的技術(shù),或者說通用的底層大模型能力,其他家廠商稍微研究研究也能做到同等的程度。因此要在后續(xù)繼續(xù)卷贏,必須得有自己的壁壘,這些壁壘可以是:

  • 自行訓練的大模型:除非企業(yè)基于自有的數(shù)據(jù)進行大模型訓練,且大模型有較好的效果,且其他廠商不能使用這個大模型,能夠給到與其他AI編輯工具有差異化的效果。那么,該大模型能力便可以算是技術(shù)層面的壁壘。
  • 剪輯能力:由于AI幻覺問題的存在,AI生成的結(jié)果中往往有一定的錯誤比例,如果能夠提供強大的編輯器作為兜底能力,便能一定程度環(huán)節(jié)壁壘的影響。比如剪映的編輯器已經(jīng)發(fā)展了好幾年,能夠提供十分完善的剪輯能力,相比起即創(chuàng)的“抽盲盒”模式,剪映的體驗會更好。
  • 素材庫:如果AI剪輯功能能夠調(diào)用龐大的素材庫,并對這些素材進行準確的AI分析分類,AI剪輯工具能在用戶的“尋找靈感”、“制作草稿”、“收集素材”環(huán)節(jié)提供高效的輔助。比如在特定場景上,提供一鍵成片能力,通過輸入的腳本關(guān)鍵詞,匹配準確的視頻片段畫面。

這些能力依賴于企業(yè)有垂直于用戶所屬行業(yè)的龐大素材庫,并且企業(yè)需要能夠有資源進行這些素材的處理和AI模型訓練。這個方向往往是需要企業(yè)能夠背靠龐大的視頻市場,比如背靠抖音的剪映、背靠巨量的即創(chuàng)。

  • 行業(yè)賦能能力:由于AI剪輯工具有行業(yè)之間的區(qū)別,如果能垂直賦能某一行業(yè),給某個行業(yè)提供更高效的能力支持,同時沉淀一些該行業(yè)的能力支持、最佳實踐案例(比如行業(yè)素材模板、工作流模板等等),那么企業(yè)也能在某個領(lǐng)域守住自己的一畝三分地。

08 總結(jié)

總的來說,AI剪輯工具目前也處于快速發(fā)展的階段,目前還存在一些技術(shù)和應用上的局限,但其潛力和前景不容忽視。隨著技術(shù)的成熟和市場的適應,我們有理由相信,AI將在視頻制作領(lǐng)域發(fā)揮更加關(guān)鍵的作用。

而其中誰能從中勝出,暫且也無從得知。但是個人認為,在其中能卷出頭的AI剪輯工具,必定符合“有用戶”、“能賺錢”、“有壁壘”這三個特點。

本文由人人都是產(chǎn)品經(jīng)理作者【檸檬餅干凈又衛(wèi)生】,微信公眾號:【檸檬餅干凈又衛(wèi)生】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 分析的很好啊。感覺AI用于剪輯的話,還是難在創(chuàng)意性和穩(wěn)定性上了。

    來自山西 回復
  2. 剪輯真的是一項技術(shù)活啊,特別是不合要求之后還得反復修改反復看,AI能幫忙的話,希望情況好一點。

    來自廣東 回復
  3. 什么?AI都會剪輯了???那真的省了很多力氣去學了,以前還想學一下來著

    來自北京 回復