智能剪輯功能調(diào)研報告:詳解抖音的音樂卡點模式

岳小魚
1 評論 11838 瀏覽 57 收藏 14 分鐘
🔗 产品经理专业技能指的是:需求分析、数据分析、竞品分析、商业分析、行业分析、产品设计、版本管理、用户调研等。

本文通過對市面上智能剪輯功能進(jìn)行體驗,挖掘不同產(chǎn)品的功能模式,還原產(chǎn)品的邏輯和結(jié)構(gòu),并通過競品對比分析,總結(jié)了智能剪輯功能的迭代方向。

01 調(diào)研背景

1. 什么是智能剪輯?

傳統(tǒng)的視頻剪輯,需要人工進(jìn)行大量后期處理工作,包括手動剪輯、拼接、選擇音樂、增加轉(zhuǎn)場、調(diào)色、字幕等,門檻較高,且耗時費力。

而智能剪輯則使得整個剪輯過程更加智能化、標(biāo)準(zhǔn)化、簡單化,可顯著降低創(chuàng)作門檻,提升普通創(chuàng)作者的創(chuàng)作意愿和創(chuàng)作能力。

市面上主流短視頻產(chǎn)品已經(jīng)普遍開發(fā)了智能剪輯功能,其中核心優(yōu)化了以下三個關(guān)鍵環(huán)節(jié):

(1)判斷素材的類型,智能組合剪輯;

(2)智能匹配音樂,結(jié)合智能剪輯,可生成音樂卡點視頻;

(3)智能增加動效,包括轉(zhuǎn)場、特效、濾鏡等豐富效果。

2. 為什么要做智能剪輯?

先上結(jié)論:智能剪輯功能可以有效降低普通用戶的生產(chǎn)門檻,幫助用戶進(jìn)行低成本地剪輯。

首先,說一下為什么主流的短視頻產(chǎn)品中有智能剪輯功能,而制作長視頻的專業(yè)剪輯軟件基本沒有這個功能。

一是因為用戶的正向選擇,使用專業(yè)剪輯軟件的用戶整體上有一定的制作能力,而日常使用短視頻APP用戶的制作能力普遍偏低,更適合使用輕量的智能剪輯功能。

二是載體本身的原因,長視頻更多是敘事結(jié)構(gòu),適合講故事,前后邏輯關(guān)系緊密,需要結(jié)合人的思考和創(chuàng)意,而機(jī)器智能暫時無法通過聲音、文字、圖像等素材理解其邏輯。

但是短視頻則要自由得多,偏個人向主題的也較多,比如自拍、旅游、美食等等,不需要復(fù)雜的剪輯。

其次,再看一下智能剪輯功能對短視頻產(chǎn)品本身的收益。

對短視頻產(chǎn)品來說,絕大部分用戶是消費者,只有少部分用戶是生產(chǎn)者,消費者們會去消費生產(chǎn)者們創(chuàng)作的內(nèi)容,消費者們雖然有一定的創(chuàng)作意愿,但創(chuàng)作能力較弱,消費者轉(zhuǎn)變?yōu)樯a(chǎn)者的成本也較高。

即便是UGC生態(tài)的短視頻產(chǎn)品,也會逐漸從UGC發(fā)展為PGC,中間態(tài)就是所謂的UPGC。

在這個過程中,大量普通用戶生產(chǎn)的低質(zhì)量、低價值內(nèi)容會被篩選掉,而專業(yè)用戶生產(chǎn)的高質(zhì)量、高價值內(nèi)容會獲得更多曝光,到最后,我們在短視頻產(chǎn)品中看到的就基本是專業(yè)用戶生產(chǎn)的內(nèi)容了。

那為什么還要做針對普通消費者或者說尾部生產(chǎn)者的智能剪輯呢?

因為普通用戶依舊存在生產(chǎn)需求,有一定的生產(chǎn)意愿,會拍攝旅游、美食或者記錄重要的生活事件等等,而制作視頻后常常會發(fā)布在朋友圈、微博、抖音、快手等社交網(wǎng)絡(luò)中,或者直接分享給自己的家人朋友。

也就是說生產(chǎn)視頻需求的背后,本質(zhì)是社交需求。

這和消費視頻完全是兩個邏輯,幫助頭部創(chuàng)作者進(jìn)行生產(chǎn),是為了普通消費者有內(nèi)容可看,但激勵并幫助普通用戶生產(chǎn)內(nèi)容,則是促進(jìn)用戶使用產(chǎn)品的一個重要手段,同時可以豐富UGC生態(tài),最終涌現(xiàn)出專業(yè)生產(chǎn)者。

總結(jié)一下:

(1)目標(biāo)用戶:尾部生產(chǎn)者,典型特征是低粉、無固定創(chuàng)作主題、作品偏個人向。

(2)使用場景:拍攝旅游、美食或者記錄重要的生活事件后,想要做一個短視頻分享到自己的社交網(wǎng)絡(luò),但是專業(yè)的視頻剪輯軟件太復(fù)雜,不太會用,也沒有時間去琢磨。

(3)滿足需求:表面滿足了小白化制作短視頻的需求,本質(zhì)是滿足了社交需求、炫耀心理。

02 調(diào)研目標(biāo)

了解市面競品智能剪輯功能的優(yōu)劣,并結(jié)合實際的業(yè)務(wù)場景與技術(shù)能力,輸出可落地的產(chǎn)品方案。

03 調(diào)研詳情

1. 競品速覽

頭部競品:抖音、快手

腰部競品:微視、VUE、美拍、小影

跨域競品:大疆、Quik

根據(jù)上表的概覽,會發(fā)現(xiàn)【智能剪輯】功能的核心要素有三個:剪裁、音樂和視覺。

首先,算法會對素材內(nèi)容進(jìn)行分析,識別素材的場景,然后匹配對應(yīng)的音樂和動效。

每個音樂都會有相應(yīng)的節(jié)拍點,根據(jù)節(jié)拍點,會對每段素材剪裁為一定的播放長度,然后拼接在一起。

這里會出現(xiàn)另一個問題,就是怎么找到每段素材中的高質(zhì)量精彩片段?

因此也需要借助算法,識別和篩選素材中的精彩片段進(jìn)行合理剪裁。

而視覺效果包括轉(zhuǎn)場特效、畫面裝飾、濾鏡、貼紙等,也需要識別素材的對應(yīng)場景進(jìn)行匹配。

通過上述的分析會發(fā)現(xiàn),根據(jù)剪裁、音樂、動效三者之間的關(guān)系,市面上主流的【智能剪裁】功能的模式有三種:

(1)【音樂可選+無動效】:音樂根據(jù)素材進(jìn)行匹配和推薦,可手動切換,素材會根據(jù)音樂再次剪裁,無轉(zhuǎn)場、頁面裝飾等視覺效果,典型代表是抖音;

(2)【音樂固定+動效固定】:音樂和動效綁定,兩者都是固定的,不能組合,也就是集成為“模板”,每個模板的剪裁也是固定的,此時需要用戶自己手動選擇模板,典型代表是微視;

(3)【音樂可選+動效可選】:音樂根據(jù)素材進(jìn)行匹配和推薦,可手動切換,素材會根據(jù)音樂再次剪裁,同時轉(zhuǎn)場、頁面裝飾等視覺效果集成為統(tǒng)一風(fēng)格的“主題”,可進(jìn)行切換,典型代表是快手和VUE。

2. 核心競品詳述

根據(jù)以上分析,音樂智能匹配和視頻精彩片段智能選取,這兩個關(guān)鍵環(huán)節(jié)主要依靠算法解決,對于用戶而言相當(dāng)于黑盒。

而另一個關(guān)鍵點,怎么依靠音樂節(jié)拍點劃分素材的長度,則有規(guī)律可循,因此,下文將針對抖音的音樂卡點模式進(jìn)行簡單實驗,推測其智能剪裁規(guī)則。

整體分為三個環(huán)節(jié):導(dǎo)入素材、制作流程、發(fā)布。

導(dǎo)入素材:可同時導(dǎo)入圖片和視頻,素材總數(shù)的上限是35。

制作流程:默認(rèn)音樂卡點模式,會根據(jù)匹配的音樂,對素材進(jìn)行裁剪,也可以手動調(diào)整素材片段的順序,但是因為每個音樂的卡點位置是固定的,因此每個素材片段剪裁的長度也是固定的,只能調(diào)整每段素材剪裁的位置。

舉個例子,我上傳了4段視頻,基于匹配的音樂自動剪裁后,4段素材分別的長度為:5.6s、4.4s、4.4s、5.6s。

現(xiàn)在我將第4段素材(有人像)的位置從第4個位置移動到第2個位置,然后第4段視頻(有人像)的長度從5.6s轉(zhuǎn)變?yōu)?.4s,也就是說根據(jù)素材的數(shù)量會計算音樂卡點的位置,分配相同數(shù)量的位置,每個位置的長度是固定的。

接下來,將通過簡單實驗,歸納總結(jié)其裁剪規(guī)則。

在此次簡單實驗中,通過將素材總時長逐漸增加,從3秒到890秒,我們可以看到以下規(guī)律:

(1)素材數(shù)量>=2時,才能進(jìn)入【音樂卡點】模式;

(2)素材總時長30秒左右是臨界點

  1. 總時長在30秒以下的素材,裁剪后保留的比例為55%~60%;
  2. 總時長在30秒以上、50秒以下的素材,裁剪后保留的時長逐漸貼近20秒,保留的時長不再有大幅的增加;
  3. 總時長在50秒以下的素材,裁剪后保留的時長穩(wěn)定在20秒左右,因此保留的比例會迅速下跌;

(3)抖音導(dǎo)入素材的限制是,每段素材必須大于1秒,且素材的總數(shù)量不能超過35個;

  1. 通過實驗可以看到,剪裁后的總時長上限為20秒,在最多35段素材的情況下,平均每段素材剪裁后的長度為0.57秒,因此可見”35“基本接近了維持視頻最終效果的極限,素材數(shù)量再增多,將會影響視頻效果;
  2. 隨著素材數(shù)量和素材時長的增加,每段素材剪裁后的時長將逐漸接近1秒,直至1秒以下,因此需要限制每段素材必須大于1秒。

04 結(jié)論與方案

本次報告通過對市面競品的掃描,總結(jié)歸納了市面上主流【智能剪輯】功能的三種模式:

(1)【音樂可選+無動效】:音樂根據(jù)素材進(jìn)行匹配和推薦,可手動切換,素材會根據(jù)音樂再次剪裁,無轉(zhuǎn)場、頁面裝飾等視覺效果,典型代表是抖音;

(2)【音樂固定+動效固定】:音樂和動效綁定,兩者都是固定的,不能組合,也就是集成為“模板”,每個模板的剪裁也是固定的,此時需要用戶自己手動選擇模板,典型代表是快手、微視;

(3)【音樂可選+動效可選】:音樂根據(jù)素材進(jìn)行匹配和推薦,可手動切換,素材會根據(jù)音樂再次剪裁,同時轉(zhuǎn)場、頁面裝飾等視覺效果集成為統(tǒng)一風(fēng)格的“主題”,可進(jìn)行切換,典型代表是VUE。

并針對抖音的音樂卡點模式進(jìn)行了拆解,通過實驗推測其智能剪裁的規(guī)則:

(1)總時長在30秒以下的素材,裁剪后保留的比例為55%~60%;

(2)總時長在30秒以上的素材,裁剪后保留的時長逐漸貼近20秒;

(3)導(dǎo)入的每段素材必須大于1秒,且導(dǎo)入的素材總數(shù)量不能超過35個,這樣才能保證最終的視覺效果。

但是只了解其規(guī)則是不夠的,需要能夠輸出為可落地的方案才有價值。

接下來,我將結(jié)合多個競品的功能亮點,并刪繁就簡,初步策劃足夠簡單、足夠好用的【智能剪輯】功能。

  1. 建議采用【音樂可選+動效可選】的模式,即根據(jù)上傳的素材進(jìn)行場景識別,智能匹配音樂和相關(guān)的視覺主題。
  2. 素材需根據(jù)所匹配的音樂進(jìn)行智能裁剪,用戶手動更換音樂,需再次裁剪。
  3. 視覺主題則采用通用樣式,包括通用性的頁面裝飾、濾鏡和轉(zhuǎn)場特效,用戶可手動更換,對素材剪裁沒有影響。
  4. 用戶手動剪裁素材或調(diào)整素材順序需要客戶端的渲染能力,成本較高,可考慮在后續(xù)迭代。

 

 

本文由 @岳小魚 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 更多產(chǎn)品思考,歡迎關(guān)注微信公眾號,搜索:岳小魚

    來自浙江 回復(fù)
专题
16085人已学习12篇文章
数据中台是处于业务前台和技术后台的中间层。本专题的文章分享了如何搭建数据中台。
专题
12427人已学习14篇文章
近年来,盲盒大量出现在公众视野,引起了一波又一波消费热潮。本专题的文章分享了解读盲盒营销。
专题
15608人已学习14篇文章
在我们的生活中,因为大数据的应用,很多事情变得越来越便利。本专题的文章分享了大数据的应用场景。
专题
16964人已学习14篇文章
图标是用户页面不可缺少的元素,本专题的文章分享了图标设计指南。
专题
14996人已学习13篇文章
本专题的文章分享了搭建营销中心指南。