AI視頻新戰(zhàn)場:字節(jié)對決快手、反擊Sora

0 評論 188 瀏覽 1 收藏 14 分鐘

字節(jié)跳動以性價比策略切入市場,掀起價格競爭,但高性能模型仍保持付費門檻。B端市場對豆包視頻大模型的接納度有待觀察,其商業(yè)變現(xiàn)與用戶場景適配性成為主要考驗。

一場由Sora引發(fā)的AI視頻生成競賽,如今迎來新的競爭者!

9月24日,2024火山引擎AI創(chuàng)新巡展深圳站上,字節(jié)跳動的兩款A(yù)I視頻模型—豆包視頻生成-PixelDance、豆包視頻生成-Seaweed發(fā)布,并面向企業(yè)市場開啟邀測。

距離Sora已經(jīng)橫空出世已經(jīng)超過7個月,這段時間國產(chǎn)視頻大模型的發(fā)布此起彼伏,圍剿Sora在商業(yè)語境中似乎成為參與玩家的共有使命。

字節(jié)在七個月之后,才選擇正式蹚入這條沸騰之河,而此時在其面前,不止有Sora,一眾國產(chǎn)大模型弄潮兒,還有一個抖音眼熟的名字—快手。

老對手,新領(lǐng)域,可靈AI的影響力正在被加速釋放,在這一點上,字節(jié)如坐針氈,畢竟強如Sora,仍是外敵,而快手AI,早已殺到城下。

追逐使命還是修筑護城河,囊外還是安內(nèi),答案藏在視頻大模型里—字節(jié)不做選擇題。

Part.1 字節(jié)殺入,Sora遭遇圍堵

無論戰(zhàn)局多么復雜,源頭都能追溯到Sora。

2024年2月,OpenAI公布的Sora AI視頻生成模型成為全世界的焦點,憑借提供提示詞描述或者靜態(tài)圖片,Sora就能生成超高畫質(zhì)、質(zhì)感直逼電影的畫面,最高能達到1分鐘視頻的體量,直接震撼了國產(chǎn)大模型行業(yè)。

隨后,國產(chǎn)廠商集體發(fā)力視頻大模型,才有圍堵Sora的大趨勢?!渡墒紸I商業(yè)落地白皮書》顯示,當前有53%的中國企業(yè)已開始有組織地進行生成式AI布局。

這意味著,很多中國企業(yè)已意識到生成式AI技術(shù)對于自身發(fā)展的重要性,并將在其中投入資源和精力。

而自今年5月起,國內(nèi)達到類Sora級別的 AI 視頻模型技術(shù)陸續(xù)公布,生數(shù)、智象未來(HiDream.ai)等腰部企業(yè)輪番登場,智譜AI推出視頻生成模型“清影”、愛詩科技發(fā)布視頻生成產(chǎn)品PixVerse V2、生數(shù)科技上線視頻生成模型Vidu扎堆七月亮相,整個賽道熱鬧非凡。

但一眾視頻大模型追趕Sora的過程,有一家的產(chǎn)品可謂一鳴驚人,它就是6月6日開啟邀測的快手可靈 AI 視頻生成模型。

快手可靈剛一推出,就憑借參數(shù)博得了市場的關(guān)注:視頻分辨率高達1080p,時長最高可達2分鐘(幀率30fps),單次文生視頻時長已增至10秒,指標全部位于業(yè)績前列。

工具從來都是輔助,而快手可靈俘獲用戶的速度之快,讓人始料不及。在快手光合創(chuàng)作者大會上,官方透露的數(shù)據(jù)為:超過 160 萬人使用過快手的視頻生成大模型可靈AI,累計生成超 1600 萬條視頻。

口碑、熱度、性能俱佳,可靈AI成為目前國內(nèi)排名最高的視頻生成類AI應(yīng)用,自然是水到渠成。

對手收獲掌聲,字節(jié)五味雜陳。實際上,字節(jié)在AI大模型的布局比快手還早。2023年8月,該公司上線首個大語言模型“豆包”及多模態(tài)大模型BuboGPT。其抖音云雀大模型通過首批《生成式人工智能服務(wù)管理暫行辦法》備案,面向公眾開放;字節(jié)跳動基礎(chǔ)模型發(fā)力語言和圖像兩種模態(tài)方向。而在AI應(yīng)用層,字節(jié)跳動不僅已去年11月成立新AI部門Flow,還已推出三款A(yù)I對話類產(chǎn)品,包括豆包、扣子和Cici。

但是,需要注意的是,字節(jié)AI產(chǎn)品對平臺內(nèi)容的加持是否得到市場認可,還需要進一步驗證,而在B站等內(nèi)容平臺中,用AI二創(chuàng)視頻已經(jīng)成為賽道,同時也降低了創(chuàng)作者門檻,為平臺擴充內(nèi)容提供了有力支撐。

抖快之爭向來是短視頻賽道的焦點,而當對手手握超級武器后,字節(jié)自然如坐針氈,本次隆重推出的兩款視頻模型,既是與Sora一爭高下,更是與快手的軍備競賽,攘外安內(nèi)的字節(jié),接下來勢必動作頻頻。

Part.2 不拼參數(shù)拼場景,誰來買單?

當前,視頻大模型最能直觀打動人,就是參數(shù),但本次字節(jié)推出視頻大模型,卻反其道而行之,到目前為止字節(jié)仍未透露兩款產(chǎn)品可以生成的最大時間長度。

如此重要的內(nèi)容沒有公布,原因可能只有一個:還有其他更重要的東西需要被市場了解。字節(jié)相關(guān)人士在介紹本次模型的特點時,多次強調(diào)其為多場景而生,其中三個核心功能更是頗為驚艷。

精準語義理解上,豆包AI視頻生成能夠遵從復雜的用戶提示詞,形成多個主體、人、物之間的互動畫面。

畫面展現(xiàn)上,豆包AI視頻具有逼真的動態(tài)與絲滑的運鏡,并具備變焦、環(huán)繞、平搖、縮放、目標跟隨等多鏡頭語言能力,靈活控制視角,同時保持主體、風格和氛圍的一致性。

畫質(zhì)上,大模型支持包括黑白、3D 動畫、2D 動畫、國畫等多種風格,包含1:1、3:4、4:3、16:9、9:16、21:9 六個比例,適配于各種終端,以及電影、手機豎屏等不同畫幅,質(zhì)感優(yōu)秀,格調(diào)出眾。

實際上,豆包視頻大模型在多場景上的發(fā)力,也正是字節(jié)大模型商業(yè)化的設(shè)計構(gòu)想,電商、城市文旅、音樂 MV、微電影、短劇等應(yīng)用場景,都是豆包·視頻生成模型助力客戶實現(xiàn)降本提效和創(chuàng)意合規(guī)的主戰(zhàn)場。

可以說,豆包視頻大模型聚焦ToB業(yè)務(wù)的商業(yè)邏輯十分清晰,而下一步則是依靠價格殺出重圍。早在今年 5 月,火山引擎推出的豆包大模型把價格降至最低每千 token 低于一厘錢,比行業(yè)便宜99.3%,燃起了大模型廠商的價格戰(zhàn)。

字節(jié)視頻大模型相關(guān)人士曾透露當下價格與市場份額之間的關(guān)系:價格降十分之一,量就可能漲十倍。這種量價關(guān)系下,對于先期獲得市場的大模型廠商來說,勢必要跟進低價策略。

以豆包語言模型為例,據(jù)官方披露,截至 9 月,豆包語言模型的日均 tokens 使用量超過 1.3 萬億,多模態(tài)數(shù)據(jù)處理量也分別達到每天 5000 萬張圖片和 85 萬小時語音。

這就是低價的魔力,但需要注意的是,慘烈的價格戰(zhàn)中,各方拿出手的基本是偏輕量化的模型版本,壓箱底的高性能模型并沒有參與,這多少說明了大模型廠商的態(tài)度:給點甜頭嘗嘗,但要好的,得買單。

B端會不會為豆包視頻大模型買單,還需要觀察。但從以往大模型的落地來看,B端市場的需求適配用時并不會太短,而降本增效的核心訴求如何滿足,考驗的不僅是廠商大模型的能力,更是用戶自身對業(yè)務(wù)邏輯梳理打磨的能力。換言之,大模型這份收入,很難掙。

Part.3 AI驅(qū)動,打破版權(quán)壁壘

抖音的長視頻野望,可以靠AI視頻大模型內(nèi)容生成來作為支撐。

隨著流量進入存量周期,短視頻平臺用內(nèi)容留存用戶,成了當務(wù)之急,2018年短視頻用戶規(guī)模增長率為107.0%,2020迅速降低到15.2%,而抖音DAU破6億后,出現(xiàn)了增長放緩的態(tài)勢。

老對手快手的情況更為明顯,據(jù)快手2024年一季度財報顯示,快手實際月活人數(shù)為6.97億,較上一季度環(huán)比下降0.4%,呈現(xiàn)流失趨勢,二季度平均月活為6.92億,再次下探。

這可能才是視頻大模型最需要解決的問題:內(nèi)容創(chuàng)作賦能,保住用戶規(guī)?;颈P。

在豆包視頻大模型發(fā)布前,《山海奇鏡之劈波斬浪》和《三星堆:未來啟示錄》就是抖音和快手在AI內(nèi)容領(lǐng)域的官方嘗試,前者屬于AI科幻短劇,后者則是AI奇幻短劇。

官方作品具有引導意義,但要想撬動更多內(nèi)容創(chuàng)作者加入賽道,還需要更多行動。

不過,AI內(nèi)容創(chuàng)作這一點上,抖音與快手態(tài)度趨同:鼓勵,但反對低質(zhì)。今年6月,快手電商發(fā)布了使用AIGC能力直播的倡議公告,鼓勵商家/達人和老鐵們進行良好互動,但明確了流量不會傾斜,避免低質(zhì)內(nèi)容。來到9 月 8 日,抖音則公布了關(guān)于“發(fā)布特定內(nèi)容需主動添加標識”的公告,鼓勵創(chuàng)作者尊重事實、發(fā)布客觀真實信息,同時對于特定信息,應(yīng)以“內(nèi)容標識”的形式提供充分的說明,降低用戶的理解成本。

但事實上,創(chuàng)作者和用戶顯然更關(guān)注AI創(chuàng)作帶來的娛樂性,“容嬤嬤喂紫薇吃香腸”“唐僧啃雞腿、吃漢堡”“悟空掏手槍”“爾康失態(tài)”等無腦爆改短視頻風靡全網(wǎng),以腦洞、爆笑等元素獲得了粉絲的關(guān)注,抖音上,相關(guān)話題“當AI擴圖卷土重來”登上熱榜,截至目前共有3.9億次播放。

對于抖音來說,這是個不錯的開始,內(nèi)容拓展后,粉絲粘性提高、收入提升、制作成本下降,都是AI視頻大模型帶來的優(yōu)勢,當然抖音更大的期待,還包括規(guī)避版權(quán)費風險。

兩年前,愛奇藝、優(yōu)酷、騰訊視頻等長視頻平臺,70多家影視機構(gòu)、數(shù)百名藝人先后兩次公開發(fā)布“聯(lián)合聲明”,呼吁短視頻平臺和公眾賬號生產(chǎn)運營者尊重原創(chuàng)、保護版權(quán),強調(diào)未經(jīng)授權(quán),不得使用影視作品侵權(quán)創(chuàng)作,這份聲明中明確指出將對侵權(quán)行為依法追責。矛頭直指抖音等短視頻巨頭。隨后,抖音與騰訊更是因《云南蟲谷》和《亮劍》等作品,互告對方侵權(quán)。

和解發(fā)生在短劇爆火后,長短視頻巨頭為了進軍新市場握手言和,互相借助優(yōu)勢成為新趨勢。但從長遠看,抖音短視頻二創(chuàng)還依賴原創(chuàng)視頻素材,風險并未化解,而隨著AIGC內(nèi)容的開啟,抖音在版權(quán)側(cè)至少可以安心落地,二創(chuàng)的素材庫也更加豐富安全,確實是抖音樂得所見。

從這個角度看,字節(jié)的視頻大模型確實任重而道遠了。

參考資料:

1、《快手蓋坤:可靈AI已生成視頻超1600萬條,用戶超160萬人》,新京報

2、《抖音快手激戰(zhàn)人工智能大模型》,億邦動力

3、《豆包進擊,字節(jié)版Sora“雖遲但到” 火山引擎總裁譚待:一落地就開始考慮商業(yè)化》,每日經(jīng)濟新聞

4、《AI生成視頻,究竟有多癲狂?》,無限智能

作者丨蕭維 編輯丨蕨影

本文由人人都是產(chǎn)品經(jīng)理作者【科技新知】,微信公眾號:【科技新知】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Pixabay,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!