四川少妇BBB凸凸凸BBB,中文字幕无码乱伦,国产福利一区二区三区在线视频

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

OpenAI Sora畫的餅，AI行業(yè)集體給它圓了……嗎？

松果財經(jīng)

2024-08-14

0 評論 215 瀏覽 0 收藏

11 分鐘

AI-generated Video領(lǐng)域的競爭日趨激烈，隨著技術(shù)的進(jìn)步和應(yīng)用場景的拓展，這一領(lǐng)域正成為AI技術(shù)落地的熱點。從國內(nèi)外的快手、字節(jié)、智譜AI到谷歌、Luma、Runway等公司，都在積極探索AI視頻生成的新模式和新應(yīng)用。然而，盡管技術(shù)可用性提高，風(fēng)格化特征豐富，AI視頻工具在融入工作流方面仍存在不足。

AI文生視頻領(lǐng)域，幾乎只剩Sora還是個期貨了。

最近兩個月，國內(nèi)外的AI-generated Video應(yīng)用持續(xù)爆發(fā)，中國的快手、字節(jié)、智譜AI、生數(shù)科技、愛詩科技，海外的谷歌、Luma、Runway，格局如八仙過海。

雖然不同平臺水平差異依舊存在，但整體可用性已經(jīng)大大提高，而且風(fēng)格化特征也比較全面。唯一的缺憾是，在融入工作流方面，AI視頻工具們的水平還是差了一點。Sora畫的餅，要交給這些后來者去圓了。

01 放棄期貨，文生視頻應(yīng)用爆發(fā)

業(yè)界民間都把視頻視為AI應(yīng)用落地的重點領(lǐng)域。英偉達(dá)CEO黃仁勛在7月30日的全球頂級計算機(jī)圖形學(xué)會議SIGGRAPH 2024上邀請了Meta的CEO扎克伯格進(jìn)行對話，雙方都認(rèn)可視頻能力會是AI大模型的進(jìn)化方向。

出身于英偉達(dá)研究小組的Luma AI首席科學(xué)家宋佳銘，在與a16z合伙人Anjney Midha對談時說，視頻關(guān)聯(lián)著3D世界，從學(xué)習(xí)角度看，視頻數(shù)據(jù)使模型更好地理解和推理3D世界。所以，實時高質(zhì)量的視頻生成，最終會推動具身AI的發(fā)展。

視頻就是這樣一座“橋”，而現(xiàn)在大量的AI公司正在試圖搶先通過它，尤其是OpenAI讓Sora變成了外界用不到的期貨，給了其他平臺進(jìn)一步發(fā)展的空間。

超長戰(zhàn)線背后是這些公司的試探。一部分是關(guān)于商業(yè)模式，另一部分是關(guān)于技術(shù)應(yīng)用前景。

可靈、即夢、Vidu等都推出了會員訂閱模式，在C端進(jìn)行應(yīng)用普及化嘗試。愛詩科技創(chuàng)始人王長虎此前在接受財新采訪時表示：“愛詩目前的策略以2C（面向消費者）為主，廣泛收集國內(nèi)外用戶反饋，以更好地基于用戶體驗迭代底層模型?！敝劣诟h(yuǎn)的應(yīng)用，現(xiàn)在來談則為時尚早，主要是因為C端的收費模式無法承擔(dān)成本。

Luma AI采取了To C的產(chǎn)品形態(tài)，不過它原本專注于3D領(lǐng)域，進(jìn)入視頻生成領(lǐng)域是為了探索3D生成與重建的更多可能性，以視頻驅(qū)動3D發(fā)展。這在產(chǎn)業(yè)領(lǐng)域有更多的應(yīng)用前景，例如批量制造電影需要的三維素材等。

最重要的是，Luma AI的期望不是售賣技術(shù)或者素材，而是建立類似TikTok這樣的平臺，也就是一個基于3D的生態(tài)系統(tǒng)。王長虎也在和極客公園創(chuàng)始人張鵬對話時表示，愛詩科技也瞄準(zhǔn)的是“AIGC時代的平臺性機(jī)會”，但平臺的形態(tài)暫時無法預(yù)測，因為AI產(chǎn)業(yè)不會以復(fù)制現(xiàn)在已有的平臺的方式成長。

不僅如此，目前讓AI-generated Video進(jìn)入完整工作流的應(yīng)用已經(jīng)在成形。開源視頻編輯工具Clapper最近熱度上升，它的特色就是集合各類AI技術(shù)，用prompt的方式調(diào)動AI Agent生成和迭代故事，直接跳過了手工編輯文件的過程。

由此可見，AI-generated Video的進(jìn)化速度遠(yuǎn)比我們想象得要快。目前，行業(yè)的重點無疑在于生成速度和生成效率兩個方面。但是，大模型并不提供完全確定的商業(yè)模式方向，這更多取決于團(tuán)隊的選擇。而在這個過程中，除了商業(yè)化之外，AI公司還要思考怎么避免陷入合規(guī)困境、成本困境。所以，把文生視頻變得成熟并不容易，現(xiàn)在僅僅相當(dāng)于ChatGPT剛剛問世的階段。

02 AI-generated Video的“硬傷”和突破口

a16z之前就發(fā)表過觀點，巨頭在從科研成果到商業(yè)產(chǎn)品的轉(zhuǎn)化中需要更關(guān)注法律安全、版權(quán)等問題，所以往往效率會慢。我們不去考慮Sora是不是因為這個原因始終不露面，單看行業(yè)都要面對的相關(guān)問題，邏輯其實是一樣的。

1. 商業(yè)化的“落差”，目前的AI-generated Video很難滿足甲方們的需求

彭博社曾報道，OpenAI一直試圖向好萊塢推薦Sora，但并不成功。用Sora制作的第一則商業(yè)化廣告是6月公開的玩具反斗城廣告。然而，這則視頻不但用了一些舊素材，公開新聞稿也沒有說完全由AI生成。

導(dǎo)演Nik Kleverov還在一條已經(jīng)刪除的動態(tài)里表示，制作這些鏡頭的創(chuàng)意機(jī)構(gòu)Native Foreign提供了大約十幾個工作人員參與工作，Sora支持了80%到85%的流程。這對需要高效低成本的AI-generated Video來說算不上什么好消息。

2. 訓(xùn)練成本、高質(zhì)量數(shù)據(jù)集難以滿足

視頻的本質(zhì)可以視為一系列圖像，圖像有很多公開的數(shù)據(jù)集，但是視頻沒有。OpenAI遇到過違規(guī)使用YouTube視頻進(jìn)行訓(xùn)練的指控，英偉達(dá)最近被媒體曝光從Netflix和YouTube收集了大量數(shù)據(jù)，用來訓(xùn)練自己的Cosmos項目，用于支持其AI產(chǎn)品往現(xiàn)實世界發(fā)展。它每天可以下載相當(dāng)于80年的視頻內(nèi)容。

這體現(xiàn)了兩個關(guān)鍵點：一是黃仁勛和Luma的觀點類似，AI視頻的發(fā)展確實對AI進(jìn)入3D世界意義重大，英偉達(dá)也是這樣做的：文本——圖像——視頻——三維模型——現(xiàn)實世界。二是視頻數(shù)據(jù)集是個大問題，除了版權(quán)問題，這些視頻數(shù)據(jù)還缺乏標(biāo)簽，斯坦福大學(xué)教授Stefano Ermon說，現(xiàn)階段缺乏篩選和過濾好視頻的方法，而且篩選后還要考慮它們的標(biāo)簽和描述。

3.AI資產(chǎn)泡沫的問題，AI必須為用戶解決重要復(fù)雜的問題才能有價值，但現(xiàn)在它的發(fā)展成效，遠(yuǎn)遠(yuǎn)不能和互聯(lián)網(wǎng)等技術(shù)當(dāng)年初生時的情況相比

Benchmark合伙人Michael Eisenberg在最近的一期訪談中，引用了其好友Atreides Management創(chuàng)始人Gavin Baker關(guān)于大模型發(fā)展的觀點：“基礎(chǔ)模型是歷史上貶值最快的資產(chǎn)?！?/p>

他所舉的例子來自Seeking Alpha的創(chuàng)始人，類似金融領(lǐng)域這種每分鐘都會進(jìn)行業(yè)務(wù)和數(shù)據(jù)更新的高頻領(lǐng)域，訓(xùn)練出來的模型只能完成寫報告之類的常規(guī)工作，但無法應(yīng)對數(shù)據(jù)的高速刷新，滿足金融預(yù)測未來的需求。

而且，其他技術(shù)的發(fā)展是確定性的，互聯(lián)網(wǎng)發(fā)展早期雖然泡沫巨大，但已經(jīng)體現(xiàn)了應(yīng)用路徑；而AI渾身都是不確定性。互聯(lián)網(wǎng)發(fā)展的邊際成本幾乎約等于0（或者說其中不少都分擔(dān)給了運營商和用戶），然而AI成長的邊際成本涉及大量固定資產(chǎn)，現(xiàn)在都由創(chuàng)業(yè)者自己承擔(dān)，而且越投入邊際改善效應(yīng)越弱。大量的早期投入，很可能是一個陷阱。

技術(shù)革命之后必須伴隨產(chǎn)業(yè)革命，產(chǎn)業(yè)革命則需要現(xiàn)象級產(chǎn)品的引領(lǐng)。AI更需要的是一個成功的場景。目前看來，AI-generated Video還沒有拿到這類成果的起色。

Perplexity的創(chuàng)始人Arin對此提供了另外一個觀點，那就是基礎(chǔ)模型的價值本質(zhì)映射著背后團(tuán)隊的價值，即Sora之于OpenAI，文心大模型之于百度。不是Sora能革了視頻的命，只是外界相信由OpenAI領(lǐng)導(dǎo)的Sora具備這樣的可能性而已。當(dāng)Sora沒能提供符合我們預(yù)期的突破時，誰能在這個領(lǐng)域擔(dān)起大任呢？

由此出發(fā)，關(guān)鍵或許在于誰能先把AI-generated Video真正融入到某一個商業(yè)系統(tǒng)的工作流中去，就像Clapper對視頻制作的探索一樣。而這就是一個更大的問題了，因為它涉及到和其他領(lǐng)域的融合——氣象、城市、影視、汽車、制造業(yè)。也許Sora會在今年的某天拿出一個更具體的成果，也許是其他的創(chuàng)業(yè)公司顛覆了我們對AI視頻的認(rèn)知。

作者：琴聲奏響時

來源公眾號：松果財經(jīng)（ID：songguocaijing1），解讀財經(jīng)熱點事件，以獨特的視角帶你挖掘新經(jīng)濟(jì)時代的商業(yè)機(jī)會。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @松果財經(jīng) 授權(quán)發(fā)布，未經(jīng)作者許可，禁止轉(zhuǎn)載。

題圖來自 Unsplash，基于CC0協(xié)議。

該文觀點僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App