Sora大片真相:人工特效參與,被指誤導(dǎo)大眾
最近,有消息稱Sora火爆的短片《氣球人》,其視頻畫面并非完全由AI生成,其中有大量視覺效果需要人類后期實現(xiàn)。這可就引起人們的圍觀和討論了,究竟是怎么個事兒,不妨跟著作者來捋一捋。
啊?Sora火爆短片《氣球人》,也“造假”了???
背后藝術(shù)家團隊的最新揭秘,可謂一石激起千層浪:
原來,視頻畫面并非完全由AI生成,其中有大量視覺效果需要人類后期實現(xiàn)。
be like:
這下網(wǎng)友不干了,合著大家伙兒跟OpenAI玩真心,OpenAI背后卻耍起心眼子來了:
他們含糊其辭,就是希望觀眾認為短片完全是AI生成的,這是不是有點不誠實了啊。
這不是人工智能生成的視頻,而是使用了一些AI技術(shù)的視頻。
還有網(wǎng)友直接開噴:誤導(dǎo)性營銷!這是誤導(dǎo)性營銷!
究竟是怎么個事兒,咱們還是具體捋一捋。
一、揭秘Sora大片工作流
盡管OpenAI一開始就介紹了,《氣球人》這樣的短片出自藝術(shù)家團隊之手,他們只是把Sora開放給了藝術(shù)家使用,但官方并未提及短片具體是如何制作而成的。
現(xiàn)在,《氣球人》背后的藝術(shù)家團隊Shy Kids自己來了個大揭秘,內(nèi)容包括:
- 視頻片段一致性如何實現(xiàn)
- 他們?nèi)绾翁幚鞸ora生成的視頻素材
- Sora生成視頻的局限性及后期處理
1. 視頻一致性
《氣球人》中主角形象的一致性可謂驚艷眾人。
但實際上吧,據(jù)Shy Kids團隊中負責(zé)后期制作的老哥Patrick Cederberg(簡稱老帕)透露,想要實現(xiàn)這種前后一致并不是寫寫提示詞就能成的。
Sora并沒有提供工具,來幫助實現(xiàn)不同鏡頭之間的主體一致性。也就是說,哪怕提示詞都是一樣的,兩次運行的結(jié)果也會有所不同。
他們的做法是,盡可能詳細地去對主角形象進行描述。
解釋角色的服裝以及氣球的類型是我們解決一致性問題的方法,目前Sora還沒有集成適當(dāng)?shù)墓δ軄韺崿F(xiàn)此類控制。
即便如此,團隊在用Sora生成視頻素材時還是遇到了不少這樣那樣的問題。
比如,提示詞里明明寫了氣球是黃色的,但Sora生成的片段里氣球卻可能變紅。
2. 視頻素材處理
一致性之外,老帕提到,在時間軸方面,Sora允許用戶修改關(guān)鍵幀。但這種時間控制并不精準,無法保證一定能實現(xiàn)預(yù)想的效果。
另外,想要實現(xiàn)這個鏡頭:
即把鏡頭焦點從牛仔褲一路上移到氣球頭,也得人類自己后期裁切平移畫面,因為Sora本身不會渲染這樣的鏡頭:它總是傾向于把焦點集中在氣球頭上。
老帕還談到,他們在寫提示詞時也遇到了一些問題:
OpenAI在讓藝術(shù)家試用Sora前,并沒有考慮到真正的電影制作人是如何思考的。
簡單來說,就是Sora對攝影術(shù)語(比如跟拍、平移等)的理解有限。老帕認為,這一點上Sora不如Runway。
值得一提的是,盡管Sora原生支持生成1080p視頻,但老帕他們實際上生成的素材都是480p的。他們是在后期使用Topaz等工具對視頻素材進行了超分處理。
生成速度方面,根據(jù)老帕的回憶,每次大概需要10-20分鐘的時間。
3. 視頻后期
接下來,就到了網(wǎng)友們反應(yīng)最強烈的部分——后期。
前面已經(jīng)說到,Sora本身還解決不了不同視頻片段里一致性的問題。
除了氣球不一定符合設(shè)定,或許是因為訓(xùn)練數(shù)據(jù)的原因,Sora還喜歡自動給氣球加上奇奇怪怪的人臉。
給主角生成其實并不需要的假人頭。
Sora還很堅定地認為氣球得帶根繩。
總而言之言而總之,這些都需要老帕上手丟到AE里,進行后期處理。
另外,盡管Shy Kids發(fā)現(xiàn)“35mm膠卷”這樣的關(guān)鍵詞很好用,能讓Sora生成的視頻畫面風(fēng)格更一致,但藝術(shù)家們?nèi)孕枰獮樽詈蟮某善稣{(diào)色,為畫面添加顆粒和閃爍效果,以使整部影片畫面更加協(xié)調(diào)統(tǒng)一。
老帕還提到了一個有意思的細節(jié):
Sora很喜歡慢鏡頭。
我不知道為什么,但有很多鏡頭看上去都是0.5倍速和0.75倍速。
因此我們需要對大量畫面進行調(diào)速,免得影片看上去像個大型慢動作項目。
那么,Sora生成的視頻素材有多少最終被用在了影片里?
“數(shù)學(xué)很差”的老帕估計了一下,大概是300:1。
音頻方面,Sora目前還不能生成聲音,因此旁白和音樂都是團隊自己加上去的。
4. 版權(quán)
為了不侵犯版權(quán),OpenAI給Sora上了一些限制。
比如,你不能把提示詞寫成“35mm膠卷,未來宇宙飛船中,一名男子拿著光劍靠近”,那樣Sora會直接拒絕生成,因為這畫面太像《星球大戰(zhàn)》了。
哦對,像什么“阿羅諾夫斯基式鏡頭”和“希區(qū)柯克變焦”也是不行的。
二、3人團隊2周制作完成
該說不說,在外界卷起風(fēng)波之前,Shy Kids團隊對于Sora的表現(xiàn)還是很滿意的。
畢竟,制作《氣球人》這樣一個高質(zhì)量短片,最后只用了他們仨1.5到2周的時間。
團隊認為,現(xiàn)在,對于專業(yè)的電影團隊來說,Sora當(dāng)然還有很大進步空間,但對于大部分人而言,Sora已經(jīng)足夠驚艷。
用老帕自己的話說:
我覺得人們應(yīng)該將Sora變成工作流里的一部分。
不過,如果他們不想跟AI沾邊,也沒關(guān)系。
對于這樣的觀點,也有不少網(wǎng)友表示認同,認為Sora這樣的視頻生成AI,是對現(xiàn)有工作流很好的補充。
Adobe把它們集成進軟件里,就是一個很不錯的主意。
但,“我厭倦了OpenAI們的精美Demo營銷”。
還有網(wǎng)友不滿的點在于,爆火的“人工智能生成視頻”背后有大量的人類工作,他們投入數(shù)百個小時工作,卻被AI掩蓋了真實的價值。
那么,這事兒你怎么看?
參考鏈接:
[1]https://www.fxguide.com/fxfeatured/actually-using-sora/
[2]https://twitter.com/bilawalsidhu/status/1783544598259794046
作者:魚羊
來源公眾號:量子位(ID:QbitAI),追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @量子位 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!