在线黄网站,亚洲VA成无码人在线观看,亚洲无码射在线视频

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

騰訊版Sora姍姍來(lái)遲，但登場(chǎng)就是王炸

藍(lán)媒匯

2024-12-06

1 評(píng)論 2283 瀏覽 0 收藏

11 分鐘

騰訊在人工智能領(lǐng)域的最新動(dòng)作再次吸引了行業(yè)的目光。繼AI工作臺(tái)ima.copilot之后，騰訊推出了AI視頻生成功能——混元（HunYuan Video），在騰訊元寶APP內(nèi)亮相。這一功能的推出，不僅展示了騰訊在AI視頻生成領(lǐng)域的技術(shù)實(shí)力，也預(yù)示著國(guó)產(chǎn)AI視頻生成技術(shù)競(jìng)爭(zhēng)的新篇章。

年末補(bǔ)課AI的騰訊，在各條細(xì)分賽道快速追進(jìn)。

繼11月推出AI工作臺(tái) ima.copilot 之后，12月3日，已有劇透的AI視頻生成功能終于被鵝廠放出，官方名稱仍是混元（HunYuan Video），目前可在騰訊元寶APP內(nèi)體驗(yàn)，

3號(hào)發(fā)布當(dāng)天，用戶僅有三次體驗(yàn)機(jī)會(huì)，包括一次高品質(zhì)生成；4號(hào)騰訊增加了體驗(yàn)次數(shù)，改成了每天四次標(biāo)準(zhǔn)+兩次高品質(zhì)，總共六次，直接翻了一倍。

騰訊元寶-AI應(yīng)用-AI視頻

直接看演示：模型成功理解了提示詞中外部全景到內(nèi)部近景的視角切換，質(zhì)量也比較不錯(cuò)。

提示詞：一座懸浮于云端的未來(lái)都市，高樓大廈皆由透明能量晶體構(gòu)建。全景展現(xiàn)都市的宏偉，飛行器在樓間穿梭。隨后拉近鏡頭至一個(gè)神秘的科技實(shí)驗(yàn)室，一位年輕的女科學(xué)家身著銀色防護(hù)服，正在操作一臺(tái)散發(fā)著幽藍(lán)光芒的大型儀器，特寫她專注的眼神與儀器上閃爍的復(fù)雜數(shù)據(jù)符文，整體畫面以冷色調(diào)為主，科技感。

必須承認(rèn)，大廠就是大廠，技術(shù)能力方面事兒大可不必?fù)?dān)心。

一、可玩性很高的模型

視頻生成大模型曾在今年年中經(jīng)歷過(guò)一段時(shí)間的集中發(fā)布，大廠和初創(chuàng)公司接連掏出了自家版本的“Sora”。

行業(yè)短暫沉默幾個(gè)月之后，騰訊進(jìn)場(chǎng)似乎預(yù)示著新一輪國(guó)產(chǎn)Sora競(jìng)爭(zhēng)的開啟（豆包和Kimi近期也都有動(dòng)作）。

只不過(guò)，或許是用戶等得太久熱情太高，又或許是騰訊算力準(zhǔn)備不夠充足，混元大模型生成視頻的等待時(shí)間，一度格外漫長(zhǎng)：之前體驗(yàn)過(guò)的模型最多十幾分鐘也就出來(lái)一條了，而發(fā)布當(dāng)天的混元大模型，想體驗(yàn)需要做好等幾個(gè)小時(shí)的準(zhǔn)備。

12月3日等待超過(guò)一小時(shí)

好在，后續(xù)官方應(yīng)該是對(duì)算力進(jìn)行了優(yōu)化，或者單純加開了一些服務(wù)器，等待時(shí)間過(guò)長(zhǎng)的問(wèn)題已經(jīng)解決。

12月4日等待不超過(guò)十分鐘

以及，生成的視頻質(zhì)量在線，不然用戶體驗(yàn)真的會(huì)嚴(yán)重扣分。

提示詞：一位身著古裝的書生在庭院中散步，中景呈現(xiàn)書生手持書卷，步伐輕盈。隨后切換到近景，聚焦他抬頭思考，鏡頭以平移運(yùn)鏡為主，跟隨書生的行動(dòng)軌跡。

與目前市面上已有的快手可靈、字節(jié)即夢(mèng)、MiniMax海螺和智譜清影相比，騰訊混元在“高級(jí)指令”里給出的調(diào)節(jié)選項(xiàng)最為全面，包含風(fēng)格、比例、景別、光線和運(yùn)鏡五個(gè)類別。

上面這段提示詞，本身已經(jīng)給了鏡頭視角的設(shè)置（可惜這次AI并沒有做出來(lái)切換效果），在下面的“高級(jí)指令”選項(xiàng)里，除了打開所有能增強(qiáng)質(zhì)感的開關(guān)外，只額外設(shè)定了一個(gè)“自然光”。

混元AI視頻高級(jí)指令界面

同賽道其他產(chǎn)品，雖或多或少都會(huì)給一些預(yù)設(shè)選項(xiàng)，但對(duì)比混元都相對(duì)有限。

從左至右依次為即夢(mèng)、海螺和清影

更新后的可靈1.5模型，在PC端選擇高品質(zhì)模式下，額外增加了運(yùn)鏡控制選項(xiàng)，標(biāo)準(zhǔn)模式目前不支持調(diào)節(jié)。

可靈1.5

顯而易見，混元視頻模型最大限度的把AI創(chuàng)作的控制權(quán)開放給了用戶，有點(diǎn)類似能在手機(jī)里找到的“開發(fā)者模式”，用戶可以對(duì)很多進(jìn)行細(xì)節(jié)具體設(shè)置，再交由AI執(zhí)行命令。

這種自由度帶來(lái)的可玩性，理論上會(huì)非常高。

比如，用不同畫風(fēng)和景別跑同一段提示詞，最終給出的視頻會(huì)有明顯區(qū)別，但帽子等等細(xì)節(jié)又都能呈現(xiàn)。

賽博朋克近景明亮

寫實(shí)風(fēng)格廣角柔和提示詞：車水馬龍的時(shí)尚都市街頭，站著一位背著專業(yè)相機(jī)、身著個(gè)性潮牌服飾且頭戴時(shí)尚棒球帽的年輕攝影師，他微微仰頭，尋找拍攝充滿現(xiàn)代活力與時(shí)尚氣息的城市街頭夜景。

混元模型對(duì)這些預(yù)設(shè)的執(zhí)行力尚可，要求基本都加進(jìn)去了，第二段還用了類似延時(shí)攝影的效果，這種“可玩性”帶來(lái)的好處就是，用戶可以拿同一段提示詞組合出很多完全不同的視頻內(nèi)容，獲得更大的調(diào)整空間。

這帶來(lái)的應(yīng)用潛力，非?？捎^。

二、AI視頻離能用還有多遠(yuǎn)？

當(dāng)然，如果真的要AI視頻可用，風(fēng)格是只是大面，畫面一致性等等細(xì)節(jié)還是最終的決定因素。

從以往大量案例中不難看出，手部等四肢部位的生成一直是視頻生成模型的薄弱環(huán)節(jié)。AI在生成這些細(xì)節(jié)時(shí)常常出現(xiàn)問(wèn)題，例如人物出現(xiàn)六根手指，或者四肢部分扭曲變形等情況。

本身AI對(duì)肢體細(xì)節(jié)的刻畫就是難點(diǎn)，在文生圖模型上已經(jīng)頗為明顯，而視頻生成對(duì)動(dòng)態(tài)性和連續(xù)性的要求，又進(jìn)一步放大了這種困難。

驚喜的是，諸如手部畸變、面部不自然等問(wèn)題，在混元模型中幾乎沒有出現(xiàn)，前面幾個(gè)案例中，人物面部在運(yùn)動(dòng)過(guò)后未有太多明顯不合邏輯的變化，人物的動(dòng)作姿態(tài)，身體其他部位與物體及周圍環(huán)境存在的交互關(guān)系也比較合理。

下面這個(gè)片段構(gòu)圖看起來(lái)并不復(fù)雜，但細(xì)節(jié)絕對(duì)可以算得上驚艷。

提示詞：一位住在木屋的中年人，睡醒后從床上坐起來(lái)，雙手抱頭，表情失落。近景 / 自然光 / 固定鏡頭

人物面部表情，手指運(yùn)動(dòng)和雙手抱頭的過(guò)程，毛發(fā)細(xì)節(jié)的處理近乎以假亂真。

模型需要對(duì)細(xì)節(jié)有更深入的理解和精準(zhǔn)的把握，才能生成趨近現(xiàn)實(shí)的人物動(dòng)作。這種細(xì)節(jié)部分的穩(wěn)定連貫，讓混元生成的視頻前后畫面一致性相當(dāng)不錯(cuò)——主體、場(chǎng)景、風(fēng)格、運(yùn)鏡、光效等方面都能保持一致，觀感上就會(huì)比較流暢、自然，減少畫面的“AI味”，那種肉眼可見的突兀變化。

不過(guò)，以目前視頻模型所能生成的短短幾秒內(nèi)容為樣本，包括畫面也包括時(shí)長(zhǎng)，AI視頻未來(lái)一段時(shí)間內(nèi)仍會(huì)是以技術(shù)探索為主，或者在一些例如廣告片的設(shè)計(jì)中作為補(bǔ)充元素，離獨(dú)當(dāng)一面還有不小距離，成規(guī)模的商業(yè)化仍有難度。

既然難以直接實(shí)現(xiàn)盈利，不妨先把用戶和開發(fā)者生態(tài)盡可能打開，騰訊就選擇開源了這個(gè)參數(shù)量達(dá)130億的HunYuan Video模型。

吸引更多用戶和開發(fā)者，集思廣益探索基于模型所能衍生出的創(chuàng)新應(yīng)用與新穎玩法，或許才是破局的關(guān)鍵所在。

編輯|魏曉
本文由人人都是產(chǎn)品經(jīng)理作者【陶然】，微信公眾號(hào)：【AI藍(lán)媒匯】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App