姜sir變成姜siri,AI配音能不能滿足玩家需求?

4 評(píng)論 6580 瀏覽 2 收藏 16 分鐘
🔗 B端产品需要更多地依赖销售团队和渠道合作来推广产品,而C端产品需要更多地利用网络营销和口碑传播来推广产品..

AI人工智能的身影已經(jīng)越來越常見,從AI主播、到AI繪畫,又比如本文中的AI配音,越來越多領(lǐng)域開始應(yīng)用、結(jié)合AI,與此同時(shí),AI人工智能的應(yīng)用也讓不少人產(chǎn)生疑惑:在未來,AI可以代替真人完成某些事情嗎?如果可以的話,又可以完成哪些呢?

在原定錄音工作無法完成的情況下,為了保障重要游戲資源的完整,臨時(shí)調(diào)整計(jì)劃或更換CV并不少見。近日,因?yàn)樨?fù)責(zé)當(dāng)期內(nèi)容的配音演員無法參與錄制,《時(shí)空中的繪旅人》和《未定事件簿》也相繼發(fā)布了角色更換配音的公告,不過,這次并不是換人,而是用AI配音替代真人錄制。

姜sir變成姜siri,AI配音能不能滿足玩家需求?

AI配音不稀奇,但AI配音游戲角色,還是配乙女游戲中的男主之一,確實(shí)是個(gè)新鮮事。除了引發(fā)粉絲和吃瓜群眾對(duì)背后的內(nèi)情的探究,這一嘗試也讓游戲玩家既期待又忐忑不安。不過,隨著語音在游戲中實(shí)裝,以及相關(guān)實(shí)機(jī)視頻的公布,語音最終呈現(xiàn)出來的效果卻出乎玩家的預(yù)料:

姜sir變成姜siri,AI配音能不能滿足玩家需求?

姜sir變成姜siri,AI配音能不能滿足玩家需求?

也有被新嗓子俘獲,情緒較為激動(dòng)的:

姜sir變成姜siri,AI配音能不能滿足玩家需求?

雖然存在缺陷,但總體來說并未翻車,反而算得上是驚喜。

一、AI配音正在大步向前

AI配音,似乎在逐漸顛覆大眾的普遍印象:

姜sir變成姜siri,AI配音能不能滿足玩家需求?

雖然與早期的小冰等相比,現(xiàn)在的智能語音助手,在語言流暢度上已經(jīng)有了很大的進(jìn)步,也有了更為豐富的聲音方案,但大部分時(shí)候,智能語音助手、AI聽書、短視頻AI配音等,仍然扮演著沒有感情的念稿機(jī)器,還會(huì)在斷句、特殊句式、多音字上屢次碰壁。而早期作為虛擬歌手標(biāo)配的機(jī)械感和電音,隨著聲庫和調(diào)音技術(shù)的升級(jí),也逐漸被削弱。創(chuàng)作者還會(huì)特意加入換氣聲,使之更貼近于真人。

與唱歌不同,除了流暢,語氣和情感也是配音的重點(diǎn)。短視頻中的AI配音之所以讓人覺得“莫的感情”,是因?yàn)橹粷M足了基礎(chǔ)的發(fā)音流暢,并沒有語氣變化與情緒起伏。

不過,在AI聽書這一領(lǐng)域,似乎已經(jīng)有了一些效果,如微軟TTS中文語音、火山語音等,除了銜接自然,在朗讀過程中也會(huì)有明顯的輕重緩急。常被網(wǎng)友用來整活的番茄AI讀書(火山語音),在識(shí)別到一些具有情緒色彩的內(nèi)容,語速和語氣會(huì)有變化——盡管情緒不一定能對(duì)應(yīng)上,且極易會(huì)受到符號(hào)影響卡出鬼畜音頻。

姜sir變成姜siri,AI配音能不能滿足玩家需求?

雖然好笑,但確實(shí)是生動(dòng)起來了。

在許多人對(duì)AI語音的印象還停留在探索階段時(shí),《繪旅人》和《未定》則在語言銜接、語氣以及情緒上,展現(xiàn)出了高度貼合真人的成果,當(dāng)然,距離完美還有提升空間。

姜sir變成姜siri,AI配音能不能滿足玩家需求?

在評(píng)論區(qū),玩家的評(píng)判標(biāo)準(zhǔn)也反復(fù)橫跳,一方面知道是AI后忍不住開始找毛病,另一方面又認(rèn)為不應(yīng)該對(duì)AI太過嚴(yán)格。

不過,鑒于這是兩個(gè)人第一次“學(xué)說話”,評(píng)價(jià)大體上還是包容居多,甚至自發(fā)尋求合理性,比如莫弈的略微氣虛契合了劇情設(shè)定下的曖昧氛圍,葉瑄的微妙停頓以及電流聲,恰好可以歸于“外星人”設(shè)定。

姜sir變成姜siri,AI配音能不能滿足玩家需求?

還原本音外,此次AI配音的另一個(gè)特殊之處,在于音源來自于角色而非CV。

無論是虛擬歌手,還是智能語音助手,大都是由真人提供音源。因此對(duì)于AI語音,特別是即時(shí)生成的語音來說,聲庫質(zhì)量尤為重要。即使是虛擬歌手,其歌曲效果,也不只取決于調(diào)校水平。

姜sir變成姜siri,AI配音能不能滿足玩家需求?

但《繪旅人》和《未定》中,葉瑄和莫弈這兩個(gè)角色,并非由CV直接提供音源,而是通過角色過往的配音來分析提取聲紋,也就是說,這是葉瑄和莫弈“自己給自己配音”。

姜sir變成姜siri,AI配音能不能滿足玩家需求?

涉及到的兩個(gè)AI技術(shù)提供者,在這之前也已經(jīng)在其他領(lǐng)域中大展身手。網(wǎng)易AI Lab曾在去年與《羊城晚報(bào)》合作推出廣東媒體首個(gè)視頻類真人AI合成主播“羊小晚”和“羊小派”。

至于逆熵AI,在前段時(shí)間米哈游旗下虛擬偶像鹿鳴的直播上,就引發(fā)過討論,在幾年前公布時(shí),也對(duì)AI配音這方面做出了解釋,即深度學(xué)習(xí)記錄配音演員的聲音和情感,做到輸入文字就能夠生成語音。也是由于這一項(xiàng)技術(shù)的經(jīng)驗(yàn),相較于準(zhǔn)備時(shí)間較為倉促且第一次嘗試的葉瑄,莫弈的配音才能呈現(xiàn)出更好的效果。

相似的原理,在虛擬歌手身上也得到了應(yīng)用,8月末,洛天依AI在軟件ACE Studio上開啟公測(cè),同樣是通過深入學(xué)習(xí)來模擬真人發(fā)聲效果。

在視頻平臺(tái)上,也有網(wǎng)友將洛天依AI聲庫與此前的V3、V4聲庫進(jìn)行對(duì)比,相比之下AI聲庫呈現(xiàn)出來的歌曲片段,在流暢感和真人感上都有很大的提升,更為自然柔和。不過也有網(wǎng)友認(rèn)為這樣失去了洛天依特有的標(biāo)志性電音。

洛天依聲庫的加入,無疑讓ACE Studio進(jìn)入了更多網(wǎng)友的視野,而除了調(diào)音,這一虛擬歌姬軟件的捏聲線功能也為創(chuàng)作者帶來了更多的靈感和途徑:

姜sir變成姜siri,AI配音能不能滿足玩家需求?

在選定模板的基礎(chǔ)上,通過調(diào)節(jié)參數(shù)得出聲音“配方”后,給人的感覺基本就像是角色本人在唱歌了。

但無論是真人音源還是虛擬音源,由于AI的可調(diào)性,AI語音呈現(xiàn)出來的效果和真人也有著微妙的差異。這在虛擬歌手上比較常見,在聲線和語氣上已經(jīng)高度還原的莫弈身上,也會(huì)產(chǎn)生一種角色和CV分離開來的感覺,給人的感覺像“貼莫而不貼姜”。

而神奇的是,這種與真人稍微剝離的感覺,似乎并不會(huì)讓玩家不滿,反而讓他們更有代入感。

二、AI會(huì)代替真人配音嗎

使用AI配音的直接目的,是避免因?yàn)橥饨缫蛩囟鴮?dǎo)致超出計(jì)劃的變動(dòng)。不過,這也受到角色定位的影響,近兩個(gè)月中,其他游戲里也有姜廣濤配音的其他角色出場(chǎng),如《花亦山心之月》中的玉澤和《食物語》中的龍井蝦仁,但除了提前錄好的部分,在其他內(nèi)容中暫時(shí)成為了“啞巴”。

這些角色雖然也有高人氣,總歸只是眾多角色中的一個(gè),在時(shí)裝及其劇情的暫時(shí)失聲并沒有太大的影響,但作為乙女游戲的男主角之一,葉瑄和莫弈在活動(dòng)劇情中缺席或失聲,都會(huì)對(duì)角色塑造和玩家體驗(yàn)上產(chǎn)生嚴(yán)重的負(fù)面影響。

姜sir變成姜siri,AI配音能不能滿足玩家需求?

姜sir變成姜siri,AI配音能不能滿足玩家需求?

而在局勢(shì)尚未明朗的當(dāng)下,更換CV也確實(shí)不合適,因此,使用AI配音,便成為了最優(yōu)解。

姜sir變成姜siri,AI配音能不能滿足玩家需求?

AI會(huì)替代真人配音嗎?對(duì)此網(wǎng)友的態(tài)度也各不相同,有人認(rèn)為AI配出來的沒有靈魂,有人則認(rèn)為紙片人就應(yīng)該配電子音:

姜sir變成姜siri,AI配音能不能滿足玩家需求?

不過,就當(dāng)下的情形來看,短時(shí)間內(nèi)這樣的可能性不大。

主要是在于技術(shù)與成本。人工智能的使用,很大程度上是為了降低人力成本,但應(yīng)用的范圍也有限。當(dāng)前AI配音主要應(yīng)用于不需要太多情緒的短視頻文案、新聞播報(bào)、聽書功能上,滿足基本的信息傳達(dá)功能。

而更為復(fù)雜的有情緒的AI配音,在這些領(lǐng)域是不適用的,也不必要的。因?yàn)锳I配音的相對(duì)低的成本,并不包括像《繪旅人》和《未定》這樣給主要角色臨時(shí)配音的情況——不僅要考慮語言流暢、還要在語氣情緒上貼近角色,以及盡量還原配音演員。在技術(shù)要求和工作量上,這無疑是高于真人配音的,也并非所有的游戲都能擁有網(wǎng)易米哈游兩家大廠在資金和技術(shù)上的支持。

姜sir變成姜siri,AI配音能不能滿足玩家需求?

而對(duì)于合作雙方來說, 除了與角色的適配度,CV本身的影響力,也是游戲廠商考慮的重點(diǎn)。雖說將角色與配音演員聯(lián)系在一起并不好,但這種現(xiàn)象依舊是普遍存在,否則也不會(huì)將CV作為宣傳點(diǎn),并舉辦CV和玩家的互動(dòng)活動(dòng)了。這些附加效應(yīng),自然也是真人配音的高成本中的一部分。而廠商要?jiǎng)?chuàng)造獨(dú)家AI CV,再將其打造成為IP,擁有與頭部CV相當(dāng)?shù)奶?hào)召力,并不是能一朝一夕完成的。

此外,AI配音技術(shù)尚未完全成熟。

姜sir變成姜siri,AI配音能不能滿足玩家需求?

而且,比起情感,AI配音更多的是擁有了情緒,而這些情緒是通過一點(diǎn)點(diǎn)的后期調(diào)節(jié)來實(shí)現(xiàn)的。相對(duì)于真人,許多時(shí)候數(shù)據(jù)或許會(huì)少了一些打動(dòng)人心的力量。比如視頻創(chuàng)作者的小情緒、發(fā)音習(xí)慣、甚至是偶爾的口胡,都能拉近與觀眾的距離,這是追求完美的的AI配音無法實(shí)現(xiàn)的。

雖然對(duì)頂級(jí)的CV沒有太大的影響,但對(duì)于許多在業(yè)務(wù)能力和知名度上較低的配音工作者來說,AI配音的不斷進(jìn)步確實(shí)會(huì)有威脅,比如現(xiàn)在的AI聽書已經(jīng)開始擠占有聲書市場(chǎng)了。但這也并非完全是壞事,競(jìng)爭(zhēng)會(huì)推動(dòng)配音演員對(duì)自身技能的提升。不過,這一問題并非面向個(gè)人,而是需要整個(gè)行業(yè)進(jìn)行調(diào)整,提升真人配音的競(jìng)爭(zhēng)力來應(yīng)對(duì)危機(jī)。

三、結(jié)語

AI配音游戲角色,讓人們看到了這一技術(shù)在語音領(lǐng)域的又一次進(jìn)步。在感慨人工智能技術(shù)的越來越強(qiáng)大的同時(shí),也擔(dān)心會(huì)帶來虛假信息、擠占市場(chǎng)、剝奪創(chuàng)造力等社會(huì)問題。此前的AI換臉、AI繪畫,也是如此。

但就如機(jī)械代替部分人力一樣,AI在更廣泛領(lǐng)域得到應(yīng)用的趨勢(shì)是不可阻擋的,我們只能通過法規(guī)等來規(guī)避其隱患,而無法阻止它。但能替代的,也只是一部分,至少在目前,AI配音的應(yīng)用范圍還十分有限,而在技術(shù)成熟和成本降低的未來,局面或許會(huì)發(fā)生改變。

姜sir變成姜siri,AI配音能不能滿足玩家需求?

不過,即使是AI技術(shù)在未來達(dá)到了突破性進(jìn)展,我也更愿意相信,將AI作為輔助工具,協(xié)助真人CV完成各類配音工作,并在這一過程中互相學(xué)習(xí)促進(jìn),才是最理想的結(jié)果。

作者:寸草,來源公眾號(hào):手游矩陣(ID:shouyoujuzhen)

原文鏈接:https://mp.weixin.qq.com/s/x4adQ55zkUglYuQIq66SQg

本文由 @手游矩陣 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 相對(duì)于真人,許多時(shí)候數(shù)據(jù)或許會(huì)少了一些打動(dòng)人心的力量

    來自廣東 回復(fù)
  2. ai在這方面進(jìn)步越來越快了,雖然現(xiàn)在聽起來還有一點(diǎn)瑕疵,但以它的學(xué)習(xí)速度,說不定真的能完全替代人力

    來自廣東 回復(fù)
  3. 聽說有游戲決定用ai代替真人配音特別吃驚,特地去聽了一下效果,確實(shí)是超出預(yù)期的好

    來自廣東 回復(fù)
  4. 但是配音這種工作,尤其是游戲當(dāng)中給玩家提供情感體驗(yàn)的角色,還是更感性的人給人感覺真實(shí)一點(diǎn)

    來自廣東 回復(fù)