AIGC音樂的中場戰(zhàn)事:從技術、產品到商業(yè)規(guī)則

0 評論 1369 瀏覽 8 收藏 18 分鐘

許多行業(yè)都在與AI加深結合,其中,音樂行業(yè)也不例外,不少企業(yè)更是加強了AIGC音樂領域的布局,可以看到,一場有關AIGC音樂的競爭已經拉開了帷幕。這篇文章里,作者就做了分析和解讀,一起來看。

最近,谷歌圍繞著AIGC音樂打出了一套“組合拳”。

11月16日,谷歌旗下 DeepMind發(fā)布了最新的AIGC音樂生成模型Lyria,并與YouTube合作打造了兩個重要應用場景:Dream Track和Music AI tools。同時,谷歌和YouTube還將AI識別工具SynthID擴展到音樂領域,為Lyria生成的AI作品打上水印。

除了多個空降的AI音樂工具以外,谷歌還在緊鑼密鼓地掃除AIGC音樂所面臨的版權與道德問題。11月14日,谷歌旗下YouTube也發(fā)布博客文章《在YouTube上實施負責的AI創(chuàng)新的方法》,宣布了一系列關于AIGC內容的治理規(guī)則,將在未來幾個月逐步實施。

可以看到,谷歌正在以其超強的音樂制作工具和明朗的治理路徑,抓緊在AIGC音樂領域的布局。而另一邊,環(huán)球音樂、華納音樂等為代表的版權方與Spotify、Deezer等平臺方也沒閑著,AIGC音樂的中場戰(zhàn)事已經拉開帷幕。

一、Lyria,目前最強的AIGC音樂工具

“改變音樂創(chuàng)作的未來?!?/p>

11月16日,DeepMind以這個言簡意賅的標題發(fā)布了博客文章,介紹了他們最新的AIGC音樂生成模型Lyria。相較于AI生成對話音頻,AI音樂模型需要“同時生成聲音的長序列”,難點在于“保持音樂在聽感上的連續(xù)性”。

這一全新的AI模型更加成熟,見長于“用樂器和人聲生成高質量音樂、完成包含不同音樂風格轉換和歌曲續(xù)寫的任務,讓用戶可以更加細致地調試所輸出音樂的風格和表現(xiàn)”。

同時,DeepMind與YouTube合作,為Lyria打造了兩個重要的應用場景:Dream Track和Music AI tools。

其中,Dream Track主要面向YouTube Shorts上的短視頻創(chuàng)作者。這一工具目前向部分美國創(chuàng)作者提供了一系列授權的藝術家音源,只需輸入一個主題,并選擇一個藝術家,Lyria模型將生成一段30秒的視頻配樂,并同時生成配樂的音軌和歌詞。

截至目前,參與其中的藝術家音源已經包括Alec Benjamin、Charlie Puth、Charli XCX、Demi Lovato、John Legend、Sia,、T-Pain、Troye Sivan、Papoose等等。

而Music AI tools則主要面向音樂人、藝術家以及制作人。谷歌表示,他們的研究人員一直與YouTube的AI孵化器中的藝術家、詞曲作者以及制作人合作,測試這一工具以便更好地支持音樂創(chuàng)作。

在Music AI tools上,音樂人只需要哼唱一段旋律,就能生成相應的曲譜;輸入一段MIDI和弦,就能生成相應的AI演唱;還可以在聲軌中隨意地加入一段器樂伴奏,就可以生成相應的音樂作品。

依靠這一工具,音樂人創(chuàng)建用人聲和樂器創(chuàng)作原始的音樂作品,隨后AI就會幫助他們試驗各種各樣的音樂風格、調試紛繁復雜的伴奏樂器,最終形成一首包含了器樂伴奏和人聲的完整作品。

除此之外,為了保障音樂人和創(chuàng)作者的權益,所有使用Lyria模型輔助創(chuàng)作和發(fā)布的音樂作品都將使用SynthID進行標記和識別。就在11 月,SynthID 正式擴展到音樂和音頻領域AI水印的添加和識別。

據(jù)了解,SynthID將在AIGC的音頻內容中嵌入水印,這種水印人耳聽不到,不會影響用戶的收聽體驗。唯有將聲音轉換成為二維可視化的頻譜圖,水印才會被識別工具所捕獲,哪怕歌曲經過噪音增加、MP3壓縮、加速或降速等處理,SynthID仍能檢測到歌曲中水印的存在。

Lyria一經發(fā)布,將憑借著強大的功能受到廣泛的關注,外媒一度稱之為“音樂行業(yè)的未來”。 然而,強大的Lyria離不開此前谷歌在AudioLM和MusicLM的實踐中累積下來的技術基礎。

AudioLM是谷歌在2022年9月發(fā)布的AI音樂模型,作為一個純音頻模型,它只需收聽音頻,就能生成和提示風格相符的連貫音樂。

2023年2月,谷歌又發(fā)布了一個AIGC音樂模型MusicLM。相較于AudioLM,它標記了一系列聲音片段,并將它們映射到語義片段中進行訓練。這就意味著,這一模型能夠接收用戶的文字或音頻輸入,并生成AI音樂作品。然而,谷歌表示,考慮到“可能引發(fā)音樂人的抗議和版權風險”,并沒有正式發(fā)布這一模型,只進行了小范圍的開放測試。

毫無疑問,從MusicLM到Lyria,經過更多的音樂素材訓練,Lyria模型所生成的音樂更加精準、更加有深度。然而更重要的是,AIGC音樂模型正在被更多的音樂人接納,而谷歌也在與唱片公司的博弈中,逐漸學會規(guī)避AIGC的版權風險。

二、如何構建AIGC音樂時代的商業(yè)規(guī)則?

時間回到7個月前。

一首名為《Heart on My Sleeve》的AIGC歌曲在全網病毒式傳播。很快,這首歌激怒Drake和The Weeknd背后的唱片公司環(huán)球音樂。在環(huán)球音樂的投訴下,《Heart on My Sleeve》迎來了全網下架。

如今,這首歌帶來的長尾效應,讓YouTube開始正視AIGC音樂使用的限制問題。

在11月14日的公開博客中,YouTube表示“將為平臺上的音樂伙伴上線一項新的權益”,他們可以要求刪除那些“模仿藝術家獨特的演唱或說唱的AIGC內容”。而平臺在評定這些要求時會考慮許多因素,比如這段音樂是否來自“新聞報道、分析或者評論”。

同時,YouTube在今年8月與環(huán)球音樂達成伙伴關系,共同研發(fā)AI音樂工具。因此,這些有爭議的內容也將面向AI工具研發(fā)團隊的音樂人和唱片公司開放,并且在未來幾個月,YouTube將持續(xù)擴大開放范圍。

可見,訓練AI模型所用的素材是否合乎版權規(guī)定,是音樂平臺與唱片公司爭議的核心。避免版權風險,獲得藝術家的支持,是各家努力的同一方向。

遵循這一行動邏輯,Spotify選擇在播客領域用AI“克隆”明星,而不是爭議更加激烈的音樂領域。

今年9月,Spotify推出新的AI語音克隆工具。在OpenAI的自動語音識別模型Whisper的技術支持下,人物能夠自動切換到西班牙語、法語和德語等各種語言,而且是“完全原聲”,連說話節(jié)奏,語氣都能還原。這不僅沒有受到播客市場的不滿,反而獲得了Dax Shepard、Monica Padman、Lex Fridman等許多著名播客主的授權。

平息音樂內容在版權端的爭議外,平臺方還在加強AIGC內容的甄別與提示。

據(jù)悉,YouTube的新規(guī)將要求創(chuàng)作者披露他們“合成或修改的內容”,并要表明其“修改或合成的材料”,以及他們“使用的AI工具”。而YouTube將會在描述頁增加一個新的標簽,指出該內容的“聲音或者畫面是被更改或者合成的”。

YouTube此舉可能正是受到了TikTok的啟發(fā)。

早在今年9月19日,TikTok就要求創(chuàng)作者給AI制作的內容貼上“AI生成”的標簽。此外,TikTok還表示,正在測試新的自動工具,以標記“我們檢測到的是用AI編輯或創(chuàng)作的內容”,而這也成為接下來許多平臺規(guī)制AIGC的工作重點。

在YouTube的公開博客中,表示接下來將集中部署運用“機器學習技術和審核人員相結合”的方式來“執(zhí)行社區(qū)的準則”。其中,“AI工具有助于大規(guī)模檢測潛在的違規(guī)內容,而審核人員會努力確認內容是否確實越過了政策界限”。而這可能正指的是首次擴展到音樂領域的SynthID。

幾乎同時,Believe也對外公布了AI音樂識別技術,并對識別的準確度進行了公開。

近期,Believe在Q3季度的財報中表示,他們“創(chuàng)造了一些令人興奮的AI技術”,該軟件能以98%的準確率判斷音樂是否是人工智能生成的,并以93%的準確率判斷它是否為“深度偽造”。公告表示,這項被稱之為“AI雷達”的技術正在逐步應用。

從AIGC音樂的版權保護、用戶提示到相關識別技術,谷歌、Spotify、Believe、TikTok等各家平臺都走出了大致相仿的規(guī)制路徑。但直面AIGC的泛濫,在硬幣的另一面,各家平臺也緊鑼密鼓地加緊了在AIGC領域的布局。

正如前文所提到的,YouTube就與環(huán)球音樂達成合作,啟動了一個音樂AI孵化器,與環(huán)球旗下的藝術家合作探索人工智能在音樂中的應用。藝術家能提前接觸到正在開發(fā)的人工智能產品,并提供反饋。而此次的Music AI Tools就充分考慮了這些藝術家的意見。

與此同時,YouTube還與三大唱片公司進行洽談,希望能使用他們的版權音樂進行AI模型訓練。不過,從目前Dream Track合作藝人中主要集中在環(huán)球音樂、華納音樂以及其他唱片公司的音樂人時,看來索尼音樂還沒有談成。

當與唱片公司合作進行AIGC內容創(chuàng)作的機遇十分有限,不乏有平臺方另辟蹊徑。

例如,2022年12月,Deezer就推出了app Zen,主要為用戶提供“健康指導、鍛煉音頻以及沉浸式的助眠、療愈音樂和音頻”。目前,Deezer正在使用AI技術為該平臺生產內容。

在國內,網易云音樂也上線了AI音樂制作平臺Xstudio,與小冰公司合作,為音樂創(chuàng)作者提供可供使用的AI音源;TME旗下銀河音效、MUSE、天琴實驗室和Tencent AI Lab共同打造了智能音樂創(chuàng)作助手TME Studio,集成了音樂分離、MIR計算、輔助寫詞、智能曲譜等系列AI功能。

顯而易見,在AIGC音樂的浪潮中,手握版權的唱片公司和音樂人始終沖在技術限制的第一線。而各家平臺都在盡力協(xié)調,在允許平臺上的創(chuàng)新行為與保護藝術家受版權保護的作品之間實現(xiàn)平衡。

正如Deezer的CEO Jeronimo Folgueira所言:“對于流媒體平臺,AI是個大問題,但是個更大的機遇”。

三、AIGC浪潮不會倒退,UGC時代已經給出過答案

2023年9月末,華納音樂集團的新任CEO Robert Kyncl參加了在加州舉辦的2023年代碼大會。他在演講中就指出,AIGC與UGC“類比非常明顯”。AI技術的威脅,也能從UGC中找到解決辦法。

在華納音樂履職前,Kyncl曾在YouTube和Netflix工作過20年,他曾幫助YouTube開創(chuàng)了這個屬于UGC內容和YouTube網紅的時代,讓YouTube在全球范圍內保持自身的競爭力。

這段履歷讓Kyncl面對AIGC少了一些憤怒,多了一些平和,畢竟AIGC“這一浪潮并不會倒退”。

演講中,Kyncl回顧了UGC剛剛興起時的YouTube。那時,YouTube經常會受到大量內容所有者的投訴信息,表示自己的視頻或者音樂未經本人許可就被上傳到平臺上。

直到2006年,谷歌收購了YouTube后,建立了一種版權識別的Content ID技術,追蹤平臺上受版權保護的內容,并給予版權所有者相應的權益,允許他們刪除這些內容,或者從這些內容中獲益。

正是此舉,將YouTube與版權所有者的關系從對抗性關系轉變成共贏的商業(yè)關系。

“這樣一來,我們就建立了一個數(shù)十億美元的業(yè)務,現(xiàn)在已是每年數(shù)十億美元的業(yè)務。”Kyncl說,“這對每個人來說,都是一個令人難以置信的全新的收入來源。而AI就是這樣的全新的超級工具。所以,我們也需要以同樣的想法來對待它?!?/strong>

依照YouTube在UGC時代的治理邏輯,Synth ID技術似乎有望成為下一個確保AIGC浪潮中各方利益的存在,接下來就剩下平臺方與版權方就分配規(guī)則的談判。

換言之,當平臺標記出這些AIGC音樂,他們將如何處理這些音樂?如何與涉及的不同主體分配版權收益?作為訓練AI語料庫的音樂又要以何種比例瓜分收益?而這將成為平臺能否建立起可持續(xù)的商業(yè)合作關系的關鍵。

不過,雖然有各類問題亟待解決,但是平臺方所努力的方向卻是清晰而明確的。

從PGC到UGC再到AIGC,每一次互聯(lián)網內容生產的話語權變革都要面臨新一輪的質疑與規(guī)范。正如當年,為了順應UGC浪潮的發(fā)展所需,長短視頻平臺開啟了音樂版權集中采買的時代。

現(xiàn)如今,AIGC面對的侵權問題則更為復雜。但在生產力的爆發(fā)和內容消費的熱情面前,平臺方終將再走一遍UGC時代的老路,與創(chuàng)作者、版權所有者再進行一次可能要長期存續(xù)的版權拉鋸戰(zhàn)。

不過,無論是平臺方還是唱片公司,大家行進的方向其實是一致的,只是在前進的路上,共同探索運行規(guī)則罷了。

作者:朋朋;編輯:范志輝

來源公眾號:音樂先聲(ID:nakedmusic),解讀音樂產業(yè),見證黃金時代。

本文由人人都是產品經理合作媒體 @音樂先聲 授權發(fā)布,未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協(xié)議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!