B站的推薦算法機(jī)制大揭秘!
本篇文章以2023年5月最新公開的兩份b站推薦算法為例,具體分析其中的兩大算法:安全算法和推薦算法。作者對這兩種算法進(jìn)行簡單舉例,方便讀者理解。希望能對你有一定的參考幫助。
最近,有塘友讓挖塘人分享一下B站的推薦算法,今天就來詳細(xì)說一說。
如今,b站已經(jīng)是不再是之前的那個二次元內(nèi)容網(wǎng)站了,它現(xiàn)在被稱為「中國版的YouTube」,流量和用戶近幾年上漲很快,內(nèi)容也在不斷地向多元化發(fā)展。
從創(chuàng)作者或者商家的角度來看,它是一塊香甜的流量蛋糕,但要想吃到這塊蛋糕,還是需要方法和技巧的。下面挖塘人就給大家捋捋B站的內(nèi)容推薦算法機(jī)制。
在正文開始之前,我們說兩個事實:
1)算法不斷更新
其實,b站的運(yùn)營方法和機(jī)制在幾年前挖塘人就分享過,但現(xiàn)在回過頭看,變化太多了。
所以我們需要明白一個事實:那就是各個平臺的智能算法都會不斷更新,不斷地完善。大家不要想著「一成不變」,更不能使用遠(yuǎn)古的運(yùn)營方法來運(yùn)營現(xiàn)在的平臺,必須與時俱進(jìn)。
當(dāng)然,挖塘人也會及時給大家分享各平臺的動態(tài)。
2)算法不是玄學(xué)
很多人看平臺推薦算法的文章都是別人加工后的或者說根據(jù)自己的經(jīng)驗猜的,但看的人傳來傳去就變成了玄學(xué)。
其實,算法不是玄學(xué)。它是有依據(jù),有數(shù)據(jù)指標(biāo)的,以2023年5月最新公開的兩份b站推薦算法為例,它里面就明確說了很多具體的數(shù)據(jù)指標(biāo)。
下面,我們來說說,這兩份b站算法報告具體包含了哪些數(shù)據(jù)指標(biāo)和運(yùn)行原理:
一、安全算法
很多人以為作品發(fā)布后就會進(jìn)入系統(tǒng)的推薦池。其實不然,作品發(fā)布后首先是被安全算法過一遍,安全算法或者叫過濾算法是各大ugc平臺都有的一種算法,它的目的就是識別不符合要求的內(nèi)容。
根據(jù)嗶哩嗶哩內(nèi)容安全算法公開的內(nèi)容介紹,安全算法主要包含三個部分:
- 內(nèi)容理解模塊,它是負(fù)責(zé)內(nèi)容識別的模型。
- 運(yùn)營工具,這個主要是方便平臺的維護(hù),可以通過某個特性批量識別某些內(nèi)容,比如要屏蔽某個劣跡藝人,運(yùn)營人員可以在數(shù)據(jù)庫里操作就可以了。
- 訓(xùn)練模塊,這個屬于給算法喂數(shù)據(jù)的環(huán)節(jié),它會讓安全算法越來越完善,這也是我們上面說的算法會不斷更新。
那么具體有哪些內(nèi)容不能通過安全算法呢?
這個在b站的社區(qū)中心里都說的很明白,對于一些比較突發(fā)的或者平臺臨時在數(shù)據(jù)庫加的規(guī)則,平臺也會作出對應(yīng)的說明。
二、推薦算法
通過安全算法,只要不違規(guī)都可以,但要玩轉(zhuǎn)推薦算法就沒有那么容易了,因為它的影響因素太多了,而且邏輯也多。
首先,公示的算法機(jī)制機(jī)理內(nèi)容明確提到影響一個作品的數(shù)據(jù)指標(biāo)有作品的播放量、點(diǎn)贊、投幣、收藏、關(guān)注以及分享等正向因素,還有點(diǎn)踩、不感興趣等負(fù)向因素。
其次,把這些作品通過上述數(shù)據(jù)指標(biāo)會對一批內(nèi)容進(jìn)行綜合排序,但并不是排完序就直接展示給用戶。它還需經(jīng)過去重、打散等處理環(huán)節(jié),最后再輸出最終的排序并展示給用戶。
按照上面的解釋,大家可能看不懂,這里挖塘人畫了一張圖來幫助大家理解:
其中有兩個主要的信息需要我們重視,一個是作品的互動數(shù)據(jù),另一個是作品的權(quán)重。
1. 互動數(shù)據(jù)
算法說明里面提到兩個方向的因素,即正反向因素。如果正向因素好,作品的推薦流量就好越多;反之就會減少推薦。
2. 作品權(quán)重
算法里的去重和打散等處理其實是在給入圍的作品進(jìn)行加權(quán)排序,它是通過各種系數(shù)計算得出的結(jié)果。
比如有ABCD四個賬號分別發(fā)布了作品abcd,這四個賬號的權(quán)重分別為1、2、2、1,作品的綜合排序權(quán)重為2、3、2、1。
而根據(jù)加權(quán)公式:
最終排序權(quán)重=作品權(quán)重*0.8+賬號權(quán)重*0.2
我們可以得出以下結(jié)果:
所以展示給用戶的順序為bcad。
當(dāng)然,這里只是為了方便大家理解舉的一個例子。b站的實際加權(quán)公式要更復(fù)雜,而我們可以操作的是加強(qiáng)作品的互動數(shù)據(jù)和賬號權(quán)重,這樣不管平臺的加權(quán)公式是怎樣的,我們的數(shù)據(jù)都可以盡量得到最大值。
以上就是今天的內(nèi)容,希望對你有幫助。
作者:挖塘人,微信公眾號:挖塘人
本文由 @挖塘人 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
B站排序中,考慮不同維度因子的正負(fù)向傾向是什么意思呢