直播App熱門列表冷啟動(dòng):如何排序,才能把最好的直播間優(yōu)先讓用戶看到?
直播App上線前期,列表的直播內(nèi)容有限,所以,冷啟動(dòng)的關(guān)鍵點(diǎn)就是要把最好的直播間優(yōu)先讓用戶看到。那么基于這個(gè)目的,直播App熱門列表冷啟動(dòng)該用什么樣的排序方法呢?以下,筆者將與大家詳細(xì)講述。
之前在做一款直播產(chǎn)品時(shí),熱門列表冷啟動(dòng)期間遇到一些問題,也找到了一些解決方法,簡單總結(jié)一下,方便自己review也跟大家分享下。
做排序的目的是什么?
目前移動(dòng)端直播對于直播內(nèi)容的展示大都采用列表的形式,如下圖所示:
個(gè)人認(rèn)為這種展現(xiàn)形式在移動(dòng)端不是最合適的,但是在對用戶口味很難把握的情況下,采用傳統(tǒng)的列表展示,讓用戶自己去挑選還是可取的。因此,當(dāng)用戶打開app看到的直播列表就顯得格外重要,這直接關(guān)系到用戶是否會繼續(xù)下面的操作。因此,在列表做直播內(nèi)容的排序就十分必要了。
排序中遇到的問題和解決思路
在我們的直播app上線前期,列表的直播內(nèi)容是很有限的,這個(gè)時(shí)候,列表排序所要解決的核心問題是:把最好的直播間優(yōu)先讓用戶看到。
1. 如何定義直播間好壞
因此,在這個(gè)階段要想的反而簡單,其實(shí)就是如何辨別一個(gè)直播間好壞的問題,我們在排序時(shí)把好的直播間放在較前的位置就好了,這就是我們經(jīng)??吹降臒衢T列表,對于熱門的定義就是平臺對于好直播間的定義。
那問題就回到如何判斷一個(gè)直播間的好壞上面。對于直播間的好壞判斷有很多維度,例如直播間人氣,直播間營收等等。這個(gè)要與產(chǎn)品的本身定位和所處的階段聯(lián)系起來制定。因?yàn)槲覀兊漠a(chǎn)品剛剛處于起步階段,希望用戶能夠更多留在直播間里,同時(shí)我們對產(chǎn)品的定位是促進(jìn)用戶和主播之間的互動(dòng)(公屏文字消息),因此當(dāng)時(shí)我們制定的房間好壞的標(biāo)準(zhǔn)就兩條;
- 能不能留住用戶(用戶是否愿意一直觀看)?
- 能不能讓用戶聊起來(用戶是否愿意發(fā)送公屏消息)?
2. 決定直播間好壞的因素選擇
有了這個(gè)標(biāo)準(zhǔn)之后,我們看重的主要房間因素是:人數(shù)、x分鐘留存、人均公屏消息數(shù)、公屏消息率。
下面簡單介紹下這幾個(gè)因素計(jì)算(每隔時(shí)間t進(jìn)行計(jì)算):
1)人數(shù):實(shí)時(shí)計(jì)算房間的人數(shù)。
2)x分鐘留存:x可以選擇3分鐘,或者5分鐘,其實(shí)和跳出率類似,以5分鐘留存為例,定義為,在一個(gè)5分鐘的時(shí)間段內(nèi),前面兩分鐘進(jìn)來的用戶記為m,在5分鐘時(shí)間段過后(3分鐘后),依然在直播間的用戶記為n,則5分鐘留存r
3)人均公屏消息數(shù):考察用戶在直播間內(nèi)是否愿意和主播互動(dòng),禮物的門檻比較高,因此用公屏來判斷較為合適,人均公屏數(shù)的定義為,發(fā)言的總條數(shù)/發(fā)言的總?cè)藬?shù)。
4)公屏消息率: 如果只考察人均公屏消息數(shù),只能反映發(fā)言的人和主播互動(dòng)的強(qiáng)度,同時(shí)還有就是互動(dòng)的廣度,即公屏消息率,定義為,發(fā)言的人數(shù)/房間的總?cè)藬?shù)。
3. 綜合房間因素得到排序值
有了上述因素定義之后,問題就變成了如何將這些因素綜合在一起變?yōu)橐粋€(gè)值來反應(yīng)直播間的好壞,這個(gè)值也就是排序所要用到的排序值。
將多個(gè)不同維度(不同單位)的因素綜合到一起的方式有很多,比較常用和簡單的就是普通線性加權(quán)。將多個(gè)因素歸一化之后,每個(gè)因素配一個(gè)權(quán)值然后線性加到一起,如下樣式:
值得一說的是:不同因素的歸一化方法,也有很多種。
本人比較推崇的是從產(chǎn)品業(yè)務(wù)角度出發(fā)去進(jìn)行非線性的歸一化,我們可以將不同因素都劃分到0到1分之間。譬如人數(shù),那么從業(yè)務(wù)角度去定義的話,當(dāng)人較少時(shí)——譬如少于10人,定義為0.1分;當(dāng)人數(shù)上漲較快時(shí),這個(gè)時(shí)候給的分?jǐn)?shù)也較高,比如11到20人,0.3分。當(dāng)人數(shù)特別多的時(shí)候,這個(gè)時(shí)候房間的人數(shù)已經(jīng)不那么重要了,可以將過高的定義為0.9分,當(dāng)再多時(shí),甚至可以將分?jǐn)?shù)降低,給予一定的懲罰,從而一定程度避免馬太效應(yīng)。
因此,因素的歸一化如果純按照數(shù)學(xué)上提供的方法可能不太符合業(yè)務(wù)的實(shí)際情況。
同時(shí)在計(jì)算參數(shù)的過程中,還得注意的問題是,在計(jì)算一些比例項(xiàng)時(shí)——譬如留存項(xiàng),就會出現(xiàn)一個(gè)問題:當(dāng)分母過小時(shí),可能就1個(gè)人在直播間,然后幾分鐘后還沒走,那么此時(shí)留存就是100%。
對于這種問題的處理有很多種,有的是直接在分母中加一個(gè)常量,或者定義一個(gè)統(tǒng)計(jì)比例數(shù)據(jù)分母的最小閾值。
4. 上線后如何衡量排序算法及權(quán)值參數(shù)調(diào)節(jié)
按照上述的排序算法,我們給定一個(gè)初步的權(quán)值之后基本就可以灰度(甚至直接上線)了,好像貌似可以解決列表排序的需求了。這時(shí)候需要想起的是:沒有數(shù)據(jù)優(yōu)化目標(biāo)的產(chǎn)品需求都是耍流氓。
其實(shí)就是如何衡量我們做的這些有沒有用,不然調(diào)節(jié)參數(shù),增加排序因素維度都是沒有任何意義的。
其實(shí)列表和現(xiàn)實(shí)生活中的商店的商品櫥窗基本起著同樣的作用,展示給用戶,吸引用戶購買(進(jìn)入觀看)。一個(gè)好的櫥窗展示應(yīng)該是:當(dāng)用戶看到商品就會去買,所以一個(gè)好的列表就是讓用戶看到就去點(diǎn),然后還一直觀看,不停在里面和主播勾搭聊騷。
從成本和收益的角度來看,列表上的任何主播直播間的曝光,都是我們的成本。因?yàn)橛脩簦髁浚┦怯谐杀镜模覀兊氖找鎽?yīng)該就是我們所看重的點(diǎn)擊、觀看時(shí)長、公屏消息數(shù)等。
因此,我們對于衡量指標(biāo)的定義就是:
- 直播間點(diǎn)擊量/列表曝光量
- 直播間人均觀看時(shí)長/列表曝光量
- 直播間消息總數(shù)/列表曝光量
- ……
在不同階段產(chǎn)品的側(cè)重點(diǎn)也有可能不同,在不同的側(cè)重點(diǎn),就應(yīng)該著重關(guān)注某一個(gè)指標(biāo),當(dāng)然也可以將上述衡量指標(biāo)綜合成一個(gè)總的kpi。有了這個(gè)之后,我們調(diào)節(jié)參數(shù),就可以通過這些指標(biāo)來判斷調(diào)整的好壞,從而決定某一組參數(shù)要不要上線。
總結(jié)
上述的整個(gè)列表的排序思路比較基礎(chǔ)和簡單,但基本搭建了一個(gè)排序系統(tǒng)的基本框架,后續(xù)的優(yōu)化基本都可在這個(gè)框架上進(jìn)行,比如:增加排序歷史因素的考慮,運(yùn)營因素的考慮等?;蛘邔⒕€性加權(quán)模型改成非線性的,增加時(shí)間因素等等各種約束條件等。但是,本質(zhì)上都是在做一件事,也是文章最前面提到的“把最好的直播間優(yōu)先讓用戶看到”。
當(dāng)然列表除了承載內(nèi)容的展示外,還擔(dān)負(fù)著用戶流量的引導(dǎo),當(dāng)產(chǎn)品用戶量成長到一定規(guī)模后,本文所提的算法就會遇到一個(gè)很大的麻煩——頭部集中,就會遇到一些問題,比如:把什么用戶給到什么樣的主播,如何合理流量分配?如何個(gè)性推薦?這些就放在后續(xù)對文章里總結(jié)了。
作者:南村小付,微信公眾號:南村小付,快手高級產(chǎn)品經(jīng)理,曾任職阿里,歡聚時(shí)代,7年互聯(lián)網(wǎng)產(chǎn)品設(shè)計(jì)運(yùn)營經(jīng)驗(yàn)。
本文由@南村小付 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
思路很清晰,學(xué)習(xí)了