推薦系統如何平衡不同業(yè)務之間的流量競爭關系
在復雜流量系統重中,如何通過有效的機制去生態(tài)業(yè)務之間的流量競爭關系呢?如何將有效的流量得到價值最大化的分發(fā),這是本篇文章希望探討的問題。
在平臺型的復雜的業(yè)務系統中,通常會有多方的參與角色,比如平臺方、資源供給方、內容消費方,而在復雜的生態(tài)中,為了追求整個平臺收益的最大化,通常同時會面臨著多樣的生態(tài)系統的不同角色之間的利益沖突問題,同樣一個位置,可以把位置給到A,也可以將位置給到B,那么如何科學的判斷將位置給到不同的用戶呢?
【思考:如有多個業(yè)務競爭免單場景流量,如何判斷面單區(qū)域的流量應該分發(fā)給哪個業(yè)務線呢?】
一、流量的概念
在解決該問題前,我們需要弄清楚流量概念。
在通用的解釋中,流量,指單位時間內通過特定表面的流體的量。
筆者對在互聯網領域的流量有一個簡單的理解,就是單位時間服務與用戶產生的交互的量。這里面有幾個核心的構成要素,1是時間、2是服務、3是用戶,時間也就是用戶與服務產生交互的時間,服務的實體可以是功能,也可以是內容,用戶是使用服務的實體。
在互聯網產品中,這是構建場景的3個核心要素。
二、問題
在思考如何平衡的時候,就需要解決以下幾個問題:
- 流量分給誰?
- 流量給多少?
其實這兩個問題,分別就代表的是用戶和時間的乘積,就是流量分給誰,而流量給多少,就是服務與時間的乘積。
三、方案
流量價值標準的量化:
不同業(yè)務之間的價值體現是不一樣的。比如,對新興業(yè)務來說,可能更加需要的是日活,對商業(yè)廣告來說,需要是CTR的提升,那么,就需要找到一個可量化的指標,來解決不同業(yè)務之間的不同業(yè)務指標的統一性問題。
一般來說,這里要根據業(yè)務需要設定場景中評判流量質量的指標,比如CTR、CVR等,這里評判不同指標需要根據實際的業(yè)務需要,去設計一個模型出來,通常涉及維度越多,會越復雜。
流量賦值公式:
Z=aX1+bX2+cX3
流量權重設計:
流量標準量化:
歸一化的兩種方法
數據歸一化有兩種常用的方法,我們在處理很多大范圍的數據的時候,往往需要數據歸一化。
1)min-max標準化
這種歸一化的方法是說, 對于任意一個給定的數列a[i],利用a[i]-min/(max-min)的方法既可以消除因為數據的量綱問題所帶來的不能進行多種數據共同分析的缺陷。
2)Z-score標準化方法
這種方法給予原始數據均值和標準差,并且對數據進行標準化的處理。經過處理后的數據符合標準的正態(tài)分布,也就是均值為0,標準差為1,轉化函數為:
a[i] = x-均值/方差
【筆者在實際業(yè)務中常常使用的是第一種歸一方法】
小結
通常,流量價值是評估一個業(yè)務在對應場景流量價值的一個維度指標,可能會有其他的比如相關性權重,人工權重,通常也會結合其他維度進行綜合考量,但本文講解的是如何平衡不同流量之間的競爭關系,通過AHP模型進行賦值,一般能比較好的解決對應問題。
四、實際業(yè)務可能遇到的問題
但其實,在實際的業(yè)務中,常常會遇到內容質量欺騙問題還有業(yè)務滲透率過低問題,還會遇到同個模型在不同場景應用的普適性問題。
1. 低質量內容打壓
低質量內容的判斷都可以列為一個典型的問題來做探討,通常來說,低質量內容的判斷也是通過AHP賦值,去衡量內容的標準。對內容的判斷常常會產生偏差:
- 封面因素:封面因素會導致很多高質量內容低點擊率,低質量內容高點擊率情況,通常我們對該類內容產生的相關指標偏離過大,會在策略重排層做適量的流量補充或者打壓。
- 領域細分:有些內容領域過于細分,導致在定量或者定比分流過程中,CTR過低。通常這種問題產生的原因是業(yè)務中推薦內容多樣性過低。這種常常會被誤認為內容低質。在業(yè)務實際中,我們遇到該類問題通常是通過約束投流業(yè)務方的內容供給多樣性或者在召回過程中,采用多路規(guī)則召回的方式。
- 標簽質量:有些內容雖然質量很好,但是因為標簽標注原因會導致內容再冷啟過程中分發(fā)過程中匹配到了不對應的用戶,導致點擊率低。在業(yè)務實際中我們遇到這種現象后,制定了冷啟隨機分法、標簽重標注與視頻AI解析的sop。
2. 業(yè)務滲透率問題
在新業(yè)務推廣前期,我們通常不知道這類業(yè)務的目標用戶體量是多少,通常我們會在隨機分發(fā)階段確定對應業(yè)務的目標群體,在通過相似用戶的分級擴召的方式進行分級流量分發(fā)。對該類流量分發(fā)場景,我們一般會涉及一個特定的指標去平衡分流和擴召的量的問題。
3. 模型的普適性
不同場景的核心指標是不一樣的,這背后的原因是不同場景的滿足用戶的核心訴求是不一樣的,也會導致不同場景的用戶目標、行為、數據指標會有差異,需要根據不同場景基于經驗去設計不同指標。
4. 流量分發(fā)的兩種模式
離線預估:就是通過離線的歷史數據預估未來的流量分發(fā)結果,在面對用戶行為、特征相對恒定的場景和用戶可以使用。
實時計算:通常實時計算在決策領域是比較常用的做法,通過階段性的分發(fā)數據去決定下一個投放周期的內容投流量級和比例。
5. 價值最大化的極端問題
在實際業(yè)務中,我們常常會遇到在價值最大化之后,會產生平臺中都是用戶偏好內容的結果。這種情況下,一般會通過GSB主觀評估及投中監(jiān)控分析抽樣去平衡。避免極端情況的發(fā)生。
五、總結
在推薦系統日趨成熟的時代,隨著業(yè)務多元化發(fā)展,極致的去使用每個推薦位的流量使其價值最大化是推薦系統的終極目標,如果將最終指標完全交給模型算法去做預估,1則無法實現新業(yè)務的流量需求,2可能會遇到極端情況的發(fā)生3、也會面臨實際業(yè)務中的一些現實問題。
即便如今有了多目標模型等新的處理方法,但作為策略產品經理,能夠結合業(yè)務場景和實際的業(yè)務分發(fā)需要及對應場景的用戶行為、特征,設計不同的場景評估體系及分發(fā)邏輯,才是策略產品最核心的競爭力所在。
本文由 @策略產品Ason 原創(chuàng)發(fā)布于人人都是產品經理。未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!