短視頻是如何讓你上癮的

8 評論 4943 瀏覽 22 收藏 9 分鐘

編輯導(dǎo)語:推薦算法基于用戶喜好,為用戶推送其可能感興趣的事物。這一模式有利有弊,一方面,推薦算法的存在可以幫助用戶在海量信息中進行篩選,但另一方面,個性化推薦讓用戶喜好無所遁形。本篇文章里,作者從短視頻讓人上癮這一現(xiàn)象入手,對推薦算法進行了拆解,一起來看一下。

“這篇文章主要是想通過短視頻產(chǎn)品,和大家探討一個對于數(shù)據(jù)分析師相對比較陌生的領(lǐng)域:推薦算法?!?/p>

一、比你自己更懂你

不知小伙伴們是否和我一樣,每天都會面對一個來自靈魂深處的拷問:今天吃什么?

于是,當(dāng)我打開美團外賣、餓了么外賣,首頁一大波我愛吃的推薦好菜便撲面而來,媽媽再也不用擔(dān)心我今天吃什么啦!當(dāng)我們在淘寶、京東等購物網(wǎng)站完成一次購物之后,平臺馬上就會為我們推薦另外一些相似的商品,一不留神又開啟了買買買的模式。

當(dāng)我們在閑暇打開抖音摸魚的時候,為什么會源源不斷刷出自己感興趣的視頻,不知不覺大半天已經(jīng)過去了,讓人不得不感嘆:這推薦,根本停不下來??!

短視頻是如何讓你上癮的

從衣食住行到文教娛樂,這些滲透到我們?nèi)粘I罘椒矫婷娴囊粋€個互聯(lián)網(wǎng)產(chǎn)品,不斷讓我們驚呼:哇哦,amazing,它們簡直比我自己還要了解我!小朋友,此時你腦海里是否有很多問號,它們到底是怎么做到的呢?

其實,在它們的背后都有一個強大的大腦——推薦系統(tǒng)。接下來我們就一起走進推薦系統(tǒng)的奇妙世界!

二、打開推薦系統(tǒng)的“黑匣子”

1. 推薦系統(tǒng)的目的

隨著互聯(lián)網(wǎng)信息技術(shù)的發(fā)展,我們已經(jīng)身處在大數(shù)據(jù)的時代。

在浩如煙海的信息中,如何找到自己感興趣的內(nèi)容,或者說信息生產(chǎn)者如何讓自己所要傳達的信息被人們所看到,都會是一個非常困難的過程。推薦系統(tǒng)就像一個漏斗一樣,通過對信息進行融合、摘要和篩選,最終呈現(xiàn)給用戶自己認為或者商家覺得“有用的信息”。

短視頻是如何讓你上癮的

2. 推薦系統(tǒng)分類

3. 推薦系統(tǒng)核心流程

短視頻是如何讓你上癮的

推薦系統(tǒng)本質(zhì)是一個信息過濾系統(tǒng),它基于用戶數(shù)據(jù)、用戶行為數(shù)據(jù)和商品內(nèi)容信息并通過一定的算法來預(yù)測用戶的偏好,根據(jù)用戶的偏好特點過濾掉用戶不感興趣的商品或者內(nèi)容,從而通過“千人千面”的手段不斷的吸引用戶留在產(chǎn)品上。

按照流程通常分為:召回、排序、重排序這3個核心環(huán)節(jié),每個環(huán)節(jié)逐層過濾,最終從海量的物料庫中篩選出幾十個用戶可能感興趣的內(nèi)容或商品推薦給用戶。

三、短視頻個性化推薦大揭秘

1. 基于用戶的協(xié)同過濾

核心思想:A和C兩個用戶相似,給A推薦C喜歡且A沒有看過的東西。

短視頻是如何讓你上癮的

2. 基于物品的協(xié)同過濾

核心思想:兩個視頻1和3相似,給C推薦與視頻1(A和C都喜歡)相似的內(nèi)容。接下來,我們以基于用戶的協(xié)同過濾為例,通過短視頻推薦的案例給大家進行略作詳細講解。

假設(shè)在某短視頻平臺有ID為DY001至DY006的六位用戶,他們可能對不同短視頻進行瀏覽、收藏、點贊、評論、分享等行為操作。為了衡量不同用戶對不同短視頻的興趣度,我們可以設(shè)計一個簡單的模型,對不同行為賦予相應(yīng)的分值,如下表:

短視頻是如何讓你上癮的

根據(jù)用戶的行為計算視頻得分,滿分10分,加到10后則不再累加。比如某一用戶對搞笑類視頻打分是8分(可能是瀏覽1分,點贊3分,分享4分),然后,我們就能得到DY0001至DY0006這六位用戶對各種類型短視頻的偏好程度得分表(0為完全沒興趣,10為非常有興趣,空白為暫缺):

短視頻是如何讓你上癮的

很顯然,通過根據(jù)用戶在不同視頻上的得分情況,可以得到用戶對不同視頻的喜愛情況,在此基礎(chǔ)上構(gòu)建出用戶特征向量,然后根據(jù)余弦相似度可以判斷用戶之間的相似性。

短視頻是如何讓你上癮的

根據(jù)相似性可以建立用戶相似矩陣(得分越接近1代表兩個用戶越相似),可以一定程度上判斷兩個用戶在視頻偏好上的相似程度。

短視頻是如何讓你上癮的

進而我們可以認為,如果用戶A和用戶B比較相似,可以認為A喜歡的書B應(yīng)該也喜歡。因此我們在給用戶A進行視頻推薦時,找到與其相似度較高的其他用戶,然后過濾掉用戶A已看過的視頻,結(jié)合相似用戶對某個視頻的喜愛程度以及該用戶與A用戶的相似度進行加權(quán),得到的推薦指數(shù)越高的視頻越優(yōu)先進行推薦。

當(dāng)然,對于不同的短視頻平臺,其對用戶的不同行為所賦予的權(quán)重是不一樣的,以下是抖音和快手的部分策略對比,僅供參考:

短視頻是如何讓你上癮的

四、結(jié)束語

本篇文章,我們從生活中的“個性化推薦”現(xiàn)象入手,一起探討了系統(tǒng)過濾推薦算法的原理以及簡單的應(yīng)用。

當(dāng)然,協(xié)同過濾推薦算法并不是萬能的,它過度依賴用戶的歷史數(shù)據(jù),面對新的用戶或者新的物品,在開始的時候沒有數(shù)據(jù)或數(shù)據(jù)較少時,協(xié)同過濾算法無法做出較為準確的推薦。需要等數(shù)據(jù)積累,或者其他方案進行彌補缺陷,也就是常說的冷啟動的問題。

 

本文由 @知了數(shù)據(jù)分析 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 關(guān)注【知了數(shù)據(jù)分析】,獲取更多數(shù)據(jù)分析干貨!

    來自山東 回復(fù)
  2. 以后要多刷一點類似的文章,我太孤陋寡聞了

    來自北京 回復(fù)
  3. 作者寫得挺好的,我才知道原來一個視頻的背后還有包含了這么多東西,真是太復(fù)雜了

    來自北京 回復(fù)
    1. 謝謝你喜歡我的文章,歡迎關(guān)注我的公眾號【知了數(shù)據(jù)分析】,還有更多你感興趣的文章

      來自北京 回復(fù)
  4. 這個算法推薦還更好底減少了用戶的無用操作,使用APP的用戶只要一個上滑就可以獲得一個新的內(nèi)容了。
    對比B站的平鋪式,短視頻減少了用戶選擇的時間和所花費的e精力,不用在意標題黨或者封面黨,獲取到一個新的視頻時只關(guān)注視頻所呈現(xiàn)的內(nèi)容就好了,看到不喜歡就直接劃走,不用退出再找喜歡的內(nèi)容。
    如果一個用戶不點贊、不收藏也不評論,他只想看視頻的話,那么他只要一直往上滑就行了。

    來自廣東 回復(fù)
    1. 這種屬于單列沉浸的交互方式

      回復(fù)
  5. 為用戶推送其可能感興趣的事物,真的太叫人上癮了

    來自河南 回復(fù)
    1. 不過算法這個東西是把雙刃劍,國家現(xiàn)在也正在規(guī)范算法向善

      來自北京 回復(fù)