基于物品相似度的智慧推薦算法
編輯導(dǎo)語(yǔ):智能推薦算法的目的就在于實(shí)現(xiàn)個(gè)性化推薦,根據(jù)用戶(hù)興趣和行為特點(diǎn),向用戶(hù)推薦所需的信息或商品,幫助用戶(hù)在過(guò)載信息中快速發(fā)現(xiàn)真正所需的商品,提高用戶(hù)黏性;本文作者分享了關(guān)于智慧推薦算法的分析,我們一起來(lái)了解一下。
最近接到一個(gè)任務(wù),是一個(gè)教育類(lèi)App上的智慧推薦版塊,要針對(duì)用戶(hù)的購(gòu)買(mǎi)習(xí)慣推薦相應(yīng)的可購(gòu)買(mǎi)內(nèi)容,千人千面的滿(mǎn)足客戶(hù)的個(gè)性化需求,提高商品的點(diǎn)擊量和購(gòu)買(mǎi)量。
一、業(yè)務(wù)邏輯及適用機(jī)制
客戶(hù)需求具體如下:
- 展覽服務(wù):結(jié)合以用戶(hù)的年齡、興趣、過(guò)往觀展記錄生成的用戶(hù)畫(huà)像,以及展方主推內(nèi)容,為用戶(hù)智能推薦展出內(nèi)容,加強(qiáng)用戶(hù)體驗(yàn)。
- 比賽服務(wù):根據(jù)用戶(hù)以往參賽、訂閱記錄,以及系統(tǒng)中的參賽選手檔案信息,智能推薦比賽內(nèi)容。
- 演出服務(wù):根據(jù)用戶(hù)購(gòu)票、退票、觀演歷史和用戶(hù)演出評(píng)價(jià)記錄,智能推送用戶(hù)可能感興趣的演出。
可以看出,此處智慧推薦的用戶(hù)個(gè)性化需求十分強(qiáng)烈,預(yù)設(shè)了用戶(hù)比較傾心于他以前購(gòu)買(mǎi)過(guò)的相同類(lèi)型的物品。
目前,市面上商用的主流推薦算法大致可分為如下幾類(lèi):
- 基于內(nèi)容相似度的推薦;
- 基于用戶(hù)相似度的協(xié)同過(guò)濾;
- 基于物品相似度的協(xié)同過(guò)濾;
- 基于流行度的推薦算法;
- 基于模型的推薦(輸入一些用戶(hù)特征建立模型,進(jìn)而產(chǎn)生推薦結(jié)果);
- 人工推薦(人工運(yùn)營(yíng)添加推薦條目)。
本項(xiàng)目非常符合基于物品相似度的協(xié)同過(guò)濾算法的使用場(chǎng)景。
二、算法的特點(diǎn)
基于物品相似度的協(xié)同過(guò)濾算法的適用場(chǎng)景有如下特征:
長(zhǎng)尾物品豐富,用戶(hù)個(gè)性化需求強(qiáng)烈的領(lǐng)域;長(zhǎng)尾效應(yīng)很好理解,舉個(gè)例子,最主流、最熱門(mén)的書(shū)籍總是占據(jù)書(shū)店最顯眼的位置,而相同類(lèi)型的冷門(mén)書(shū)籍?dāng)[上貨架的可能性就小得多,哪怕這些冷門(mén)書(shū)確實(shí)還是有市場(chǎng)需求的。那用戶(hù)購(gòu)買(mǎi)過(guò)某熱門(mén)書(shū)籍,那我把相同類(lèi)型但賣(mài)的不那么好的書(shū)推薦給老用戶(hù),這是非常合理的吧?而每個(gè)人所看的書(shū)籍類(lèi)型千差萬(wàn)別,我告訴你有某個(gè)你不認(rèn)識(shí)的人也愛(ài)看某本書(shū),你恐怕也不一定愿意買(mǎi)吧。
物品數(shù)遠(yuǎn)小于用戶(hù)數(shù)的場(chǎng)合;物品數(shù)據(jù)相對(duì)用戶(hù)數(shù)據(jù)本身就更為穩(wěn)定,再者物品數(shù)據(jù)的樣本量小,此時(shí)計(jì)算物品的相似度不但計(jì)算量較小,也不必頻繁更新,程序壓力小。
因此該算法往往應(yīng)用在圖書(shū)、電子商務(wù)、教育及電影網(wǎng)站,這些領(lǐng)域均符合以上兩點(diǎn)特征。
基于物品相似度的協(xié)同過(guò)濾算法,其關(guān)注點(diǎn)在于維系用戶(hù)的歷史興趣,而其交互特點(diǎn)在于推薦結(jié)果的實(shí)時(shí)變化。其優(yōu)缺點(diǎn)如下:
- 缺點(diǎn):存在App冷啟動(dòng)的問(wèn)題,即App剛開(kāi)始使用時(shí)用戶(hù)數(shù)少,內(nèi)容也少,未形成用戶(hù)喜好池;對(duì)于本項(xiàng)目來(lái)說(shuō),也即是在缺少用戶(hù)的歷史記錄,無(wú)法據(jù)此推薦內(nèi)容的情況下,適用范圍受限。
- 優(yōu)點(diǎn):推薦結(jié)果解釋性強(qiáng);隨著用戶(hù)的瀏覽記錄數(shù)據(jù)的增加,推薦一般也會(huì)越來(lái)越準(zhǔn)確。
三、算法的實(shí)現(xiàn)
在本次項(xiàng)目中,基于物品相似度的協(xié)同過(guò)濾算法的實(shí)現(xiàn)大致如下所示:
計(jì)算物品(課程/活動(dòng)/演出/展覽/比賽等)的相似度。
步驟如下:
利用物品的內(nèi)容屬性計(jì)算相似度。內(nèi)容屬性類(lèi)似于一種標(biāo)簽,能體現(xiàn)出物品的共性。
物品可以是實(shí)體的物件,也可以是虛擬的娛樂(lè)服務(wù)。比如某演出的類(lèi)型,是話(huà)劇、舞蹈還是歌唱?演出的適宜人群是10-18歲的青少年,還是二十來(lái)歲的大學(xué)生,還是工作穩(wěn)定家庭圓滿(mǎn)的中年人?演出的地點(diǎn)在茶館、體育館還是歌劇廳?
一個(gè)物品可以有多個(gè)標(biāo)簽,而兩個(gè)物品相同的標(biāo)簽越多,兩者的相似度也就越高。
分析用戶(hù)的行為記錄計(jì)算相似度。用戶(hù)的行為記錄包括曾經(jīng)觀看過(guò)的演出、展覽,參加過(guò)的比賽,購(gòu)買(mǎi)過(guò)的商品等。確認(rèn)了用戶(hù)的行為偏好,就“投其所好”。
為用戶(hù)生成推薦列表。將物品和用戶(hù)的行為關(guān)聯(lián)起來(lái),和用戶(hù)歷史上感興趣的物品越相似的物品,越有可能在用戶(hù)的推薦列表中獲得更高的排名。需要考慮以下幾個(gè)方面:
業(yè)務(wù)場(chǎng)景:共可分為冷啟動(dòng)、非冷啟動(dòng)新用戶(hù)、非冷啟動(dòng)老用戶(hù)、匿名用戶(hù)四種。不同的業(yè)務(wù)場(chǎng)景適用的算法不同,對(duì)于本項(xiàng)目,基于物品協(xié)同過(guò)濾推薦算法適用于非冷啟動(dòng)老用戶(hù)。
不同業(yè)務(wù)場(chǎng)景適用的算法不同
推薦位置:需考慮前端推薦列表的入口(首頁(yè)或某個(gè)模塊),以及其內(nèi)部的界面層級(jí)。
結(jié)果評(píng)測(cè):推薦列表上線(xiàn)后,收集數(shù)據(jù)用于算法的優(yōu)化。需對(duì)比算法使用前后商品銷(xiāo)售量和銷(xiāo)售額的增長(zhǎng)情況,以此衡量算法的有效性并及時(shí)調(diào)整推薦機(jī)制。
- 商品的數(shù)量層面的相關(guān)數(shù)據(jù):點(diǎn)擊量、點(diǎn)擊率、收藏量(若允許收藏)、加購(gòu)量、加購(gòu)率、提交訂單量、提交訂單率、訂單付款率、占比等等。
- 商品的金額層面的相關(guān)數(shù)據(jù):點(diǎn)擊量、收藏金額、加購(gòu)金額、提交訂單金額、付款額、占比等等。
本次項(xiàng)目中,前端給定了一個(gè)智能推薦主入口,提供展覽服務(wù)、比賽服務(wù)、演出服務(wù)三個(gè)次級(jí)入口。
需要注意的是,這三個(gè)次級(jí)入口所導(dǎo)入的內(nèi)容,均是已經(jīng)維護(hù)好的,只是處于同種物品的長(zhǎng)尾列表內(nèi),曝光率可能較低。智慧推薦要做的就是提升這些內(nèi)容的曝光率。
考慮的物品內(nèi)容屬性及權(quán)重系數(shù)有所區(qū)別:
展覽服務(wù)(展覽):
- 展覽位置:考慮到不同場(chǎng)館給用戶(hù)帶來(lái)的體驗(yàn)不同,用戶(hù)可能偏向于在某個(gè)展館內(nèi)觀展,因此會(huì)對(duì)相同展館內(nèi)舉辦的展覽進(jìn)行推薦。權(quán)重系數(shù)低。
- 展覽時(shí)間:用于相近時(shí)間段的推薦。如某展覽舉辦期間還有其他展覽也在舉辦;或者用戶(hù)在觀賞某演出的當(dāng)天,也有某個(gè)展覽正在舉行,希望用戶(hù)可以“順便”參加某展覽。權(quán)重系數(shù)低。
- 展覽類(lèi)型:展覽可分為書(shū)法展、繪畫(huà)展、科技展等不同類(lèi)型,每種類(lèi)型又可細(xì)分為多個(gè)小類(lèi),如繪畫(huà)展可細(xì)分為中國(guó)畫(huà)展、油畫(huà)展、 版畫(huà)展等等。實(shí)際上,在維護(hù)展覽的相關(guān)信息時(shí),已經(jīng)為不同展覽設(shè)定了標(biāo)簽。權(quán)重系數(shù)高。
- 適宜人群:不同年齡段的人所愛(ài)好的東西有其相似性,因此要對(duì)展覽的受眾進(jìn)行區(qū)分,如10歲以下的幼童、10~18歲的青少年、18歲以上等等。
比賽服務(wù)(比賽):比賽類(lèi)型(書(shū)法、繪畫(huà)、朗誦、小發(fā)明等標(biāo)簽)。
演出服務(wù)(演出):演出位置、演出類(lèi)型(朗誦、歌唱、舞蹈、小品等標(biāo)簽)、演出時(shí)間(近期推薦)等,類(lèi)似展覽。
后臺(tái)給定了算法的模板配置頁(yè)面,推薦位配置頁(yè)面以及結(jié)果評(píng)測(cè)頁(yè)面。
本文由 @Smile 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自 Unsplash ,基于 CC0 協(xié)議
如果要寫(xiě)一個(gè)推薦相關(guān)的產(chǎn)品文檔,應(yīng)該跟開(kāi)發(fā)列出具體的算法實(shí)現(xiàn)邏輯嗎
可以呀,只要你很會(huì)~
?。。。?/p>
咩呀?有問(wèn)題歡迎指正嘿嘿嘿