基于物品相似度的智慧推薦算法

Smile
4 評(píng)論 5885 瀏覽 13 收藏 10 分鐘
🔗 产品经理的不可取代的价值是能够准确发现和满足用户需求,把需求转化为产品,并协调资源推动产品落地,创造商业价值。

編輯導(dǎo)語(yǔ):智能推薦算法的目的就在于實(shí)現(xiàn)個(gè)性化推薦,根據(jù)用戶(hù)興趣和行為特點(diǎn),向用戶(hù)推薦所需的信息或商品,幫助用戶(hù)在過(guò)載信息中快速發(fā)現(xiàn)真正所需的商品,提高用戶(hù)黏性;本文作者分享了關(guān)于智慧推薦算法的分析,我們一起來(lái)了解一下。

最近接到一個(gè)任務(wù),是一個(gè)教育類(lèi)App上的智慧推薦版塊,要針對(duì)用戶(hù)的購(gòu)買(mǎi)習(xí)慣推薦相應(yīng)的可購(gòu)買(mǎi)內(nèi)容,千人千面的滿(mǎn)足客戶(hù)的個(gè)性化需求,提高商品的點(diǎn)擊量和購(gòu)買(mǎi)量。

一、業(yè)務(wù)邏輯及適用機(jī)制

客戶(hù)需求具體如下:

  • 展覽服務(wù):結(jié)合以用戶(hù)的年齡、興趣、過(guò)往觀展記錄生成的用戶(hù)畫(huà)像,以及展方主推內(nèi)容,為用戶(hù)智能推薦展出內(nèi)容,加強(qiáng)用戶(hù)體驗(yàn)。
  • 比賽服務(wù):根據(jù)用戶(hù)以往參賽、訂閱記錄,以及系統(tǒng)中的參賽選手檔案信息,智能推薦比賽內(nèi)容。
  • 演出服務(wù):根據(jù)用戶(hù)購(gòu)票、退票、觀演歷史和用戶(hù)演出評(píng)價(jià)記錄,智能推送用戶(hù)可能感興趣的演出。

可以看出,此處智慧推薦的用戶(hù)個(gè)性化需求十分強(qiáng)烈,預(yù)設(shè)了用戶(hù)比較傾心于他以前購(gòu)買(mǎi)過(guò)的相同類(lèi)型的物品。

目前,市面上商用的主流推薦算法大致可分為如下幾類(lèi):

  • 基于內(nèi)容相似度的推薦;
  • 基于用戶(hù)相似度的協(xié)同過(guò)濾;
  • 基于物品相似度的協(xié)同過(guò)濾;
  • 基于流行度的推薦算法;
  • 基于模型的推薦(輸入一些用戶(hù)特征建立模型,進(jìn)而產(chǎn)生推薦結(jié)果);
  • 人工推薦(人工運(yùn)營(yíng)添加推薦條目)。

本項(xiàng)目非常符合基于物品相似度的協(xié)同過(guò)濾算法的使用場(chǎng)景。

二、算法的特點(diǎn)

基于物品相似度的協(xié)同過(guò)濾算法的適用場(chǎng)景有如下特征:

長(zhǎng)尾物品豐富,用戶(hù)個(gè)性化需求強(qiáng)烈的領(lǐng)域;長(zhǎng)尾效應(yīng)很好理解,舉個(gè)例子,最主流、最熱門(mén)的書(shū)籍總是占據(jù)書(shū)店最顯眼的位置,而相同類(lèi)型的冷門(mén)書(shū)籍?dāng)[上貨架的可能性就小得多,哪怕這些冷門(mén)書(shū)確實(shí)還是有市場(chǎng)需求的。那用戶(hù)購(gòu)買(mǎi)過(guò)某熱門(mén)書(shū)籍,那我把相同類(lèi)型但賣(mài)的不那么好的書(shū)推薦給老用戶(hù),這是非常合理的吧?而每個(gè)人所看的書(shū)籍類(lèi)型千差萬(wàn)別,我告訴你有某個(gè)你不認(rèn)識(shí)的人也愛(ài)看某本書(shū),你恐怕也不一定愿意買(mǎi)吧。

物品數(shù)遠(yuǎn)小于用戶(hù)數(shù)的場(chǎng)合;物品數(shù)據(jù)相對(duì)用戶(hù)數(shù)據(jù)本身就更為穩(wěn)定,再者物品數(shù)據(jù)的樣本量小,此時(shí)計(jì)算物品的相似度不但計(jì)算量較小,也不必頻繁更新,程序壓力小。

因此該算法往往應(yīng)用在圖書(shū)、電子商務(wù)、教育及電影網(wǎng)站,這些領(lǐng)域均符合以上兩點(diǎn)特征。

基于物品相似度的協(xié)同過(guò)濾算法,其關(guān)注點(diǎn)在于維系用戶(hù)的歷史興趣,而其交互特點(diǎn)在于推薦結(jié)果的實(shí)時(shí)變化。其優(yōu)缺點(diǎn)如下:

  • 缺點(diǎn):存在App冷啟動(dòng)的問(wèn)題,即App剛開(kāi)始使用時(shí)用戶(hù)數(shù)少,內(nèi)容也少,未形成用戶(hù)喜好池;對(duì)于本項(xiàng)目來(lái)說(shuō),也即是在缺少用戶(hù)的歷史記錄,無(wú)法據(jù)此推薦內(nèi)容的情況下,適用范圍受限。
  • 優(yōu)點(diǎn):推薦結(jié)果解釋性強(qiáng);隨著用戶(hù)的瀏覽記錄數(shù)據(jù)的增加,推薦一般也會(huì)越來(lái)越準(zhǔn)確。

三、算法的實(shí)現(xiàn)

在本次項(xiàng)目中,基于物品相似度的協(xié)同過(guò)濾算法的實(shí)現(xiàn)大致如下所示:

計(jì)算物品(課程/活動(dòng)/演出/展覽/比賽等)的相似度。

步驟如下:

利用物品的內(nèi)容屬性計(jì)算相似度。內(nèi)容屬性類(lèi)似于一種標(biāo)簽,能體現(xiàn)出物品的共性。

物品可以是實(shí)體的物件,也可以是虛擬的娛樂(lè)服務(wù)。比如某演出的類(lèi)型,是話(huà)劇、舞蹈還是歌唱?演出的適宜人群是10-18歲的青少年,還是二十來(lái)歲的大學(xué)生,還是工作穩(wěn)定家庭圓滿(mǎn)的中年人?演出的地點(diǎn)在茶館、體育館還是歌劇廳?

一個(gè)物品可以有多個(gè)標(biāo)簽,而兩個(gè)物品相同的標(biāo)簽越多,兩者的相似度也就越高。

分析用戶(hù)的行為記錄計(jì)算相似度。用戶(hù)的行為記錄包括曾經(jīng)觀看過(guò)的演出、展覽,參加過(guò)的比賽,購(gòu)買(mǎi)過(guò)的商品等。確認(rèn)了用戶(hù)的行為偏好,就“投其所好”。

為用戶(hù)生成推薦列表。將物品和用戶(hù)的行為關(guān)聯(lián)起來(lái),和用戶(hù)歷史上感興趣的物品越相似的物品,越有可能在用戶(hù)的推薦列表中獲得更高的排名。需要考慮以下幾個(gè)方面:

業(yè)務(wù)場(chǎng)景:共可分為冷啟動(dòng)、非冷啟動(dòng)新用戶(hù)、非冷啟動(dòng)老用戶(hù)、匿名用戶(hù)四種。不同的業(yè)務(wù)場(chǎng)景適用的算法不同,對(duì)于本項(xiàng)目,基于物品協(xié)同過(guò)濾推薦算法適用于非冷啟動(dòng)老用戶(hù)。

不同業(yè)務(wù)場(chǎng)景適用的算法不同

推薦位置:需考慮前端推薦列表的入口(首頁(yè)或某個(gè)模塊),以及其內(nèi)部的界面層級(jí)。

結(jié)果評(píng)測(cè):推薦列表上線(xiàn)后,收集數(shù)據(jù)用于算法的優(yōu)化。需對(duì)比算法使用前后商品銷(xiāo)售量和銷(xiāo)售額的增長(zhǎng)情況,以此衡量算法的有效性并及時(shí)調(diào)整推薦機(jī)制。

  • 商品的數(shù)量層面的相關(guān)數(shù)據(jù):點(diǎn)擊量、點(diǎn)擊率、收藏量(若允許收藏)、加購(gòu)量、加購(gòu)率、提交訂單量、提交訂單率、訂單付款率、占比等等。
  • 商品的金額層面的相關(guān)數(shù)據(jù):點(diǎn)擊量、收藏金額、加購(gòu)金額、提交訂單金額、付款額、占比等等。

本次項(xiàng)目中,前端給定了一個(gè)智能推薦主入口,提供展覽服務(wù)、比賽服務(wù)、演出服務(wù)三個(gè)次級(jí)入口。

需要注意的是,這三個(gè)次級(jí)入口所導(dǎo)入的內(nèi)容,均是已經(jīng)維護(hù)好的,只是處于同種物品的長(zhǎng)尾列表內(nèi),曝光率可能較低。智慧推薦要做的就是提升這些內(nèi)容的曝光率。

考慮的物品內(nèi)容屬性及權(quán)重系數(shù)有所區(qū)別:

展覽服務(wù)(展覽):

  • 展覽位置:考慮到不同場(chǎng)館給用戶(hù)帶來(lái)的體驗(yàn)不同,用戶(hù)可能偏向于在某個(gè)展館內(nèi)觀展,因此會(huì)對(duì)相同展館內(nèi)舉辦的展覽進(jìn)行推薦。權(quán)重系數(shù)低。
  • 展覽時(shí)間:用于相近時(shí)間段的推薦。如某展覽舉辦期間還有其他展覽也在舉辦;或者用戶(hù)在觀賞某演出的當(dāng)天,也有某個(gè)展覽正在舉行,希望用戶(hù)可以“順便”參加某展覽。權(quán)重系數(shù)低。
  • 展覽類(lèi)型:展覽可分為書(shū)法展、繪畫(huà)展、科技展等不同類(lèi)型,每種類(lèi)型又可細(xì)分為多個(gè)小類(lèi),如繪畫(huà)展可細(xì)分為中國(guó)畫(huà)展、油畫(huà)展、 版畫(huà)展等等。實(shí)際上,在維護(hù)展覽的相關(guān)信息時(shí),已經(jīng)為不同展覽設(shè)定了標(biāo)簽。權(quán)重系數(shù)高。
  • 適宜人群:不同年齡段的人所愛(ài)好的東西有其相似性,因此要對(duì)展覽的受眾進(jìn)行區(qū)分,如10歲以下的幼童、10~18歲的青少年、18歲以上等等。

比賽服務(wù)(比賽):比賽類(lèi)型(書(shū)法、繪畫(huà)、朗誦、小發(fā)明等標(biāo)簽)。

演出服務(wù)(演出):演出位置、演出類(lèi)型(朗誦、歌唱、舞蹈、小品等標(biāo)簽)、演出時(shí)間(近期推薦)等,類(lèi)似展覽。

后臺(tái)給定了算法的模板配置頁(yè)面,推薦位配置頁(yè)面以及結(jié)果評(píng)測(cè)頁(yè)面。

 

本文由 @Smile 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自 Unsplash ,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 如果要寫(xiě)一個(gè)推薦相關(guān)的產(chǎn)品文檔,應(yīng)該跟開(kāi)發(fā)列出具體的算法實(shí)現(xiàn)邏輯嗎

    來(lái)自廣東 回復(fù)
    1. 可以呀,只要你很會(huì)~

      來(lái)自江蘇 回復(fù)
  2. ?。。。?/p>

    來(lái)自廣東 回復(fù)
    1. 咩呀?有問(wèn)題歡迎指正嘿嘿嘿

      來(lái)自江蘇 回復(fù)
专题
12335人已学习12篇文章
现如今,越来越多的企业开始重视私域,很多的企业都对私域的发展进行了布局。本专题的文章分享了如何搭建私域模型。
专题
17941人已学习15篇文章
本专题的文章分享了Android和iOS在产品、设计、交互等方面的差异。
专题
19968人已学习14篇文章
好的用户成长体系可以促进用户活跃、增强用户粘性、留住用户和帮助企业更好地了解用户对产品的使用情况。本专题的文章提供了搭建用户成长体系的思路。
专题
11968人已学习12篇文章
数字化平台搭建,适用于企业已经有稳定的业务和资源,希望通过数字化平台做资源变现实现盈利,通过数字化平台将客户、交易、需求、场景全部数据化。本专题的文章分享了如何搭建数字化平台。
专题
16114人已学习16篇文章
企业服务(2B)公司的创业有8个阶段,所有SaaS公司或2B公司不可能跳过这些阶段,每个阶段都有明确的任务。本专题的文章分享了SaaS创业路线图。