不會(huì)算法只用EXCEL如何構(gòu)建RFM會(huì)員價(jià)值模型
編輯導(dǎo)語:RFM模型是與用戶價(jià)值相關(guān)的常見模型之一。那么,RFM模型具體應(yīng)該如何應(yīng)用?如果非專業(yè)數(shù)據(jù)師,又該如何利用常見工具Excel來計(jì)算RFM值、得出有效數(shù)據(jù)呢?本文作者就介紹了用Excel來構(gòu)建RFM模型的方法,讓我們來看一下。
一、引言
如果你聽過客戶關(guān)系管理(CRM),那么你大概率上也曾聽到過RFM模型。在精細(xì)化運(yùn)營(yíng)的今天,在解決如何更好的挖掘用戶價(jià)值之前,首先要解決的問題是如何衡量用戶價(jià)值?
和用戶價(jià)值有關(guān)的模型非常多,除了RFM模型之外,還有客戶生命周期價(jià)值模型(CLV模型)、客戶生命周期模型(AARRR模型)等。不同的模型切入的角度以及具體的應(yīng)用不同,我們今天主要講的是RFM模型。
本文主要分為兩個(gè)部分:一是理論部分,簡(jiǎn)單告訴大家RFM模型是什么?能夠給生意帶來什么幫助?二是計(jì)算部分,如何只用EXCEL就可以計(jì)算RFM值并得出用戶分層數(shù)據(jù)。
二、理論部分
1. RFM模型有什么用?
舉例來說:某品牌經(jīng)過10年的運(yùn)營(yíng),擁有了500萬的注冊(cè)會(huì)員,這個(gè)數(shù)字是明確且可統(tǒng)計(jì)的。在這500萬的注冊(cè)會(huì)員中有400萬的注冊(cè)會(huì)員產(chǎn)生過購(gòu)買行為。那么這400萬產(chǎn)生過購(gòu)買行為的會(huì)員中,有多少會(huì)員是品牌的忠誠(chéng)用戶?有多少會(huì)員已經(jīng)流失?又有多少會(huì)員即將流失?
針對(duì)這些不同類型的用戶,如何才能實(shí)現(xiàn)快速獲取并快速定制運(yùn)營(yíng)方案?甚至可以直接設(shè)置自動(dòng)化精準(zhǔn)定向營(yíng)銷呢?
RFM模型可以給你解答這一系列的問題,只有掌握了品牌會(huì)員的不同分類以及價(jià)值,才能夠有針對(duì)性地設(shè)計(jì)運(yùn)營(yíng)活動(dòng),從而提高最終的成交轉(zhuǎn)化。
2. 什么是RFM模型?
根據(jù)美國(guó)數(shù)據(jù)庫(kù)營(yíng)銷研究所Arthur Hughes教授的研究表明,在客戶的數(shù)據(jù)庫(kù)中有三個(gè)要素,這三個(gè)要素構(gòu)成了分析用戶價(jià)值的重要指標(biāo):
- R (Recency) : 最近一次交易時(shí)間間隔;
- F(Frequency) : 消費(fèi)頻率;
- M(Monetary): 消費(fèi)金額。
RFM模型即是這三個(gè)單詞的首字母組合。
R (Recency) : 最近一次交易時(shí)間間隔,指的是消費(fèi)者最后一次成交距統(tǒng)計(jì)時(shí)間的間隔。
例如消費(fèi)者最后一次的交易時(shí)間是2021年3月6日,統(tǒng)計(jì)時(shí)間是2021年4月6號(hào),那么間隔時(shí)間R=30天,即消費(fèi)者最后一次成交發(fā)生的時(shí)間距統(tǒng)計(jì)時(shí)間的間隔是30天。
F(Frequency) : 消費(fèi)頻率,指的是在統(tǒng)計(jì)時(shí)間段內(nèi),消費(fèi)者的消費(fèi)次數(shù)。
例如統(tǒng)計(jì)時(shí)間是2021年的1月到3月,消費(fèi)者在這期間一共消費(fèi)了5次,那么正常情況下F=5。
有人可能會(huì)問:如果這5次消費(fèi)行為中,有兩次消費(fèi)行為(兩筆訂單)發(fā)生在很短的時(shí)間內(nèi),例如10分鐘以內(nèi),那么F=5還是F=4更合理呢?
筆者認(rèn)為這需要根據(jù)公司的具體業(yè)務(wù)形態(tài)擬定。我們?cè)诙xF值的時(shí)候之所以會(huì)有這樣的顧慮是因?yàn)橥ǔG闆r下,我們把消費(fèi)者在很短時(shí)間內(nèi)多次下單的行為看做是一次消費(fèi)行為,消費(fèi)者拆單可能是為了湊滿減滿贈(zèng)等。
回到問題的本源:我們統(tǒng)計(jì)F這個(gè)指標(biāo)主要是為了衡量消費(fèi)者的活躍性,哪種方式更能夠代表行業(yè)特征或公司業(yè)務(wù)形態(tài)就采用哪種方式。當(dāng)然業(yè)務(wù)特殊(例如生鮮外賣)或是為了統(tǒng)計(jì)方便,也可以直接把F=消費(fèi)次數(shù),不考慮消費(fèi)時(shí)間間隔極短的情況。
M(Monetary): 消費(fèi)金額,指的是在統(tǒng)計(jì)時(shí)間段內(nèi),消費(fèi)者的累計(jì)消費(fèi)金額。
在其他條件相同的情況下,R/F/M值具備如下特征:
- R值越小,用戶價(jià)值越高,1年前在本店消費(fèi)過的用戶,價(jià)值肯定沒有1天前在本店消費(fèi)過的客戶價(jià)值高。
- F值越大,用戶越活躍且忠誠(chéng),也就是說經(jīng)常購(gòu)買的用戶肯定比偶爾購(gòu)買的用戶價(jià)值要高。
- M值越大,用戶價(jià)值越高。M值體現(xiàn)的是用戶的購(gòu)買力,購(gòu)買力越高的用戶價(jià)值自然也越大。
我們基于RFM三個(gè)值,可以構(gòu)建出一個(gè)三維的坐標(biāo)體系,把用戶分成8個(gè)層級(jí),如下圖所示:
用表格的形式展現(xiàn)更便于理解:
整理成這樣的形式就比較好理解了,我們把所有的用戶,從RFM三個(gè)維度切分成了8種不同的類型。
3. RFM模型的應(yīng)用場(chǎng)景
簡(jiǎn)單舉幾個(gè)例子來說明不同類型的用戶,運(yùn)營(yíng)策略的不同。
1)針對(duì)【重要價(jià)值客戶】
即RFM值均高的用戶,我們通常稱之為“至尊用戶”,也是整個(gè)品牌用戶群體中金字塔頂端的那一撥人,購(gòu)買頻率高,金額貢獻(xiàn)高,而且頻繁光顧店鋪。
針對(duì)這波用戶,運(yùn)營(yíng)的主要策略是:保持穩(wěn)定增長(zhǎng),“至尊用戶”的數(shù)量不要出現(xiàn)流失,并且能夠不斷從下層用戶中往上輸送新的“至尊用戶”。很多公司都會(huì)針對(duì)這波用戶出具一些特殊的權(quán)益,例如專屬服務(wù)或“專屬生日禮盒”等。
2)針對(duì)【重要挽留用戶】
即很久沒有進(jìn)行復(fù)購(gòu),但之前的購(gòu)物金額以及購(gòu)物頻率都很高的用戶,如果放任不管,這波用戶很可能隨著時(shí)間的流逝而流失。
運(yùn)營(yíng)的主要策略是復(fù)購(gòu),可通過發(fā)放專屬權(quán)益、針對(duì)性折扣、贈(zèng)品等一系列的定向優(yōu)惠形式使得這波用戶重新光臨店鋪,對(duì)比拉新的成本,重新讓這波用戶再次回購(gòu)的成本要低的多了。
3)針對(duì)【一般價(jià)值客戶】
即RF值高但是M值小的用戶,比較活躍但是成交金額比較低的用戶。一般這類用戶我們會(huì)稱之為活躍用戶,而且價(jià)格敏感型居多。
運(yùn)營(yíng)的主要策略是針對(duì)這波用戶提高他們的客單價(jià),可以通過定向搭配購(gòu)、加錢換購(gòu)等形式不斷提高該波用戶的客單價(jià),商品購(gòu)物籃推薦也是非常有用的。
這些運(yùn)營(yíng)策略僅供拋磚引玉,不同公司業(yè)務(wù)模式不同,因此在定義【用戶等級(jí)】以及主要的運(yùn)營(yíng)策略過程中,需要根據(jù)業(yè)務(wù)的實(shí)際情況進(jìn)行擬定,不可直接照搬。
三、如何構(gòu)建RFM模型?
“道理我懂了,關(guān)鍵是怎么落地呢?”作為一名運(yùn)營(yíng),尤其是公司有專業(yè)的數(shù)據(jù)分析團(tuán)隊(duì)以及CRM團(tuán)隊(duì)的運(yùn)營(yíng)來說,一般情況下,知道用戶分層定義的邏輯就可以了。
日常工作中,運(yùn)營(yíng)做的更多的是,知道本公司的用戶是如何分類的,每一種類型的定義是什么?針對(duì)不同的人群應(yīng)該出具何種運(yùn)營(yíng)策略,這些運(yùn)營(yíng)策略實(shí)施的效果如何?并且如何不斷優(yōu)化運(yùn)營(yíng)策略……更多的重心是放在數(shù)據(jù)的應(yīng)用上,對(duì)于模型的構(gòu)建以及算法的應(yīng)用,知道的不多。
而且通常情況下,一家公司的會(huì)員模型構(gòu)建完成后,在相當(dāng)長(zhǎng)的一段時(shí)間內(nèi)不會(huì)有任何的調(diào)整(除非業(yè)務(wù)模式發(fā)生變化)。
那么問題來了。
公司規(guī)模比較小或者項(xiàng)目初期,公司沒有CRM部門、沒有數(shù)據(jù)分析部門,很多工作需要運(yùn)營(yíng)去張羅的時(shí)候,如何能夠利用RFM模型對(duì)現(xiàn)有人群做分層管理呢?
不懂算法、不會(huì)Python、不會(huì)SQL、統(tǒng)計(jì)學(xué)也不太好的情況下,只是利用Excel,如何能夠把手頭上已有的用戶人群來進(jìn)行分層打標(biāo)簽?zāi)兀?/p>
這里和大家分享兩種只用EXCEL就可以計(jì)算的方法。
1. 數(shù)據(jù)源準(zhǔn)備
在開始之前我們需要準(zhǔn)備好分析用的源始數(shù)據(jù) 。
我們能夠方便獲得的是店鋪在一定時(shí)間內(nèi)的交易數(shù)據(jù),包含:用戶名、訂單編號(hào)、訂單金額、訂單時(shí)間等字段的數(shù)據(jù)。我們利用交易數(shù)據(jù)可以提取到我們需要的RFM數(shù)據(jù),利用簡(jiǎn)單的IF函數(shù)和數(shù)據(jù)透視表就可以實(shí)現(xiàn)了。
因?yàn)镋xcel表格太大拖不動(dòng)的緣故,我選擇了網(wǎng)站2018年-2020年,2年的交易數(shù)據(jù),對(duì)他們進(jìn)行處理后得到如下數(shù)據(jù):
對(duì)會(huì)員ID做了模糊化處理,一共得到19萬條的用戶數(shù)據(jù),分別知道每一個(gè)會(huì)員的RFM對(duì)應(yīng)的值是多少。
2. 數(shù)據(jù)計(jì)算方法
在我們知道每一名用戶對(duì)應(yīng)的R/F/M值以后,我們需要知道RFM三個(gè)數(shù)值分別是多少才算是高 or 低?
1)方法一:四分位數(shù)法
① 四分位數(shù)理論
四分位數(shù)是統(tǒng)計(jì)學(xué)分位數(shù)中的一種,把所有數(shù)值從低到高(或者從高到底)排列并分成四等份,處于三個(gè)分割點(diǎn)位置的數(shù)值就是四分位數(shù)。
一般表示為:
- Q1:樣本排列中處于25%位置的數(shù)字;
- Q2:又稱為中位數(shù),指的是樣本排列中處于50%位置,即中間位置的數(shù)據(jù);
- Q3:樣本排列中處于75%位置的數(shù)字。
假設(shè)樣本數(shù)據(jù)項(xiàng)數(shù)一共是N:
- 則Q1的位置數(shù)值=(N+1)/4;
- Q2的位置數(shù)值=(N+1)/2;
- Q3的位置數(shù)值=3(N+1)/4。
如果(N+1)恰好是4的倍數(shù),則確定四分位數(shù)比較簡(jiǎn)單,如果不是4的倍數(shù),相關(guān)位置的四分位數(shù)就應(yīng)該是相鄰兩個(gè)數(shù)值的標(biāo)志值的平均數(shù)。
權(quán)數(shù)的大小取決于兩個(gè)數(shù)值距離的遠(yuǎn)近,距離越近權(quán)數(shù)越大,距離越遠(yuǎn),權(quán)數(shù)越小,權(quán)數(shù)之和等于1。
例如一組樣本數(shù)據(jù)如下所示:
N=10,則Q1的位置=11/4=2.75(12和196兩個(gè)數(shù)值);Q2的位置=5.5;Q3的位置=8.25。
則有:
- Q1=0.25*第2項(xiàng)+0.75*第3項(xiàng)=0.25*12+0.75*196=150;
- Q2=0.5*第5項(xiàng)+0.5*第6項(xiàng)=0.5*204+0.5*211=207.5;
- Q3=0.75*第8項(xiàng)+0.25*第9項(xiàng)=0.75*234+0.25*261=240.75。
在對(duì)應(yīng)到RFM值的時(shí)候,我們可以定義為50%位置以下的數(shù)據(jù)值為【低】,即小于207.5的數(shù)值為低,50%位置以上的數(shù)據(jù)值為【高】,即大于207.5的數(shù)值為高。
也可以定義為75%位置以下的數(shù)據(jù)值為【低】,即小于240.75的數(shù)值為低,75%位置以上的數(shù)據(jù)值為【高】,即大于240.75的數(shù)值為高。
筆者的一般做法是:這兩種劃分位置都算一下,最后看結(jié)果,根據(jù)二八原則來確定選擇哪一種高低分類更合理。
② 四分位數(shù)的應(yīng)用
筆者直接按照“75%位置以下的數(shù)據(jù)值算低,75%以上的數(shù)據(jù)值算高”的方式來分別計(jì)算RFM三個(gè)數(shù)值的高低。
先算【R】值,因?yàn)镽值越小越好,所以R值我們這邊先按【倒序】排列,如此可得:
- N=1096,Q3的位置=3(N+1)/4=822.75;
- Q3=0.75*第822項(xiàng)+0.25*第823項(xiàng)=0.75*274+0.25*273=273.75。
所以,R值≥273.75的值定性為低,R值<273.75的值定性為高,即距離統(tǒng)計(jì)時(shí)間越短的用戶,價(jià)值越高。
計(jì)算【F】值:
- N=158,Q3的位置=3(N+1)/4=119.25;
- Q3=0.75*第119項(xiàng)+0.25*第120項(xiàng)=0.75*129+0.25*131=129.5。
所以,F(xiàn)值≥129.5的值定性為高,F(xiàn)值<129.5的值定性為低。
計(jì)算【M】值:
N=26387,Q3的位置=3(N+1)/4=19791,恰好是4的倍數(shù),故Q3=第19791項(xiàng)=2018。所以M值≥2018的值定性為高,M值<2018的值定性為低。
三個(gè)數(shù)值都計(jì)算好之后,整理如下:
如此,我們通過簡(jiǎn)單的IF函數(shù)就可以計(jì)算出每一名用戶R值的屬性了,如下圖所示:
按照相同的方式為F值和M值作出高低定義,結(jié)果如下:
然后我們根據(jù)如下表格,對(duì)所有的用戶進(jìn)行分層:
就可以得到各個(gè)用戶的標(biāo)簽了,如下圖所示:
2)方法二:評(píng)分法
評(píng)分法就是先將RFM的價(jià)值按照從低到高劃分為1-5分,然后對(duì)每一個(gè)RFM的值進(jìn)行打分,這樣每一個(gè)RFM值都在1-5分之間,然后分再分別算出RFM三個(gè)數(shù)值各自的平均值,高于平均值的定性為“高”,反之定性為“低”。
我們用同樣的一組數(shù)據(jù)來實(shí)操給大家看一下。
我們先給RFM三個(gè)數(shù)值進(jìn)行打分,結(jié)合業(yè)務(wù)的具體特點(diǎn),筆者做出如下定義:
有人會(huì)問了,我怎么知道小于90天的就是5分呢?
這里推薦三種方式:
- 經(jīng)驗(yàn)法,根據(jù)自己對(duì)業(yè)務(wù)所積累的經(jīng)驗(yàn)來進(jìn)行劃分,當(dāng)然也可以參考行業(yè)的常規(guī)定義;
- 將數(shù)據(jù)進(jìn)行5等分,分成5個(gè)區(qū)間塊,每一個(gè)區(qū)間范圍分別從高到低進(jìn)行打分;
- 有點(diǎn)復(fù)雜,舉例來說:要算F值的劃分,可以利用數(shù)據(jù)透視知道不同的購(gòu)買次數(shù)對(duì)應(yīng)的會(huì)員人數(shù)是多少?然后對(duì)購(gòu)買次數(shù)進(jìn)行分組,看會(huì)員數(shù)的占比情況,不斷調(diào)整分組步長(zhǎng)來進(jìn)行劃分。也就是說統(tǒng)計(jì)歷史數(shù)據(jù),看F值對(duì)應(yīng)的會(huì)員人數(shù)占比分別是多少(F=2的在歷史數(shù)據(jù)中的會(huì)員人數(shù)占比)?掌握F的數(shù)據(jù)分布情況后再進(jìn)行打分。
根據(jù)上表,我們對(duì)RFM三個(gè)數(shù)值分別進(jìn)行打分,同樣用的是IF公式,我們將會(huì)得到如下表格:
然后分別算出R值的平均值是1.78,F(xiàn)值的平均值是1.41,M值的平均值是1.96。
如果某一用戶的R值大于整列的平均值,則定性為“高”,如果低于平均值,則定性為“低”,如下圖所示:
之后的步驟就同方式一所介紹的一樣了,根據(jù)RFM值高低的不同,將所有的用戶分成8個(gè)類型即可。
這里介紹的兩種方法是只要通過EXCEL的形式就可以計(jì)算出來的,針對(duì)規(guī)模較小,或者是沒有數(shù)據(jù)分析部的公司。
而一般情況下,構(gòu)建RFM模型常用的是K-means聚類算法來進(jìn)行人群RFM值的定義與劃分,但是K-means對(duì)于運(yùn)營(yíng)人員來說有些吃力了,多是數(shù)據(jù)分析工程師具備的技能了。
還是那句老話,運(yùn)營(yíng)通常情況下,會(huì)用就可以了,當(dāng)然如果能知道這個(gè)模型的計(jì)算邏輯就更好了。
分享結(jié)束,歡迎交流~~~
本文由 @Trinity 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于 CC0 協(xié)議
你好,四分位計(jì)算那里不太懂,Q3=0.75*第822項(xiàng)+0.25*第823項(xiàng),為啥是0.75和0.25呢?
“看F值對(duì)應(yīng)的會(huì)員人數(shù)占比分別是多少(F=2的在歷史數(shù)據(jù)中的會(huì)員人數(shù)占比)?掌握F的數(shù)據(jù)分布情況后再進(jìn)行打分。” 這里能否再講講,知道了F的數(shù)據(jù)分布,在打分時(shí)應(yīng)該按照什么方法打分呢? 非常感謝(*^▽^*)!
供應(yīng)商關(guān)系管理 又有什么 用戶價(jià)值模型可以參考。有研究嘛
自己的工作沒有涉及到供應(yīng)商管理,所以完全沒有研究呢,抱歉~~
感謝lz,請(qǐng)教個(gè)問題:四分位數(shù)法里的rfm各自的樣本量n為啥不一樣呢?
我是去重來統(tǒng)計(jì)的,例如一組R值可能是:1,1,1,1,2,3,3,6,30,60這樣,然后我對(duì)于重復(fù)的數(shù)值是做了去重處理的,看的是每一個(gè)RFM去重之后的值的分布情況;因?yàn)槿绻蝗ブ氐脑?,劃分出來的區(qū)間數(shù)據(jù)會(huì)大量向重復(fù)數(shù)值傾斜,尤其是M值。不知道這樣文字表述是否能明白?
理解了!感謝lz分享,受益匪淺!