LTV預(yù)估與留存曲線擬合:指數(shù)函數(shù)還是冪函數(shù)?

青十五
2 評論 10107 瀏覽 30 收藏 11 分鐘
🔗 产品经理的核心价值是能够准确发现和满足用户需求,把用户需求转化为产品功能,并协调资源推动落地,创造商业价值

編輯導(dǎo)語:LTV,即用戶生命周期總價值,是運(yùn)營人員在業(yè)務(wù)過程中常接觸的指標(biāo),通過對LTV的預(yù)估,運(yùn)營人員可以為后續(xù)決策做好準(zhǔn)備。本篇文章里,作者便針對LTV預(yù)估、留存函數(shù)擬合等問題進(jìn)行了解讀,一起來看一下。

一、從LTV預(yù)估開始說起

LTV的預(yù)估,是許多業(yè)務(wù)UE模型和增長模型的起點(diǎn):

其中,用戶生命周期又可以用累加的留存率來計(jì)算:

不過,這里面使用的留存率卻未必是實(shí)際發(fā)生的歷史數(shù)據(jù)。

因?yàn)槲覀冏鰶Q策時往往等不了那么長的時間,所以我們一般使用的是根據(jù)前面一小段時間的數(shù)據(jù)擬合出來的留存函數(shù)R(t)。

那留存函數(shù)應(yīng)該怎樣擬合呢?

二、留存函數(shù)擬合

許多文章或資料會推薦這么一個方法:

  1. 把過去的次日、3日、7日、14日、30日等留存率記錄在Excel中,畫出來一個散點(diǎn)圖;
  2. 然后點(diǎn)擊圖上的數(shù)據(jù)點(diǎn),右鍵選擇“添加趨勢線”,這時右方就會出現(xiàn)可以擬合的曲線類型(指數(shù)、線性、對數(shù)、多項(xiàng)式、乘冪、移動平均);
  3. 打開顯示公式和R平方項(xiàng),在這些曲線類型和公式中,選擇R方最接近1的那個(一般是指數(shù)或乘冪),即為最終擬合得到的留存函數(shù)R(t)。

LTV預(yù)估與留存曲線擬合:指數(shù)函數(shù)還是冪函數(shù)?

番茄小說2021.05新用戶留存率,QuestMobile

選擇R方最接近1,意味著找到了擬合程度最高的函數(shù)作為留存函數(shù)R(t),接下來就可以回到LTV預(yù)估的主線去了。

不過這里有個小問題,卻似乎鮮有人討論過:為什么是指數(shù)或乘冪這兩個函數(shù)?如果擬合的結(jié)果是這兩個函數(shù)中的一個,意味著什么?它倆最核心的差異和聯(lián)系在哪?

三、兩個函數(shù)的差異

這兩個函數(shù)有什么差異呢?如果光從函數(shù)本身看,指數(shù)函數(shù)和冪函數(shù)的核心差異在于衰減的速度。指數(shù)函數(shù)的表達(dá)式為:

冪函數(shù)的表達(dá)式為:

根據(jù)表達(dá)式我們可以推導(dǎo)出,如果以3天為一個周期,對于指數(shù)函數(shù)來說,留存率每三天會以同樣的速度衰減:

而對于冪函數(shù)來說,留存率衰減的速度會逐漸放緩,下一個同比例衰減周期會拉長到6天,即上一個周期的兩倍:

我們總是希望留存率的衰減能夠慢一些,所以相比之下,擬合成冪函數(shù)是更希望看到的結(jié)果。

四、艾賓浩斯遺忘曲線

那這兩個函數(shù)有什么聯(lián)系呢?1885年,德國心理學(xué)家艾賓浩斯(H.Ebbinghaus)首次對人類的記憶進(jìn)行了定量研究,他用無意義的音節(jié)作為記憶的材料,通過記錄一段時間后被試人員對這些音節(jié)材料的記憶留存率,繪制出了這樣一個曲線:

LTV預(yù)估與留存曲線擬合:指數(shù)函數(shù)還是冪函數(shù)?

這個曲線也被稱為艾賓浩斯遺忘曲線(或記憶曲線),可以看到通過對這個曲線進(jìn)行擬合,得到的擬合度最高的是一個冪函數(shù)。

不過后續(xù)人們的研究表明,單一的遺忘曲線實(shí)際上應(yīng)該是更接近指數(shù)函數(shù)的,結(jié)合前面提到的指數(shù)函數(shù)的性質(zhì),說明人類會以一個固定的周期等概率地遺忘大腦中的信息,是一個很符合大自然規(guī)律的現(xiàn)象。

而艾賓浩斯之所以擬合得到了冪函數(shù),是由于最初的記憶實(shí)驗(yàn),混雜了不同難度的記憶材料,這種混雜改變了遺忘曲線的指數(shù)性質(zhì)。

下面的這個例子,可以解釋這一現(xiàn)象:

LTV預(yù)估與留存曲線擬合:指數(shù)函數(shù)還是冪函數(shù)?

圖中黃色和紫色曲線,分別代表兩種難度記憶材料的遺忘曲線,它們都是指數(shù)函數(shù)y=e^(-kt),其中k的大小不同,代表難度不同;

而黑色的散點(diǎn),則為兩個函數(shù)的平均值(或可泛化為線性組合),通過對這些散點(diǎn)進(jìn)行擬合,會發(fā)現(xiàn)一個有趣的事實(shí):

某些情況下,對兩個指數(shù)函數(shù)線性組合后的曲線,擬合度更高的(即R方更大的),卻不再是指數(shù)函數(shù)了,而是冪函數(shù)!

這個有意思的現(xiàn)象,各位有興趣的話,可以自行驗(yàn)證一下。

五、遺忘曲線與留存曲線

關(guān)于遺忘曲線的結(jié)論,對我們理解留存曲線有什么幫助嗎?

事實(shí)上我們早就發(fā)現(xiàn),這兩個曲線驚人地一致。

如果把拉新激活的動作視為最初始的記憶訓(xùn)練,那么在后續(xù)的時間里,如果沒有再次激活,用戶就會以一定的概率,自然而然地遺忘我們的App,表現(xiàn)就和遺忘曲線是一樣的。

為了讓用戶回到我們的App,提升用戶留存率,我們通過各種push召回它們,這也和關(guān)于記憶的研究中,定期復(fù)習(xí)的方法如出一轍。

同時,和混雜材料帶來的遺忘曲線類似,絕大多數(shù)功能豐富的成熟應(yīng)用,留存曲線都應(yīng)該是衰減程度更慢的冪函數(shù)。

事實(shí)上也確實(shí)如此,包括前面提到的番茄小說例子在內(nèi),我從QuestMobile驗(yàn)證了其他一些常見App,以及手頭有的一些內(nèi)部數(shù)據(jù),它們的留存曲線的確都是擬合成了冪函數(shù):

LTV預(yù)估與留存曲線擬合:指數(shù)函數(shù)還是冪函數(shù)?

番茄小說、知乎與陌陌2021.05新用戶留存數(shù)據(jù),QuestMobile

六、對數(shù)函數(shù)與其他LTV預(yù)估方法

最后再補(bǔ)充兩個點(diǎn)。

在前面的趨勢線擬合中,有一個對數(shù)函數(shù)可能會是迷惑選項(xiàng)。

對數(shù)函數(shù)的表達(dá)式是:

隨著t的增長,對數(shù)函數(shù)計(jì)算得到的結(jié)果很可能會小于0,而不是像指數(shù)函數(shù)和冪函數(shù)一樣始終保持大于0的結(jié)果。

小于0的留存率是沒有意義的,因此如果最優(yōu)擬合的結(jié)果是對數(shù)函數(shù),更可能的情況是巧合或者樣本量太小,對數(shù)函數(shù)在這個場景下本身沒有合理的物理意義。

不妨在指數(shù)函數(shù)或者冪函數(shù)中選擇一個,他們的擬合度離最優(yōu)擬合應(yīng)該差不了多少。

而對于最開始提到的LTV預(yù)估公式:

需要說明的是,這里面隱藏了一個假設(shè):ARPU值恒定不變,是個常數(shù)。

但在現(xiàn)實(shí)情況下,這樣的假設(shè)往往會帶來一些誤差,因?yàn)殡S著留存時間增加,這部分用戶的ARPU總是會隨之有所變化。

一種調(diào)整的方法是對ARPU同樣進(jìn)行預(yù)估,將公式改造為:

不過ARPU的變化規(guī)律可能很難找,或者壓根就沒有像留存曲線這樣簡單清晰的規(guī)律。

因此另一種調(diào)整方法是不做拆分,用更多樣本數(shù)據(jù)和特征數(shù)據(jù),整體地對用戶貢獻(xiàn)價值進(jìn)行函數(shù)擬合預(yù)估:

這樣的方法需要足夠多的樣本,本身也更適合需要精細(xì)化的運(yùn)營場景,這里就不再展開了。

參考資料:

[1] https://supermemo.guru/wiki/Exponential_nature_of_forgetting

[2] https://supermemo.guru/wiki/Forgetting_curve

 

作者:青十五;公眾號:青十五,新書《策略產(chǎn)品經(jīng)理:模型與方法論》作者

本文由 @青十五 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. mk

    回復(fù)
  2. 很有意思~

    來自上海 回復(fù)
专题
11672人已学习12篇文章
金融产品的流程与常见策略规则类型是从事相关行业人员需要了解的重要内容。本专题的文章分享了消费金融APP流程详解。
专题
12015人已学习12篇文章
数字化平台搭建,适用于企业已经有稳定的业务和资源,希望通过数字化平台做资源变现实现盈利,通过数字化平台将客户、交易、需求、场景全部数据化。本专题的文章分享了如何搭建数字化平台。
专题
52964人已学习18篇文章
做了好多年的产品经理,该不会连注册登录功能设计都没整明白吧?
专题
13202人已学习14篇文章
各种大模型和AI绘画的产品层出不穷,在各行业也在尝试进行应用。在这个阶段,AIGC能实现些什么?本专题的文章分享了AIGC的应用。
专题
12357人已学习16篇文章
栅格系统在页面排版布局、尺寸设定方面给了设计者直观的参考,它让页面设计变得有规律,从而减少了设计决策成本。本专题的文章分享了浅析栅格系统。