剖析數(shù)據(jù)的利器:Cohort Analysis組群分析
Cohort Analysis組群分析是一種能深入挖掘數(shù)據(jù)的分析方法,通過將數(shù)據(jù)進(jìn)行多維度的呈現(xiàn),暴露問題時點,聚焦分群,助力問題的有效定位。
一、留存率的背后隱藏著什么?
上圖為某公司近半年的留存率變化情況(數(shù)據(jù)為舉例),通過圖中我們發(fā)現(xiàn)留存率隨著時間逐漸減少,這是一個總體結(jié)果的呈現(xiàn),而當(dāng)我們想要了解更細(xì)節(jié)的信息,比如說:
- 當(dāng)出現(xiàn)異常下降點時,如何再細(xì)分拆解原因?
- 單個月份下的留存率是由什么部分構(gòu)成的?
- 單個月份下新增的用戶隨著時間的推移的流失情況?等等……
有什么辦法能讓我們深挖數(shù)據(jù)呢?同期組群分析可以解決。
二、使用Cohort Analysis組群分析剖析數(shù)據(jù)
Cohort Analysis同期組群分析,即針對不同分組的用戶在相同的時段內(nèi)的分析方法。通過以下步驟我們來看看如何運用組群分析剖析留存分析的問題。
1. 建立分析框架:分組+時間
- 橫軸是時間線,從聚焦觀察的起點開始統(tǒng)計1個月后,2個月后,3個月后等等以后的情況。為了便于從時間視角去觀察數(shù)據(jù),在表述的時候,我們轉(zhuǎn)化成具體時間段下的維度。例如轉(zhuǎn)化成1月、2月、3月……。
- 縱軸是組群,在留存率的例子下,我們劃分的組群以每月新增的用戶量為分組,即1月份增加的用戶,2月份增加的用戶,3月份增加的用戶…
2. 定義研究的主體變量,采集數(shù)據(jù)填充
在通過坐標(biāo)軸建立好分組標(biāo)準(zhǔn)和時間周期粒度后,我們需要確定研究的主體變量。在例子留存率分析中的主體研究對象是“每月下的新增用戶”,我們把它放在對應(yīng)分組的旁邊,代表的是當(dāng)前月份分組下對應(yīng)的“新增用戶”數(shù)值。
當(dāng)用戶群、時間、研究主體都確定后,我們可以進(jìn)行數(shù)據(jù)的采集及填充。隨著時間的推移,年初至7月份的數(shù)據(jù):
分別從橫軸及縱軸這二維的角度來展開剖析數(shù)據(jù):
1)橫向比較:時間的延展性
橫軸的視角是具體分組下隨著時間變化的情況,分組間體現(xiàn)了時間的延展性,你可以看到每個月新增的用戶留存隨著時間的推移的數(shù)量變化情況。觀察圖表我們可以發(fā)現(xiàn)的問題是:
- 留存情況是否合理?合理參考標(biāo)準(zhǔn)可以是:自己往期的平均水平、同行的平均水平、預(yù)期目標(biāo)等。
- 是否有某個月份數(shù)據(jù)異常?超出均值范圍內(nèi)的大的增長或減退,再結(jié)合具體時間節(jié)點前后發(fā)生的產(chǎn)品動作進(jìn)行排查。
2)縱向比較:聚焦時間段下的細(xì)分結(jié)構(gòu)
縱向的數(shù)據(jù),即具體月份下的數(shù)據(jù)是對每期分組的新增用戶進(jìn)行累加,各分群組成結(jié)構(gòu)清晰可見。
針對留存的分析,轉(zhuǎn)化成留存率的視角,觀察每月新增用戶、每月下各期組成分群的留存率變化趨勢,理想態(tài)是要提升的,說明數(shù)據(jù)的留存比之前更好,體現(xiàn)出公司不斷在產(chǎn)品功能上進(jìn)行優(yōu)化,使得留存率提升。如果發(fā)現(xiàn)背離理想態(tài)的狀況,再聚焦異常的節(jié)點進(jìn)行分析。
另外談一下增強數(shù)據(jù)的可讀性,可以通過對數(shù)值區(qū)間進(jìn)行顏色深淺的設(shè)置,或者將橫縱軸分別轉(zhuǎn)化成折線圖,使得對于數(shù)據(jù)的波動幅度得到更直觀的呈現(xiàn)。
三、靈活運用分組分析
上例留存率問題已經(jīng)簡要說明了組群分析的基本使用步驟,它達(dá)成了把問題拆解到時間維度呈現(xiàn)變化趨勢及組成結(jié)構(gòu)。那么Cohort Analysis組群分還能怎么靈活運用?它有沒有局限性呢?我們嘗試著抽象出它的幾類運用模式。首先,看下它的基礎(chǔ)框架是這樣:
1. 研究縱軸的分組對象:可以是時間、人、事/物
1)“時間”為縱軸的分組
它的特點為分組是對不同時期進(jìn)入的用戶,分別考察其后續(xù)行為的變化情況,這個特性決定了每期分組下存在持續(xù)新增用戶,此時的分析才有意義。
由于C端類產(chǎn)品用戶是獨立的個體,單獨使用,滿足這種情況;而B端類產(chǎn)品就不適用了,B端類產(chǎn)品的用戶往往是在系統(tǒng)上線時,大批量應(yīng)公司要求開始使用,后續(xù)零星的新員工繼續(xù)加入使用,在每期分組下不滿足有持續(xù)新增用戶。
再說說此類表格數(shù)據(jù)的呈現(xiàn)形式,由于是對不同時間批次的數(shù)據(jù)進(jìn)行收集,在表格數(shù)據(jù)呈現(xiàn)形式上是三角形。
2)“人(用戶群)”、“事/物”為縱軸的分組
- 人(用戶群)分組聚焦用戶群在時間下的發(fā)展差異,這種分類方式比較常用于驗證某項產(chǎn)品功能迭代的效果。比如:新上線的優(yōu)惠券功能對用戶留存的影響。
- “事/物”的分組比如研究渠道的獲客質(zhì)量,縱軸的分組是各渠道,收集的是各渠道在時間維度下獲客的留存情況。又或者是研究公司產(chǎn)品更命中大企業(yè)還是中小企業(yè)的痛點,縱軸的分組是大客戶定價方案,中小企業(yè)定價方案,收集的是各體量客戶定價方案下的成交單量。
它們在表格數(shù)據(jù)呈現(xiàn)形式上是整齊劃一,也是我們最常見的柱狀圖/曲線圖表格化的呈現(xiàn)。
2. 研究橫向時間軸的劃分方式
1)如何設(shè)定觀察時間的起點
a.留出對比時間段:若要突出某項功能上線前后對產(chǎn)品的影響和貢獻(xiàn),需要將觀察時間的起點提前設(shè)定,留出一定的時間好對比功能前后的變化。
b.結(jié)合用戶使用頻次特點:這里要說說C端和B端用戶的差異。C端產(chǎn)品服務(wù)于用戶個人,特點是主要用戶群體對于核心功能高頻的使用。B端用戶是企業(yè)內(nèi)部的用戶群,他們使用各自職能下需要的系統(tǒng)功能,并且個別使用還呈現(xiàn)出周期性的特點,比如:月度的工資計算、季度的物料盤點、周期性的物品采購等等。因此,在對于B端產(chǎn)品的觀察時,需要針對到具體角色使用的時段下研究才有意義。
2)設(shè)置時間間隔的考量
時間間隔的大小代表了多久分析一次,設(shè)置合理的時間間隔的大小,有助于降低時間中的噪音。
當(dāng)研究更聚焦宏觀周期時,時間段的間隔傾向設(shè)置得較大,比如按月或按年進(jìn)行分割;當(dāng)聚焦細(xì)節(jié)變化時,時間段的設(shè)計的間隔設(shè)置得相對較小,比如:按周、按天、按小時段等等。
3)事件記錄
記錄研究全時段內(nèi)的發(fā)生事件,便于在對時間節(jié)點進(jìn)行分析時有落腳點,成為相關(guān)性分析中的研究事件。
以上是搭建組群分析框架的思路,在組群分析方法搭建好之后,是對于數(shù)據(jù)的收集、觀察、異常問題的定位,枚舉可能性的原因,通過相關(guān)性分析聚焦具體的原因。
本文由@tomato 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!