剖析數(shù)據(jù)的利器:Cohort Analysis組群分析

tomato
0 評(píng)論 2262 瀏覽 6 收藏 11 分鐘
🔗 产品经理的不可取代的价值是能够准确发现和满足用户需求,把需求转化为产品,并协调资源推动产品落地,创造商业价值。

Cohort Analysis組群分析是一種能深入挖掘數(shù)據(jù)的分析方法,通過(guò)將數(shù)據(jù)進(jìn)行多維度的呈現(xiàn),暴露問(wèn)題時(shí)點(diǎn),聚焦分群,助力問(wèn)題的有效定位。

一、留存率的背后隱藏著什么?

上圖為某公司近半年的留存率變化情況(數(shù)據(jù)為舉例),通過(guò)圖中我們發(fā)現(xiàn)留存率隨著時(shí)間逐漸減少,這是一個(gè)總體結(jié)果的呈現(xiàn),而當(dāng)我們想要了解更細(xì)節(jié)的信息,比如說(shuō):

  • 當(dāng)出現(xiàn)異常下降點(diǎn)時(shí),如何再細(xì)分拆解原因?
  • 單個(gè)月份下的留存率是由什么部分構(gòu)成的?
  • 單個(gè)月份下新增的用戶隨著時(shí)間的推移的流失情況?等等……

有什么辦法能讓我們深挖數(shù)據(jù)呢?同期組群分析可以解決。

二、使用Cohort Analysis組群分析剖析數(shù)據(jù)

Cohort Analysis同期組群分析,即針對(duì)不同分組的用戶在相同的時(shí)段內(nèi)的分析方法。通過(guò)以下步驟我們來(lái)看看如何運(yùn)用組群分析剖析留存分析的問(wèn)題。

1. 建立分析框架:分組+時(shí)間

  • 橫軸是時(shí)間線,從聚焦觀察的起點(diǎn)開(kāi)始統(tǒng)計(jì)1個(gè)月后,2個(gè)月后,3個(gè)月后等等以后的情況。為了便于從時(shí)間視角去觀察數(shù)據(jù),在表述的時(shí)候,我們轉(zhuǎn)化成具體時(shí)間段下的維度。例如轉(zhuǎn)化成1月、2月、3月……。
  • 縱軸是組群,在留存率的例子下,我們劃分的組群以每月新增的用戶量為分組,即1月份增加的用戶,2月份增加的用戶,3月份增加的用戶…

2. 定義研究的主體變量,采集數(shù)據(jù)填充

在通過(guò)坐標(biāo)軸建立好分組標(biāo)準(zhǔn)和時(shí)間周期粒度后,我們需要確定研究的主體變量。在例子留存率分析中的主體研究對(duì)象是“每月下的新增用戶”,我們把它放在對(duì)應(yīng)分組的旁邊,代表的是當(dāng)前月份分組下對(duì)應(yīng)的“新增用戶”數(shù)值。

當(dāng)用戶群、時(shí)間、研究主體都確定后,我們可以進(jìn)行數(shù)據(jù)的采集及填充。隨著時(shí)間的推移,年初至7月份的數(shù)據(jù):

分別從橫軸及縱軸這二維的角度來(lái)展開(kāi)剖析數(shù)據(jù):

1)橫向比較:時(shí)間的延展性

橫軸的視角是具體分組下隨著時(shí)間變化的情況,分組間體現(xiàn)了時(shí)間的延展性,你可以看到每個(gè)月新增的用戶留存隨著時(shí)間的推移的數(shù)量變化情況。觀察圖表我們可以發(fā)現(xiàn)的問(wèn)題是:

  • 留存情況是否合理?合理參考標(biāo)準(zhǔn)可以是:自己往期的平均水平、同行的平均水平、預(yù)期目標(biāo)等。
  • 是否有某個(gè)月份數(shù)據(jù)異常?超出均值范圍內(nèi)的大的增長(zhǎng)或減退,再結(jié)合具體時(shí)間節(jié)點(diǎn)前后發(fā)生的產(chǎn)品動(dòng)作進(jìn)行排查。

2)縱向比較:聚焦時(shí)間段下的細(xì)分結(jié)構(gòu)

縱向的數(shù)據(jù),即具體月份下的數(shù)據(jù)是對(duì)每期分組的新增用戶進(jìn)行累加,各分群組成結(jié)構(gòu)清晰可見(jiàn)。

針對(duì)留存的分析,轉(zhuǎn)化成留存率的視角,觀察每月新增用戶、每月下各期組成分群的留存率變化趨勢(shì),理想態(tài)是要提升的,說(shuō)明數(shù)據(jù)的留存比之前更好,體現(xiàn)出公司不斷在產(chǎn)品功能上進(jìn)行優(yōu)化,使得留存率提升。如果發(fā)現(xiàn)背離理想態(tài)的狀況,再聚焦異常的節(jié)點(diǎn)進(jìn)行分析。

另外談一下增強(qiáng)數(shù)據(jù)的可讀性,可以通過(guò)對(duì)數(shù)值區(qū)間進(jìn)行顏色深淺的設(shè)置,或者將橫縱軸分別轉(zhuǎn)化成折線圖,使得對(duì)于數(shù)據(jù)的波動(dòng)幅度得到更直觀的呈現(xiàn)。

三、靈活運(yùn)用分組分析

上例留存率問(wèn)題已經(jīng)簡(jiǎn)要說(shuō)明了組群分析的基本使用步驟,它達(dá)成了把問(wèn)題拆解到時(shí)間維度呈現(xiàn)變化趨勢(shì)及組成結(jié)構(gòu)。那么Cohort Analysis組群分還能怎么靈活運(yùn)用?它有沒(méi)有局限性呢?我們嘗試著抽象出它的幾類(lèi)運(yùn)用模式。首先,看下它的基礎(chǔ)框架是這樣:

1. 研究縱軸的分組對(duì)象:可以是時(shí)間、人、事/物

1)“時(shí)間”為縱軸的分組

它的特點(diǎn)為分組是對(duì)不同時(shí)期進(jìn)入的用戶,分別考察其后續(xù)行為的變化情況,這個(gè)特性決定了每期分組下存在持續(xù)新增用戶,此時(shí)的分析才有意義。

由于C端類(lèi)產(chǎn)品用戶是獨(dú)立的個(gè)體,單獨(dú)使用,滿足這種情況;而B(niǎo)端類(lèi)產(chǎn)品就不適用了,B端類(lèi)產(chǎn)品的用戶往往是在系統(tǒng)上線時(shí),大批量應(yīng)公司要求開(kāi)始使用,后續(xù)零星的新員工繼續(xù)加入使用,在每期分組下不滿足有持續(xù)新增用戶。

再說(shuō)說(shuō)此類(lèi)表格數(shù)據(jù)的呈現(xiàn)形式,由于是對(duì)不同時(shí)間批次的數(shù)據(jù)進(jìn)行收集,在表格數(shù)據(jù)呈現(xiàn)形式上是三角形。

2)“人(用戶群)”、“事/物”為縱軸的分組

  • 人(用戶群)分組聚焦用戶群在時(shí)間下的發(fā)展差異,這種分類(lèi)方式比較常用于驗(yàn)證某項(xiàng)產(chǎn)品功能迭代的效果。比如:新上線的優(yōu)惠券功能對(duì)用戶留存的影響。
  • “事/物”的分組比如研究渠道的獲客質(zhì)量,縱軸的分組是各渠道,收集的是各渠道在時(shí)間維度下獲客的留存情況。又或者是研究公司產(chǎn)品更命中大企業(yè)還是中小企業(yè)的痛點(diǎn),縱軸的分組是大客戶定價(jià)方案,中小企業(yè)定價(jià)方案,收集的是各體量客戶定價(jià)方案下的成交單量。

它們?cè)诒砀駭?shù)據(jù)呈現(xiàn)形式上是整齊劃一,也是我們最常見(jiàn)的柱狀圖/曲線圖表格化的呈現(xiàn)。

2. 研究橫向時(shí)間軸的劃分方式

1)如何設(shè)定觀察時(shí)間的起點(diǎn)

a.留出對(duì)比時(shí)間段:若要突出某項(xiàng)功能上線前后對(duì)產(chǎn)品的影響和貢獻(xiàn),需要將觀察時(shí)間的起點(diǎn)提前設(shè)定,留出一定的時(shí)間好對(duì)比功能前后的變化。

b.結(jié)合用戶使用頻次特點(diǎn):這里要說(shuō)說(shuō)C端和B端用戶的差異。C端產(chǎn)品服務(wù)于用戶個(gè)人,特點(diǎn)是主要用戶群體對(duì)于核心功能高頻的使用。B端用戶是企業(yè)內(nèi)部的用戶群,他們使用各自職能下需要的系統(tǒng)功能,并且個(gè)別使用還呈現(xiàn)出周期性的特點(diǎn),比如:月度的工資計(jì)算、季度的物料盤(pán)點(diǎn)、周期性的物品采購(gòu)等等。因此,在對(duì)于B端產(chǎn)品的觀察時(shí),需要針對(duì)到具體角色使用的時(shí)段下研究才有意義。

2)設(shè)置時(shí)間間隔的考量

時(shí)間間隔的大小代表了多久分析一次,設(shè)置合理的時(shí)間間隔的大小,有助于降低時(shí)間中的噪音。

當(dāng)研究更聚焦宏觀周期時(shí),時(shí)間段的間隔傾向設(shè)置得較大,比如按月或按年進(jìn)行分割;當(dāng)聚焦細(xì)節(jié)變化時(shí),時(shí)間段的設(shè)計(jì)的間隔設(shè)置得相對(duì)較小,比如:按周、按天、按小時(shí)段等等。

3)事件記錄

記錄研究全時(shí)段內(nèi)的發(fā)生事件,便于在對(duì)時(shí)間節(jié)點(diǎn)進(jìn)行分析時(shí)有落腳點(diǎn),成為相關(guān)性分析中的研究事件。

以上是搭建組群分析框架的思路,在組群分析方法搭建好之后,是對(duì)于數(shù)據(jù)的收集、觀察、異常問(wèn)題的定位,枚舉可能性的原因,通過(guò)相關(guān)性分析聚焦具體的原因。

本文由@tomato 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!
专题
16062人已学习12篇文章
本专题的文章分享了支付风控系统的设计指南
专题
14900人已学习12篇文章
自传播是基于一个事件、一个产品或者营销活动自身的吸引力,激发人们自愿转发分享。本专题的文章分享了如何让产品具有自传播性。
专题
17898人已学习15篇文章
本专题的文章分享了Android和iOS在产品、设计、交互等方面的差异。
专题
69250人已学习26篇文章
学会数据化运营能够提升效率,让你的工作事半功倍。
专题
12583人已学习12篇文章
产品定位是一个产品面向市场前先要考虑清楚的问题,也是产品人和运营人的必备技能。什么产品为谁解决什么问题,产品的主要卖点或独特性是什么?本专题的文章分享了如何做产品定位。
专题
13863人已学习12篇文章
本专题的文章主要以跨境电商为例,对其OMS系统进行分析。