別再同環(huán)比,這五步讓數(shù)據(jù)分析更深入
在數(shù)據(jù)分析的迷宮中,我們常常追求的不僅是答案,更是答案背后深層次的邏輯與洞察。《別再同環(huán)比,這五步讓數(shù)據(jù)分析更深入》這篇文章,就是那把解鎖復雜數(shù)據(jù)難題的鑰匙。作者陳老師,一位資深的數(shù)據(jù)專家,將帶領(lǐng)我們穿越數(shù)據(jù)的表層,深入到分析的核心。從簡單的數(shù)據(jù)提取到復雜的因果探究,每一步都是對分析能力的錘煉。
很多同學總覺數(shù)據(jù)分析做得不深入,到底該怎么做?今天結(jié)合一個具體的例子,分享下如何做一個深入的數(shù)據(jù)分析項目。
深入級別:0級
某天,你收到一個需求:“看下我司APP新增的A功能,過去5天內(nèi)累計使用1+次的人有多少(去重)”。這問題太簡單了,直接跑個數(shù)丟過去即可,“過去5天累計使用人數(shù)10000人”搞掂。
但是這種分析完全不深入,甚至壓根不能叫“分析”,這就是提個數(shù)而已。確實,當需求是很具體的取數(shù)指標+統(tǒng)計時間的時候,這就是取個數(shù),第0級深入就是如此。
深入級別:1級
某天,你又收到一個需求:“看下我司APP新增的A功能,過去5天有多少人在用”。
聽起來和之前的問題差不多,但注意,“多少人”并不是一個明確的指標,只是個籠統(tǒng)的說法,細分起來,有:
1.5天內(nèi)累計使用1+次的人(去重)
2.5天內(nèi)累計有多少人次使用(不去重)
3.5天內(nèi),每天有多少人在使用
4.5天內(nèi),累計使用5、4、3、2、1天的人有多少
5.5天內(nèi),各使用頻次人數(shù)(1、2、3……10、10+次)
……
好幾個指標拼起來,才能把這個多少人說明白。有些同學會覺得,這么搞是不是太麻煩了。我就默認他是看不去重的人次唄。實際上,工作中相當多的重復取數(shù),加班加點,被業(yè)務追著屁股催數(shù),就是從“沒確認清楚需求,自己默認一個業(yè)務不想要的指標”開始的。特別是你問業(yè)務:想看哪個口徑。業(yè)務會說:都看。這時候最好自己先提前想多幾個,避免重復返工。
這種主動思考,才是深入分析的起點。因為這幾個指標對業(yè)務都有用:
1. 看去重的人數(shù),可以評估總用戶滲透了多少
2. 看每天人次,可以看出發(fā)展趨勢
3. 看各類型累計使用天數(shù),可以判斷有多少重度用戶
4. 看各類型累計使用天數(shù),可以判斷有多少重度用戶
而且,我們發(fā)現(xiàn),第0級的成果,成為第1級產(chǎn)出的一部分。后續(xù)也是一樣,越深入,設計的指標、維度越多,問題會越復雜。
深入級別:2級
某天,你又收到一個需求:“看下我司APP新增的A功能,過去5天使用的人,付費行為是不是比其他人更好”。
注意,這里也沒有明確的數(shù)據(jù)指標,因此得先拆解問題:
1、主語是:過去5天使用過A功能的用戶。那得先知道有多少人在用?第1級深入的數(shù)據(jù),這里都需要加上。
2、付費行為:付費行為是個籠統(tǒng)說法。是付費金額,還是頻次?沒說清就先都拎出來看。
3、比其他人更好:什么是其他人?是全體用戶,還是未使用該功能用戶。從問題場景上看,應該區(qū)分出過去5天內(nèi)未使用過該功能,并且至少活躍1次的用戶,這樣才有可比性。
有了這三步拆解??梢园堰@句不清晰的需求,落地成一個取數(shù)需求:
1. 過去5天內(nèi)使用過A功能用戶基本情況(人數(shù),使用天數(shù)分布,使用頻次分布)
2. 過去5天內(nèi)使用過A功能用戶付費行為(多大比例,付費人群的5天內(nèi)累計付費金額,5天內(nèi)付費頻次,人均付費金額,人均付費次數(shù))
3. 過去5天內(nèi)未未使用過A功能,且活躍的用戶的活躍天數(shù)、付費比例,付費金額,付費頻次,人均付費金額,人均付費次數(shù))
這樣,兩個群體一對比,就能出結(jié)論了。然而這么做,很快會引發(fā)下一個問題:“為什么使用A的人群比其他群體高/低?”
深入級別:3級
某天,你又收到一個需求:“分析下為啥使用A功能的人付費更好?”注意,先問是不是,再問為什么,是回答問題的基本要求。因此在拆解問題的時候,得先把深入2級功課都做完。做實了“A的付費更好”以后再分析原因。
分析原因的時候,假設很重要。需求既然關(guān)注A功能,那A功能到底有沒有用就是關(guān)鍵。在分析原因的時候,證偽比證真更容易,所以我們可以先剔除一些明顯的錯誤答案,比如“A功能用戶本身都是高付費群體”,這一下就能把“A功能對付費轉(zhuǎn)化有用”直接干掉。
但這樣,邏輯上還是站不住,因為:
1. 本身消費高,但是用了A功能以后消費更高了
2. 本身消費高,但是比不用A的人更高
3. 消費低的人,用了A也有提高
4. 消費低的人,不用A只會更低
……
即使看到數(shù)據(jù):A群體消費天然比不用的高,還是有至少這4種可能性要排除。所以得列清楚假設邏輯樹,逐一排查可能性。這也是我們說的:驗證觀點,需要同時找正反兩面的例子。
注意,即使這樣,還是有反駁觀點。因為我們都是基于過去數(shù)據(jù)分析,很有可能一個反駁觀點是:“A功能只能吸引到這一小簇用戶,不能做大”或者“A用戶只是嘗新,過了這段時間就沒有效果了”這兩個觀點,都涉及未來數(shù)據(jù)情況,因此需要觀察一段時間才能有結(jié)論。
如果我們等不了那么久,還可以做測試,比如測試:“做不大”這個點,可以主動向其他群體推廣A功能,觀察A功能增量以及留存效果,如果增量少,或者有增量但是留存差,那就可以推論:確實做不大。想要做深入分析,測試與長期觀察是不可少的,好結(jié)論需要時間沉淀。
深入級別:4級
某天,你又收到一個需求:“分析下A功能對用戶有啥影響?”看起來問題表達更簡單了,可要解這個問題卻更復雜了。因為從0級到3級,我們只討論了“付費”這一個影響,實際上還有可能有更多影響,比如活躍、留存、轉(zhuǎn)介紹等等。每個方向都得經(jīng)歷這么漫長的拆分、分析,才能得出綜合結(jié)果。
到這里,我們的分析已經(jīng)非常有深度了。有趣的是,我們的問題,反而非常簡單。實際上,如果一個問題:
1. 有清晰的衡量指標
2. 有明確的判斷指標好壞的標準
3. 有明顯的指標間影響邏輯
4. 基于封閉的業(yè)務場景,容易測試
那這個問題就是很容易解決的。
可現(xiàn)實中的問題,常常是:
1. 口語化表達的
2. 包含了多個方面的
3. 沒有清晰判斷標準的
4. 雜糅了很多影響因素
5. 沒有時間、場地給我們慢悠悠測試
這時候就能從頭開始,一點點梳理。把本篇文章的順序倒出來,就是從0開始梳理業(yè)務問題的場景。
當然,并不是所有的分析都需要這樣從頭到尾過一遍。
有可能提問人自己完全沒概念,此時可以先給到1級深度數(shù)據(jù),讓他建立認知,再給2級深度的數(shù)據(jù),引導他關(guān)注差異。
有可能提問人嘴上說得含糊,但心里有明確的目標,這時候可以進行深入溝通,清晰需求。
有可能提問的人不需要嚴密的論證,有部分證據(jù)即打算直接下結(jié)論,這時論證其最疑惑的點即可
這時候唯一不要干的,就是不溝通,自己拍腦袋隨便仍幾個數(shù),或者到網(wǎng)上找所謂“模型”生搬硬套。這樣閉門造車,返工、加班、被diss都是經(jīng)常的事。
如果在某個業(yè)務場景下,我們已經(jīng)做了很多次驗證,論證了業(yè)務問題的關(guān)鍵指標+判斷標準+因果關(guān)系,這時候就可以直接套用,這就是我們說的:業(yè)務分析模型。不過在沉淀出來之前,還是得多做論證的,特別是因果關(guān)系論證,做的不夠細致,分分鐘被打臉。
有同學還會問:老師,我的領(lǐng)導經(jīng)常不提問題,讓我自己從數(shù)據(jù)里發(fā)現(xiàn)點啥,該咋辦?這是數(shù)據(jù)分析中典型的:無提問場景。我們以后分享。
本文由人人都是產(chǎn)品經(jīng)理作者【接地氣的陳老師】,微信公眾號:【接地氣的陳老師】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!