一文搞懂?dāng)?shù)據(jù)異常問題該如何分析
編輯導(dǎo)讀:數(shù)據(jù)異常監(jiān)控分析不僅是數(shù)據(jù)分析面試中的高頻考題,同時(shí)也是業(yè)務(wù)分析中一項(xiàng)常態(tài)化的工作內(nèi)容。當(dāng)出現(xiàn)了數(shù)據(jù)異常波動(dòng)的情況,應(yīng)該如何進(jìn)行分析呢?本文作者對(duì)此發(fā)表了自己的看法,與你分享。
一、數(shù)據(jù)異常波動(dòng)的表現(xiàn)形式
數(shù)據(jù)異常監(jiān)控分析不僅是數(shù)據(jù)分析面試中的高頻考題,同時(shí)也是業(yè)務(wù)分析中一項(xiàng)常態(tài)化的工作內(nèi)容。當(dāng)我們面對(duì)市場(chǎng)、產(chǎn)品、運(yùn)營(yíng)等各種業(yè)務(wù)場(chǎng)景,經(jīng)常會(huì)發(fā)現(xiàn)很多異常數(shù)據(jù)的問題,比如:
- 某APP日活DAU相比昨日突然下降了10%,該如何分析?
- 某公司銷售收入環(huán)比上月下降了15%,該如何分析?
- 某產(chǎn)品客單價(jià)環(huán)比上月下降了20%,該如何分析?
- ……
上述各種業(yè)務(wù)場(chǎng)景,其實(shí)都是發(fā)現(xiàn)了數(shù)據(jù)有異常波動(dòng)的情況,那接下來問題來了,我們?cè)撊绾沃诌M(jìn)行分析呢?大部分人解決問題的思路,都是直奔主題找原因,上來就去找出現(xiàn)異常的原因、異常點(diǎn)在哪里。其實(shí)這種分析思路有一個(gè)最大的弊端就是不夠體系化,往往能夠找到一些原因,但是很可能是片面的,甚至可能還會(huì)踩雷。接下來就給大家分享一種比較實(shí)用的方法,我個(gè)人稱之為“點(diǎn) – 線 – 面”分析法。
二、數(shù)據(jù)異常分析的方法論
1. 點(diǎn)
首先排查數(shù)據(jù)準(zhǔn)確性,確定是否屬于數(shù)據(jù)錯(cuò)誤。容易出現(xiàn)數(shù)據(jù)錯(cuò)誤的環(huán)節(jié)有數(shù)據(jù)采集環(huán)節(jié)(埋點(diǎn))、數(shù)據(jù)提取環(huán)節(jié)、產(chǎn)品環(huán)節(jié)(BUG)、業(yè)務(wù)環(huán)節(jié)(數(shù)據(jù)口徑)等。如果沒有問題進(jìn)入下一步分析;
2. 線
拉長(zhǎng)時(shí)間周期,也就是進(jìn)行縱向分析,看是否屬于周期性波動(dòng),有些行業(yè)受季節(jié)或淡旺季影響較大,比如家電、飲料、在線教育等都受淡旺季影響較大。如果沒有問題進(jìn)入下一步分析;
3. 面
首先,綜合運(yùn)用公式拆解法、多維度拆解法等對(duì)大問題進(jìn)行拆解,拆解為一個(gè)個(gè)可著手分析的小問題;然后,通過計(jì)算影響系數(shù)初步定位到主要影響原因;最后,大膽假設(shè),小心驗(yàn)證,通過假設(shè)檢驗(yàn)法逐步排查到產(chǎn)生問題的根本原因。
比如,我們以銷售收入下降為例,通過“點(diǎn) – 線 – 面”分析中的“點(diǎn) – 線”分析確認(rèn)屬于數(shù)據(jù)異常后,接下來就可以在“面”的分析環(huán)節(jié)中采用“三部曲分析”法,主要流程如下:
1)運(yùn)用公式拆解法、多維度拆解法等對(duì)大問題進(jìn)行拆解
2)計(jì)算影響系數(shù),定位主要原因影響系數(shù)=( 細(xì)分項(xiàng)本月數(shù) -細(xì)分項(xiàng)上月數(shù) ) / ( 本月總量 – 上月總量 )
影響系數(shù)越大,說明該維度數(shù)據(jù)就是造成總體波動(dòng)的主要影響因素。
3)通過假設(shè)檢驗(yàn)法逐步排查根本原因
假設(shè)在計(jì)算影響系數(shù)后,初步確定主要是新用戶減少引起的收入下降,接下來就需要對(duì)新用戶數(shù)下降的原因進(jìn)行假設(shè),常見的假設(shè)維度有內(nèi)、外部維度,其中內(nèi)部維度主要有渠道側(cè)、產(chǎn)品側(cè)、運(yùn)營(yíng)側(cè)、技術(shù)側(cè)等等,然后通過數(shù)據(jù)逐一對(duì)上述假設(shè)進(jìn)行驗(yàn)證。
以上是幾種常見的拆分維度,通過初步拆分,定位原因大致范圍。
三、數(shù)據(jù)異常分析的案例實(shí)戰(zhàn)
某連鎖零售集團(tuán)最近兩年每月銷售收入保持穩(wěn)中有升的趨勢(shì),但是在2021年6月銷售收入突然下降了17%(下圖),這時(shí)銷售負(fù)責(zé)人非常著急,讓你盡快排查一下銷售下跌的原因。面對(duì)收入下降這種棘手的問題,如果對(duì)于沒有經(jīng)驗(yàn)的同學(xué),確實(shí)還是比較頭疼的,就像那燙手的山芋,無從下手。
接下來,我們就按照按照上面的套路來演練一下。
1. 點(diǎn)
首先排查數(shù)據(jù)準(zhǔn)確性,確定不屬于數(shù)據(jù)錯(cuò)誤;
2. 線
拉長(zhǎng)時(shí)間周期,不屬于季節(jié)波動(dòng);
3. 面
1)首先把總收入拆分成新、老用戶收入
如下圖:
通過觀察數(shù)據(jù),發(fā)現(xiàn)新、老用戶收入均有不同程度下滑,于是啟動(dòng)第二步,分別計(jì)算其影響系數(shù)。
2)計(jì)算新、老用戶收入影響系數(shù)
新用戶收入影響系數(shù) =(33 – 47) /(100- 120) =0.7
老用戶收入影響系數(shù) =(67 – 73)/(100- 120) =0.3
新用戶收入影響系數(shù)0.7,說明總收入下降主要影響因素是新用戶收入下降,明確問題的范圍后接著進(jìn)行細(xì)分,新用戶收入的構(gòu)成是什么?
新用戶收入 = 新用戶數(shù)量*轉(zhuǎn)化率* 客單價(jià)
通過調(diào)取數(shù)據(jù)分析發(fā)現(xiàn),新用戶轉(zhuǎn)化率和客單價(jià)都保持穩(wěn)定,那么問題就出在了新用戶數(shù)量這個(gè)指標(biāo)上,那新用戶又是由什么構(gòu)成呢?
新用戶 = 渠道 1 + 渠道 2 + 渠道 3 + …… + 渠道 n
于是我們把新用戶按照其渠道來源進(jìn)行拆分:
通過對(duì)新用戶渠道來源進(jìn)行拆分,我們發(fā)現(xiàn)渠道1在2021年6月新用戶數(shù)量下降非常嚴(yán)重,于是我們就定位到收入下滑的根本原因在于渠道1新用戶數(shù)量下滑嚴(yán)重。接下來我們就可以啟動(dòng)第三步,對(duì)渠道1新用戶數(shù)量下滑原因進(jìn)行假設(shè)檢驗(yàn)。
3)對(duì)渠道新用戶數(shù)下滑原因進(jìn)行假設(shè)檢驗(yàn)
渠道流量下降可能的原因可以從兩個(gè)大的維度進(jìn)行考慮:對(duì)于外部維度,可以考慮外部環(huán)境變動(dòng)、競(jìng)品變化等;對(duì)于內(nèi)部維度,可能的原因有渠道線索問題、投放策略變化等。這個(gè)時(shí)候一方面要調(diào)取數(shù)據(jù)進(jìn)行分析驗(yàn)證,另一方面需要聯(lián)系渠道1的負(fù)責(zé)人一起定位具體原因,找到具體原因后,再對(duì)癥下藥。
本案例純屬虛構(gòu),如有雷同,純屬巧合。當(dāng)然,實(shí)際的業(yè)務(wù)要比這復(fù)雜的多,需要考慮的因素也很多,花費(fèi)的時(shí)間也會(huì)更長(zhǎng)。但是,解決問題的方法論和流程是可復(fù)用的。相信大家以后再面對(duì)類似問題的時(shí)候,會(huì)有一個(gè)清晰的分析思路和明確的入手點(diǎn)。
最后,我們?nèi)绻麑?duì)上面的“點(diǎn) – 線 – 面”分析法進(jìn)行總結(jié)歸納的話,可以提煉為下面這張圖:
希望這一篇能夠?qū)Υ蠹覝?zhǔn)備面試和實(shí)際工作有切實(shí)的幫助,如果同學(xué)覺得有幫助,歡迎點(diǎn)贊、轉(zhuǎn)發(fā)??!大家如果有其他想法,歡迎加入我一起討論交流。
本文由 @知了數(shù)據(jù)分析 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
微信公眾號(hào):知了數(shù)據(jù)分析
本文由 @知了數(shù)據(jù)分析 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
關(guān)注【知了數(shù)據(jù)分析】,獲取更多數(shù)據(jù)分析干貨!