五步拆解:如何做一個優(yōu)秀的數(shù)據(jù)分析項目
在數(shù)據(jù)分析領(lǐng)域,如何設(shè)計并執(zhí)行一個優(yōu)秀的數(shù)據(jù)分析項目是許多專業(yè)人士關(guān)心的問題。本文通過五個具體的測試題,幫助讀者評估自己完成優(yōu)秀數(shù)據(jù)分析項目的能力,并提供了關(guān)鍵的思路和方法。
在知識星球里,很多同學(xué)問:“如何做出優(yōu)秀的數(shù)據(jù)分析項目?不然簡歷和年終總結(jié)都不知道咋寫”。我都做了詳盡的回答和跟進,今天總結(jié)分享一下大家提到的共性問題。
想做好數(shù)據(jù)分析類項目,主要靠的是:樹立正確的觀念。這里有5道測試題,一起來測一測自己有多大可能做出好項目。題目一(單選題)
數(shù)據(jù)分析項目好壞的衡量指標(biāo)是:
A、時間、成本、質(zhì)量
B、算法難度、統(tǒng)計學(xué)知識、數(shù)學(xué)公式
這個題目是最重要的觀念,直接決定了一個數(shù)據(jù)分析師在當(dāng)前公司混得好還是壞。數(shù)據(jù)分析工作有它的特殊性:
★ 它不同于銷售,不能直接為公司創(chuàng)收。
★ 它不同于運營,不能直接拉升活躍留存付費指標(biāo)。
★ 它不同于交易/網(wǎng)站/ERP系統(tǒng)的開發(fā),這些系統(tǒng)是業(yè)務(wù)必需的支撐。
★ 它不同于DBA,沒有DBA的公司不存在,沒有專職分析師的公司大把。
數(shù)據(jù)分析工作本質(zhì)上是一個可替代程度很高的輔助崗位。在數(shù)據(jù)分析觀念普及前,很多公司都是找個會寫sql的程序員來頂這個崗位的。就像瞄準(zhǔn)鏡與槍的關(guān)系,沒有瞄準(zhǔn)鏡槍照打,有了瞄準(zhǔn)鏡,槍可以打得更準(zhǔn)。
因此,雖然數(shù)據(jù)分析背后有算法、統(tǒng)計學(xué)、數(shù)據(jù)做支撐,可企業(yè)care的不是這些書本章節(jié),而是到底對業(yè)務(wù)有什么用?有多大用?同企業(yè)里其他項目一樣,數(shù)據(jù)分析項目最重要的就是考察時間、成本、質(zhì)量。
如果脫離了這些,空洞地追求“我用的方法好復(fù)雜,我好厲害”。那還是回學(xué)校里做科研好了,科研才需要追求高精尖,企業(yè)里追求的是:在達成目標(biāo)的情況下,成本越低越好,時間越短越好。所以這個題一定選A。
很多剛畢業(yè)的、轉(zhuǎn)行的、新加入的數(shù)據(jù)分析師喜歡選B,選B也不代表沒前途。
因為選B的同學(xué)會花很大精力死磕書本,這樣雖然在一個公司混不起來,但是在跳槽的時候過面試的能力還是可以的,所以也能通過一年一跳槽來漲薪。但是想在一個公司做出成績,還是選A的好。
這個題目最關(guān)鍵,明白了這個題目,后邊的問題就迎刃而解了。題目二(排序題)
以下人員,對數(shù)據(jù)分析項目質(zhì)量的話語權(quán)為:
A、業(yè)務(wù)部門領(lǐng)導(dǎo)
B、數(shù)據(jù)部門領(lǐng)導(dǎo)
C、業(yè)務(wù)部門員工
D、數(shù)據(jù)部門員工(本人)
如果問題一吃透了,這個題毫無難度,答案是A≥B≥C≥≥D。領(lǐng)導(dǎo)意見大于員工意見,如果業(yè)務(wù)部門領(lǐng)導(dǎo)首肯,數(shù)據(jù)部門領(lǐng)導(dǎo)就直接應(yīng)聲附和了。如果業(yè)務(wù)部門領(lǐng)導(dǎo)不發(fā)聲,那就看數(shù)據(jù)部門領(lǐng)導(dǎo)是不是認可。本人的“覺得我做得很牛逼”,毫無意義,切記切記。
請注意,有時會有業(yè)務(wù)領(lǐng)導(dǎo)和數(shù)據(jù)領(lǐng)導(dǎo)態(tài)度不一致的情況,這時候以自己直接領(lǐng)導(dǎo)的態(tài)度為準(zhǔn),外部門稍后考慮。在大部分企業(yè),直接領(lǐng)導(dǎo)是決定自己績效評分的那個,所以一定不能得罪。題目三(排序題)
請對以下五種項目成果,按質(zhì)量高低排序:
A、可視化的數(shù)據(jù)產(chǎn)品
B、每月定期輸出的數(shù)據(jù)模型
C、部門級以上會議的匯報ppt
D、無群體匯報的ppt
E、Excel數(shù)據(jù)表
F、無固定格式的數(shù)字
G、寫sql跑完數(shù)口頭告訴業(yè)務(wù)
這個題完全解釋需要一整篇文章,但同學(xué)們可以用望文生義的辦法,直接作出回答,答案是:A=B≥C≥D=E≥F≥≥G。
數(shù)據(jù)分析的成果很容易被人當(dāng)夜壺:用得時候很爽,用完了就忘了。平時還嫌你臟:你看我不就是要個數(shù)字嗎!還要跑那么久!
所以做數(shù)據(jù)分析項目,要爭取輸出定期使用的、產(chǎn)品化的、大家必須看的成果。最好的就是上一套BI,或者業(yè)務(wù)的用戶跟進名單用模型進行優(yōu)化排序,讓大家不得不用。
不濟的話,寫個ppt,但爭取在會議上公開講。最差最差就是跑了一堆臨時需求單,寫了2000行sql結(jié)果連個正式輸出物都沒有,年底寫績效報告都不知道寫啥。題目四(單選題)
今天是11月11日中午12點,你的領(lǐng)導(dǎo)說,下班前給一個預(yù)計,預(yù)測一下雙十一我們業(yè)績能去到多少,你怎么做?
A、立馬回去建模,時間序列、XGboost搞起
B、回去找運營要推廣費用使用情況,算個投入產(chǎn)出比來拍
C、回去看下上午數(shù)據(jù),根據(jù)去年同期拍一個
這個題非常有迷惑性。特別是剛看完上一題,很多同學(xué)會慣性選A。這個題的題眼不是“預(yù)測”而是“中午12點到下班”。
數(shù)據(jù)分析可以建模、可以做BI、可以做可視化,但是通通需要時間,而很多情況下,業(yè)務(wù)不等人,必須快速給出結(jié)果。這時候要優(yōu)先選簡單直接的辦法,并結(jié)合數(shù)據(jù)提示風(fēng)險。
所以建模要學(xué)、統(tǒng)計學(xué)要學(xué)、如何快速合理地拍腦袋也要學(xué)。很多新人哼哧哼哧搞了一堆模型,結(jié)果被領(lǐng)導(dǎo)三言兩語推翻,還批斗:“你都干嘛去了這么磨嘰”,就是這個原因。這個題選C,最好是10分鐘內(nèi)給答案,領(lǐng)導(dǎo)指示:“這個問題非常重要,要用更復(fù)雜、更科學(xué)的方法”以后,再考慮AB。題目五(多選題)
數(shù)據(jù)分析的工作成本由什么構(gòu)成?
A、數(shù)據(jù)庫成本
B、電腦成本
C、開發(fā)軟件成本
D、BI產(chǎn)品成本
E、數(shù)據(jù)采集質(zhì)量
F、數(shù)據(jù)清洗質(zhì)量
G、程序員工作時間
這個題也非常非常有迷惑性,如果在陳老師問之前,很多人都壓根沒想過:“做數(shù)據(jù)分析還有成本啊??!!”“這玩意不是一個飽讀《機器學(xué)習(xí)》《統(tǒng)計學(xué)》《21天精通python》的人敲敲鍵盤就搞掂的嗎??!!”
答,數(shù)據(jù)分析肯定有成本,而且最大的成本是數(shù)據(jù)質(zhì)量,好數(shù)據(jù)才有好分析,垃圾數(shù)據(jù)垃圾分析。特別是數(shù)據(jù)采集,業(yè)務(wù)流程漏洞百出,業(yè)務(wù)管理不規(guī)范,埋點不做好就上線,基礎(chǔ)數(shù)據(jù)臟亂差,分析個屁。
至于什么軟件成本,電腦成本都是毛毛雨。數(shù)據(jù)質(zhì)量是涉及公司根本的問題。所以這一題的答案是ABCDEFG,如果排序的話,是E≥≥F≥G≥A≥D≥B≥C
等等!很多同學(xué)會問:為啥有G,而且排序還那么高?!因為數(shù)據(jù)分析師的工作時間是非常寶貴的。
學(xué)校里、論文里、專利里那么巨復(fù)雜的模型都是耗費無數(shù)時間燒出來的。普通企業(yè)的數(shù)據(jù)分析師每日應(yīng)付各種取數(shù)、匯報、excel都已經(jīng)折騰半死了,連找對象都不一定有時間,還整高精尖模型呢。
所以必須考慮工作時間,日常需求要排優(yōu)先級,集中精力做有產(chǎn)出的東西,那些亂七八糟“我要個數(shù)”讓他排隊去。
以上,做完5個題目,理解了題目思路,如何做優(yōu)秀的數(shù)據(jù)分析項目就呼之欲出了——
如何做優(yōu)秀的數(shù)據(jù)分析項目:
1、正式立項,把業(yè)務(wù)痛點作為項目目標(biāo)
2、考慮時間緊迫性和數(shù)據(jù)質(zhì)量,設(shè)計恰當(dāng)方法
3、輸出定期使用的、產(chǎn)品化的、大家必須看的成果
4、需求排序,給自己留出時間干高品質(zhì)工作
5、用快捷分析方法應(yīng)付簡單需求,留出精力做復(fù)雜需求
為了取得好的教學(xué)效果,這里用了5個最常犯錯的題目。目的就是讓大家記住做出優(yōu)秀數(shù)據(jù)分析項目的五個要點。
本文由人人都是產(chǎn)品經(jīng)理作者【接地氣的陳老師】,微信公眾號:【接地氣的陳老師】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
收集所需數(shù)據(jù),并進行數(shù)據(jù)清洗,確保數(shù)據(jù)質(zhì)量。數(shù)據(jù)的準(zhǔn)確性直接影響分析結(jié)果的可靠性。