數(shù)據(jù)分析能力的核心是思維

22 評論 75868 瀏覽 385 收藏 12 分鐘
🔗 产品经理的不可取代的价值是能够准确发现和满足用户需求,把需求转化为产品,并协调资源推动产品落地,创造商业价值。

對于業(yè)務(wù)人,比如產(chǎn)品或運(yùn)營,數(shù)據(jù)分析能力的核心不在方法和工具,而在于思維。

  • 大多數(shù)人錯誤地理解了數(shù)據(jù)分析,把數(shù)據(jù)分析能力提升的關(guān)鍵放在了方法和工具;
  • 對于業(yè)務(wù)人而言,數(shù)據(jù)分析的核心思路是,得到兩個變量之間的「量化關(guān)系」,用以解釋現(xiàn)象;
  • 數(shù)據(jù)分析的步驟,感知問題、提出假說、選擇表征、收集數(shù)據(jù)、分析驗(yàn)證;
  • 提出假說和選擇表征是很多業(yè)務(wù)人數(shù)據(jù)分析做不下去的原因。

數(shù)據(jù)分析的方法崇拜

在和團(tuán)隊(duì)小伙伴分享的的時候,發(fā)現(xiàn)一個問題:

我問,你怎么看數(shù)據(jù)分析能力?如何評價自己的數(shù)據(jù)分析能力?

大家的回答主要是這樣的:

運(yùn)營是基于數(shù)據(jù)驅(qū)動的,但是拿著很多數(shù)據(jù),不能分析下去,主要是對于excel的一些陌生的公式、函數(shù)都不太會,我要專門去學(xué)一下excel

我感覺導(dǎo)致現(xiàn)在轉(zhuǎn)化率低低原因是xxx,最近接觸到很多用戶都是這么反饋的,但還沒有找到好的分析方法

產(chǎn)品的數(shù)據(jù)分析能力還是很重要,我想去學(xué)個R,能夠去構(gòu)建量化模型

……

以上,我覺得太在意數(shù)據(jù)分析方法和工具,我覺得都還沒有把握住一個業(yè)務(wù)人數(shù)據(jù)分析能力的核心。

業(yè)務(wù)人考慮的最重要的問題是,業(yè)務(wù)結(jié)果到底怎么樣,出現(xiàn)了什么問題,原因是什么,可能的解決方案是什么。

數(shù)據(jù)分析只是手段,它的誤區(qū)就是,太在意方法和工具。

而最缺少的,恰恰是最重要的思維。

數(shù)據(jù)分析的本質(zhì)

數(shù)據(jù)分析最重要的思維就是,不斷確定業(yè)務(wù)中兩組變量之間的關(guān)系,用以解釋業(yè)務(wù)。

收入、轉(zhuǎn)化、用戶規(guī)模、用戶活躍等,我們稱為現(xiàn)象。而只有通過數(shù)據(jù)量化的現(xiàn)象,我們才能精準(zhǔn)感知。所以,數(shù)據(jù)是用來描述現(xiàn)象的,是被量化的現(xiàn)象。這就是數(shù)據(jù)統(tǒng)計在干的事情,比如建立數(shù)據(jù)漏斗,嚴(yán)格意義上這就是數(shù)據(jù)統(tǒng)計。

而數(shù)據(jù)分析,就是尋找這些被量化的現(xiàn)象之間的「關(guān)系」。這個關(guān)系就是y=f(x)。找到兩個變量之間的關(guān)系,多找到一種這樣關(guān)系,在實(shí)踐中,就多一種有效手段。

所以,在數(shù)據(jù)處理層面,有這樣兩個方式:

  1. 數(shù)據(jù)統(tǒng)計——利用數(shù)據(jù)體現(xiàn)現(xiàn)象,比如建立數(shù)據(jù)漏斗
  2. 數(shù)據(jù)分析——利用數(shù)據(jù)尋找現(xiàn)象關(guān)系,比如城市特征和活躍之間的關(guān)系

本文核心是圍繞數(shù)據(jù)分析進(jìn)行展開。

比如,做社群運(yùn)營的同學(xué),常常會想,到底什么因素在影響用戶的活躍度。在實(shí)踐的過程中,我們感覺到,不同的進(jìn)入社群的時間點(diǎn)可能是活躍度比較關(guān)鍵的影響因素。于是,嘗試通過數(shù)據(jù)定義,確定x=進(jìn)群時間點(diǎn)與開群的時間差,y=第一月活躍率。我們將x變量按天為單位氛圍不同類別,得到了以下的關(guān)系:

*x變量每類樣本N>50,且基本是同一時間的社群,排除了其他因素影響

當(dāng)我們得到以上圖示的關(guān)系其實(shí)足以指導(dǎo)我們的工作了——做社群運(yùn)營,盡量做到及時開群,不要讓用戶等待,消耗熱情。

所以,數(shù)據(jù)分析最重要的思維就是,不斷去尋找可能與業(yè)務(wù)結(jié)果有關(guān)的變量,確定這兩個變量之間的關(guān)系。多確定了一種關(guān)系,就多了一種手段,少了一些瞎干。

要做到這些,excel的基礎(chǔ)功能,妥妥解決。通過統(tǒng)計學(xué)方法回歸分析出一個量化模型或論證其信效度。

因?yàn)椋瑢τ诖蟛糠謽I(yè)務(wù)而言,動作的精度有限,所以不需要分析的精度太高,同時,統(tǒng)計方法的量化模型無法用業(yè)務(wù)邏輯進(jìn)行解釋,只能預(yù)測,對于實(shí)操類業(yè)務(wù)意義不大。

業(yè)務(wù)中數(shù)據(jù)分析的一般方法

前面簡單說了數(shù)據(jù)分析的方法工具誤區(qū)和數(shù)據(jù)分析核心是要去尋找兩組變量之間的關(guān)系。

那在業(yè)務(wù)中,如何進(jìn)行有效的數(shù)據(jù)分析。我將數(shù)據(jù)分析歸納為以下五個步驟:

  • 第一步,感知問題
  • 第二步,提出假說
  • 第三步,選擇表征
  • 第四步,收集數(shù)據(jù)
  • 第五步,分析驗(yàn)證

第一步,感知問題

如果沒有問題,是不需要數(shù)據(jù)分析的。

但是,那是不可能的。KPI總是差點(diǎn)才達(dá)到,即使達(dá)到了,領(lǐng)導(dǎo)還會問你,就不能做到更好嗎?

在業(yè)務(wù)中的問題有這樣兩種,一種是直接找最終結(jié)果的問題,比如收入比不上競品,DAU下降了10%等;一種是環(huán)節(jié)上的問題,拆解漏斗和業(yè)務(wù)環(huán)節(jié),比如通過分析app數(shù)據(jù)漏斗,發(fā)現(xiàn)每日使用一次人數(shù)相對于每日打開人數(shù)相對于流失了30%等。

記住這樣一句話,但凡有差異,必有問題,但凡有問題,必要尋找原因。

這一步困難的不是有沒有問題,差距、不足總是在那里。困難的是,能不能找到最重要,也就是最和業(yè)務(wù)結(jié)果相關(guān)的問題,優(yōu)先級排序是關(guān)鍵。

而排序的關(guān)鍵就是,基于最重要的結(jié)果或KPI的標(biāo)準(zhǔn)進(jìn)行排序。不斷思考一件事,解決了這個問題能夠?qū)Y(jié)果有多大的改善?

第二步,提出假說

找到問題,下一步就是找方法解決。

在管理咨詢界有個說法,叫作不要煮沸海洋。說的是,把所有的,可能導(dǎo)致問題的因素全部找出來分析一遍,那是低效也是不可能的。

所以,這里就需要使用到「假說」的方法。

哪些因素可能影響到收入?哪些因素會導(dǎo)致打開app的人不使用任何功能直接離開?

找到以上問題可能的答案的過程,就是提出假說的過程。

這里有兩個路徑用來提出假說,一個是歸納的方式,一個是演繹的方式:

什么是歸納式的,就是根據(jù)個案進(jìn)行總結(jié)。比如在收入可能的影響因素的時候,我會找所有相關(guān)工作人員進(jìn)行頭腦風(fēng)暴,提出可能的因素;也會對分層的用戶進(jìn)行抽樣深讀訪談,了解他們購買或不購買的原因及其他看法。

什么是演繹式的,就是根據(jù)模型進(jìn)行推演。比如在app打開不使用直接離開,我們可以根據(jù)對用戶行為模型的理解進(jìn)行拆解,而拆解的有效與否,其實(shí)就是關(guān)于你模型多少、深度。

結(jié)合歸納式和演繹式的方法,我們會得到非常多的可能與結(jié)果相關(guān)因素。進(jìn)行整理,并進(jìn)行重要性排序。

到這里,我們就找出很多可能、未經(jīng)確定、未經(jīng)量化的y=f(x),也就是一對對可能有關(guān)系的變量。

第三步,選擇表征

不可被數(shù)據(jù)量化,就不能被改變。如前文所說,數(shù)據(jù)分析,需要將現(xiàn)象量化,得到可以分析的數(shù)據(jù)。

所以,需要將提出的假說中所選擇的變量,用數(shù)據(jù)來進(jìn)行表征。

在入群時間點(diǎn)對用戶活躍度影響的例子中,我們將入群時間點(diǎn)(x)定義為:入群時間與開群時間差;將活躍度(y)定義為用戶從進(jìn)入起一周的活躍率,即一月內(nèi)活躍天數(shù)的占比。

在選擇數(shù)據(jù)表征元素的時候,需要把握的原則就是:

  • 選擇的數(shù)據(jù)能夠充分代表假說中變量的內(nèi)涵;
  • 選擇的數(shù)據(jù)盡量是用戶客觀行為數(shù)據(jù)而非主觀態(tài)度數(shù)據(jù);
  • 選擇的數(shù)據(jù)是有被記錄或容易獲取。

第四步,收集數(shù)據(jù)

互聯(lián)網(wǎng)的很大優(yōu)勢就是數(shù)據(jù)驅(qū)動的,數(shù)據(jù)往往是被有效收集的。

但是,也存在數(shù)據(jù)沒有被記錄情況。支持產(chǎn)品功能的數(shù)據(jù),會被記錄,但是很多行為數(shù)據(jù)只能通過調(diào)取接口數(shù)據(jù)或埋點(diǎn)的方式進(jìn)行記錄。這就需要業(yè)務(wù)人能夠提前規(guī)劃所需數(shù)據(jù),讓工程師將數(shù)據(jù)記錄在庫。

在收集數(shù)據(jù)的過程中,需要注意到就是有效數(shù)據(jù)量不能太小。

第五步,分析驗(yàn)證

反倒是,分析驗(yàn)證這個步驟變得不是那么核心的步驟。

確定好了x與y的含義和數(shù)據(jù),剩下的分析就很簡單了。通過數(shù)據(jù)可視化的方式,表現(xiàn)出x與y的關(guān)系,就能發(fā)現(xiàn)其中是否存在有價值的規(guī)律。

發(fā)現(xiàn)x與y存在某種關(guān)系的時候,最好通過數(shù)據(jù)進(jìn)行再次驗(yàn)證。選擇另外一組數(shù)據(jù),再次進(jìn)行分析,看確定的關(guān)系是否再次被復(fù)現(xiàn)。

當(dāng)然,最重要的驗(yàn)證是在業(yè)務(wù)實(shí)現(xiàn)中體現(xiàn)。

數(shù)據(jù)分析,一種必備能力

數(shù)據(jù)分析,是認(rèn)識事物的重要方式之一,它的特點(diǎn)是定量的非定性的、過去的非未來的、相關(guān)的非因果的,有其適用范圍,但一定是所有業(yè)務(wù)人必須掌握的能力。

對于業(yè)務(wù)人,不用太崇拜于方法和工具,首先需要錘煉分析思維,尋找兩個變量的關(guān)系,真正指導(dǎo)業(yè)務(wù)才是關(guān)鍵。

而在分析的過程中,「提出假說」和「選擇表征」是關(guān)鍵所在,也是很多業(yè)務(wù)人沒有能夠作出有效分析的關(guān)鍵所在。

 

本文由 @個家 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Pixabay,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 你好,文章是很不錯的,但是看完結(jié)合我自己自身的數(shù)據(jù)分析,產(chǎn)生了一個疑問,想請教下作者。
    提出假說部分,給出的(y)和(x)都是非常明確的單一變量,但是在業(yè)務(wù)分析中,很可能會遇到自變量的情況。
    比如想探究用戶付費(fèi)率(y)和產(chǎn)品試用領(lǐng)取情況(x)之間的關(guān)系,此時的(x)就是自變量,(y)就是因變量,需要通過兩者之間的關(guān)系來驗(yàn)證。比如領(lǐng)取試用的用戶付費(fèi)率是10%,沒有領(lǐng)取試用的用戶付費(fèi)率是5%,以此說明(x)對(y)有促進(jìn)作用。但是這種分析方式無法剔除領(lǐng)取試用這一用戶客觀行為是否存在主觀性(即領(lǐng)取試用可能本身存在較強(qiáng)的付費(fèi)傾向)
    想問的內(nèi)容是:
    1.上述情況是否和本篇文章宗旨相悖?
    2.如果相悖,那么針對上述情況,該如何提出假說、選擇表征?

    以上,望作者不吝賜教,感謝??

    來自江蘇 回復(fù)
    1. 感謝你的問題,不常上這個平臺,回復(fù)慢了。
      你說的情況與文章的思路并不相悖,但是文章中對于這種類型的變量關(guān)系并沒有深入探討——
      你舉的例子,本質(zhì)上是付費(fèi)率與試用領(lǐng)取情況是相關(guān)關(guān)系,并非因果關(guān)系。即愿意付費(fèi)和愿意領(lǐng)取試用的用戶可能都是對于這類產(chǎn)品有需求,付費(fèi)和領(lǐng)取試用是這個因?qū)е碌膬蓚€結(jié)果,這兩個結(jié)果是相關(guān)的。但也不一定是這樣的,用戶可能是因?yàn)樵囉枚鴮?dǎo)致了對于產(chǎn)品更多了解,更大需求,從而付費(fèi)。所以,這個時候需要通過A/B測試來確定其關(guān)系,如一組自然轉(zhuǎn)化,一組增加領(lǐng)取試用的轉(zhuǎn)化,看差異。若試用組有明顯的優(yōu)勢,那么你需要判斷的是,當(dāng)前提升試用比例是不是一個關(guān)鍵動作,若是,那么你需要找試用的影響因素,比如觸達(dá)、比如包裝、比如試用周期等等,又進(jìn)入新的一輪分析中。
      但是,不管怎么說,多提取出一組y=f(x)對于理解業(yè)務(wù)都是有價值的,比如你發(fā)現(xiàn)了領(lǐng)取試用和付費(fèi)之間有一定的關(guān)系,那么你就會去探究到底這個是不是因果性的或者及時其是相關(guān)性的,你可以將它當(dāng)做一個觀測指標(biāo)來提前預(yù)測付費(fèi)結(jié)果。
      不知道是否能夠回答你的問題,可繼續(xù)探討,一起進(jìn)步。

      來自廣東 回復(fù)
  2. “定量的非定性的、過去的非未來的、相關(guān)的非因果的” 筆者這段話讓我著實(shí)困惑。

    來自廣東 回復(fù)
    1. 數(shù)據(jù)分析是一種定量分析方法,而非定性分析方法;
      數(shù)據(jù)分析是針對過去的歷史數(shù)據(jù)/現(xiàn)象進(jìn)行,而非針對未來的未發(fā)生的現(xiàn)象進(jìn)行分析;
      數(shù)據(jù)分析尋找的是數(shù)據(jù)之間的相關(guān)關(guān)系,而非因果關(guān)系。相關(guān)關(guān)系和因果關(guān)系是存在很大區(qū)別的

      來自上海 回復(fù)
    2. 感謝吳晗幫助回復(fù),很贊同你的看法。另相關(guān)和因果上面一條評論中多少涉及。

      來自廣東 回復(fù)
  3. 起點(diǎn)學(xué)院專門為0基礎(chǔ)的0-2歲互聯(lián)網(wǎng)人開設(shè)了《15天入門互聯(lián)網(wǎng)數(shù)據(jù)分析》班級哦~課程由數(shù)據(jù)思維+真實(shí)案例+實(shí)操相結(jié)合,提升你的數(shù)據(jù)分析能力!戳此了解>>http://996.pm/YNG4e

    來自廣東 回復(fù)
  4. 贊同

    來自江蘇 回復(fù)
  5. 數(shù)據(jù)分析是為了驗(yàn)證,不是為了分析去分析的!

    來自浙江 回復(fù)
  6. 看完之后對數(shù)據(jù)分析有了學(xué)習(xí)的方向,期待看到更多數(shù)據(jù)分析的文章哦!

    來自廣東 回復(fù)
  7. 分析工具是可以在短時間內(nèi)學(xué)習(xí)的,重要的還是分析的方法和思路~思想起飛才重要

    來自北京 回復(fù)
    1. 學(xué)習(xí)分析的方法和思路,有推薦的學(xué)習(xí)教程嗎

      來自廣東 回復(fù)
    2. 我個人經(jīng)驗(yàn),供參考。1、和君系單其武老師的其來有自,比較實(shí)戰(zhàn),學(xué)理上不一定嚴(yán)謹(jǐn);2、學(xué)術(shù)派(其實(shí)也是和君系)的陽志平老師的開智學(xué)堂,學(xué)理嚴(yán)謹(jǐn),需要重功夫。這是個人測試不錯的課程。如果自學(xué)的話,其實(shí)多看兩本方法論的書就會有幫助

      來自北京 回復(fù)
  8. 看了前幾段就想留言,講到點(diǎn)上了!

    回復(fù)
    1. 哈哈,有機(jī)會探討

      來自北京 回復(fù)
  9. “要做到這些,excel的基礎(chǔ)功能,妥妥解決。通過統(tǒng)計學(xué)方法回歸分析出一個量化模型或論證其信效度”請問一下,如何通過excel實(shí)現(xiàn)一個回歸分析的模型?

    來自浙江 回復(fù)
    1. 很抱歉,你引用的那段文字我可能沒有表達(dá)清楚。在業(yè)務(wù)解釋的過程中,建立統(tǒng)計分析模型的意義并不一定特別大,而是直接通過可視化的方式觀察X變量和Y變量是否有相關(guān)性,描繪成曲線即可,就可以聯(lián)系上直接業(yè)務(wù),對于普通業(yè)務(wù)型,不需要高精度預(yù)測的業(yè)務(wù),相關(guān)性就能指明問題。當(dāng)然,如果要用Excel直接做回歸也是可以的,“工具-數(shù)據(jù)分析-回歸”

      來自北京 回復(fù)
  10. 很贊,如果可以落地使用就更好了

    回復(fù)
    1. 期待什么樣的內(nèi)容算落地? ??

      來自北京 回復(fù)
    2. 應(yīng)該是說的有 case的那種

      來自廣東 回復(fù)
  11. 寫的很棒,期待您能再寫1篇關(guān)于數(shù)據(jù)統(tǒng)計的文章

    來自北京 回復(fù)
    1. OK,這幾天寫一下,一起交流一下

      來自北京 回復(fù)
  12. ??

    來自浙江 回復(fù)
专题
33515人已学习17篇文章
作为产品经理,你真的懂什么是敏捷开发吗?
专题
12613人已学习12篇文章
活动策划,既是脑力活,也是苦力活,因此你需要尽量把各种情况考虑到。本专题的文章分享了如何策划一场线下活动。
专题
13735人已学习12篇文章
为了推动公司业务的正常运转操作,我们需要建立一定的业务模型来推动运作。本专题的文章分享了如何构建业务模型。
专题
14417人已学习15篇文章
智能硬件产品经理需要做什么工作内容呢?与互联网产品经理有什么区别呢?本专题为刚入行的智能硬件产品经理分享了入门指南。
专题
69549人已学习13篇文章
想要做款好产品,这些规范你得知道。
专题
18998人已学习13篇文章
在B端产品设计中,数据的筛选是其中必不可少的一个步骤。本专题的文章提供了B端数据筛选查询的设计思路。