100種分析思維模型之:統(tǒng)計(jì)思維

0 評(píng)論 1179 瀏覽 5 收藏 12 分鐘

本文將帶你了解統(tǒng)計(jì)思維的重要性和應(yīng)用,通過深入淺出的案例分析,幫助你在數(shù)據(jù)分析的海洋中找到指路明燈,希望對(duì)你有所幫助。

你好,我是林驥。在信息爆炸的時(shí)代,不同的信息獲取方式,可能讓我們會(huì)產(chǎn)生不同的判斷和決策。

究竟什么是真?什么是假?什么是有益的?什么是有害的?

下面介紹 100 種分析思維模型的第 71 種:統(tǒng)計(jì)思維,它能幫助我們揭示數(shù)據(jù)背后隱藏的規(guī)律和趨勢,進(jìn)而做出更加科學(xué)的判斷和決策。

一、為什么學(xué)習(xí)統(tǒng)計(jì)思維?

我們大多數(shù)人都是感性動(dòng)物,常常會(huì)因?yàn)榍楦卸淖冏约旱南敕ǎy以時(shí)刻保持理智的判斷。

比如,在選購一款商品的時(shí)候,假設(shè)有高檔、中檔、低檔 3 種不同的型號(hào),對(duì)應(yīng)高、中、低 3 種不同的價(jià)格,大多數(shù)人都會(huì)選擇中檔,因?yàn)槿藗兺ǔ?huì)有「回避極端」的心理。

通過學(xué)習(xí)統(tǒng)計(jì)思維,將數(shù)據(jù)與實(shí)際相結(jié)合,就可以在面對(duì)不確定性時(shí),更加客觀地分析信息的真?zhèn)?,獲得更有價(jià)值的信息,進(jìn)而做出更加合理的判斷和理性的決策。

假設(shè)你擁有統(tǒng)計(jì)思維,想要知道某款產(chǎn)品的市場表現(xiàn),就可以分析相關(guān)數(shù)據(jù),了解產(chǎn)品的銷售情況、受眾特征和銷售趨勢等,進(jìn)而調(diào)整相應(yīng)的銷售策略,以便提升銷售的業(yè)績。

但是,假如你缺乏統(tǒng)計(jì)思維,就有可能僅憑直覺或主觀判斷做出決策,導(dǎo)致陷入盲目和錯(cuò)失發(fā)展機(jī)會(huì)的境地。

總之,統(tǒng)計(jì)思維可以幫助我們更加客觀、理性地看待問題,從而做出更加明智的決策。

二、什么是統(tǒng)計(jì)思維?

統(tǒng)計(jì)思維是一種基于數(shù)據(jù)和概率的思考方式,通過統(tǒng)計(jì)數(shù)據(jù)并對(duì)其進(jìn)行分析,進(jìn)而更好地理解現(xiàn)狀、分析原因和預(yù)測未來。

下面簡單介紹一些統(tǒng)計(jì)學(xué)的核心概念,它們是統(tǒng)計(jì)思維的基礎(chǔ)。

① 總體與樣本

總體是統(tǒng)計(jì)研究的整個(gè)集合。例如,我們要研究中國人的平均身高,那么所有中國人就是總體。

樣本是從總體中抽出的一個(gè)代表子集。例如,從中國人中隨機(jī)抽取 1000 個(gè)代表來測量身高,這 1000 個(gè)人就是樣本。

② 概率與頻率

概率是某一事物發(fā)生的可能性。例如,拋硬幣出現(xiàn)正面的概率是 50%。

頻率是指在 N 次試驗(yàn)中,某一事件出現(xiàn)的次數(shù) m 與 N 的比值。例如,拋了 100 次硬幣,出現(xiàn) 51 次正面,那么出現(xiàn)正面的頻率是 51%。

③ 參數(shù)與統(tǒng)計(jì)量

參數(shù)是描述總體特征的數(shù)值。例如,總體均數(shù)、總體標(biāo)準(zhǔn)差、總體相關(guān)系數(shù)等。

統(tǒng)計(jì)量是通過樣本數(shù)據(jù)計(jì)算出來的數(shù)值。例如,樣本均數(shù)、樣本標(biāo)準(zhǔn)差、樣本相關(guān)系數(shù)等。

統(tǒng)計(jì)學(xué)的概念還有很多,在此不做一一介紹,感興趣的朋友,可以參考統(tǒng)計(jì)學(xué)的相關(guān)書籍。

統(tǒng)計(jì)思維側(cè)重于「道」的層面,而具體的統(tǒng)計(jì)方法側(cè)重于「術(shù)」的層面。無道之術(shù),就像脫韁的野馬,一路狂奔卻沒有方向。只有用道去駕馭術(shù),才能取得更好的效果。

三、怎么運(yùn)用統(tǒng)計(jì)思維?

統(tǒng)計(jì)思維是為了解決實(shí)際問題而產(chǎn)生的,無論是在工作中,還是在日常生活中,統(tǒng)計(jì)思維都能為我們提供有力的支持。

在運(yùn)用統(tǒng)計(jì)思維解決問題的時(shí)候,我們可以先隨機(jī)抽取一些樣本,并盡可能讓樣本能夠代表總體,然后找到與數(shù)據(jù)匹配的思維模型。

這個(gè)過程就像福爾摩斯探案,事先并沒有確切的結(jié)論,只能努力先去尋找線索和證據(jù),最后才能讓案件真相大白。

比如,為了用更低的成本,及時(shí)了解中國人口的變化情況,統(tǒng)計(jì)局可以選取中國人口的 1? 進(jìn)行抽樣調(diào)查,通過抽樣數(shù)據(jù)來預(yù)估中國人口的變化。


統(tǒng)計(jì)思維不僅可以解決一些數(shù)字相關(guān)的問題,而且能夠解決一些看起來與「數(shù)」無關(guān)的問題。

比如,有人使用詞頻統(tǒng)計(jì)、回歸分析、多重檢驗(yàn)等統(tǒng)計(jì)學(xué)的方法,對(duì)《紅樓夢(mèng)》前 80 回和后 40 回進(jìn)行對(duì)比分析,發(fā)現(xiàn)前后存在巨大的語言差異。

其中常用形容詞、副詞、虛詞出現(xiàn)的頻率,以及段落長度、分句、標(biāo)點(diǎn)符號(hào)等,都發(fā)生了顯著的變化。而一個(gè)人前后用語、用詞以及標(biāo)點(diǎn)符號(hào)的習(xí)慣,通常不會(huì)發(fā)生太大的變化。因此可以推斷,《紅樓夢(mèng)》前 80 回和后 40 回的作者大概率不是同一個(gè)人。

與統(tǒng)計(jì)思維有關(guān)的正態(tài)分布、冪律分布、泊松分布、相關(guān)分析、假設(shè)檢驗(yàn)等,都可以用來解決一些實(shí)際的問題。

很多人每天都在努力工作、學(xué)習(xí)和運(yùn)動(dòng),但是為什么卻看不到效果?

有一種 Sigmoid 函數(shù),能夠直觀反映努力與成果之間的關(guān)系。

Sigmoid 函數(shù)的定義如下:

100種分析思維模型之:統(tǒng)計(jì)思維

該函數(shù)對(duì)應(yīng)的圖形就像一個(gè)大寫的 S 形,剛開始的時(shí)候處于停滯期,努力幾乎不會(huì)產(chǎn)生什么成果,但是持續(xù)努力一段時(shí)間,到達(dá)某種程度之后,就能獲得快速成長,甚至產(chǎn)生質(zhì)的飛躍。

100種分析思維模型之:統(tǒng)計(jì)思維

當(dāng)努力變得艱難的時(shí)候,不妨想一想 S 型增長曲線,也許就會(huì)產(chǎn)生繼續(xù)努力的動(dòng)力。

在瞬息萬變的世界中,如果我們運(yùn)用統(tǒng)計(jì)思維,提升預(yù)測未來的能力,就更容易把握先機(jī),提前做好的準(zhǔn)備,并采取相應(yīng)的行動(dòng)。

但是,假如你的預(yù)測模型不對(duì),或者初始條件不一樣,就有可能導(dǎo)致「差之毫厘,謬以千里」。

比如,有一個(gè)簡單的數(shù)學(xué)模型:y = 100 ^ x,也就是 100 的 x 次方。當(dāng) x = 1 時(shí),y 等于 100,而當(dāng) x = 2 時(shí),y 等于 10000。雖然初始條件 x 僅相差 1,但是結(jié)果 y 卻相差了 100 倍,差距非常懸殊。

20 世紀(jì) 60 年代,氣象學(xué)家愛德華·洛倫茲提出了「蝴蝶效應(yīng)」,就是在一個(gè)復(fù)雜系統(tǒng)中,哪怕一個(gè)微小的變化,都有可能引起巨大的連鎖反應(yīng)。

所以,我們?cè)谶\(yùn)用統(tǒng)計(jì)思維的時(shí)候,一定要注意提高警惕。

在《拼湊真相》這本書中,作者蒂姆·哈福德介紹了認(rèn)清紛繁世界的 10 大數(shù)據(jù)法則,這些數(shù)據(jù)法則能夠幫助我們提升洞察事物本質(zhì)的能力。

隨著 AI(人工智能)技術(shù)的發(fā)展,我們可以快速處理和分析海量的數(shù)據(jù)。然而,統(tǒng)計(jì)思維的主角依然是人,因?yàn)樽罱K還是需要靠人來對(duì)數(shù)據(jù)進(jìn)行解讀和運(yùn)用。

四、最后的話

在用統(tǒng)計(jì)思維解決實(shí)際問題的時(shí)候,我們可能還會(huì)面臨 3 大難題。

① 總體是誰?

在現(xiàn)實(shí)生活中,總體往往是難以確定和度量的。

比如,怎么統(tǒng)計(jì)人類的智力水平?這是一個(gè)動(dòng)態(tài)變化且難以度量的問題。

但總體往往又非常重要,因?yàn)樗拖袷谴蠛:叫械臒羲该髁私鉀Q問題的目標(biāo)和方向。

② 數(shù)據(jù)從哪里來?

在大數(shù)據(jù)時(shí)代,雖然我們并不缺少數(shù)據(jù),但是要想獲得真正有價(jià)值的數(shù)據(jù)也不容易。

比如,怎么統(tǒng)計(jì)每個(gè)人的時(shí)間分配?這涉及到時(shí)間的記錄、分類等操作,面臨著準(zhǔn)確性和及時(shí)性的挑戰(zhàn)。

只有拿到正確的數(shù)據(jù),才有可能得出正確的結(jié)果。

③ 結(jié)論到那里去?

這里的結(jié)論,并不是一個(gè)簡單的統(tǒng)計(jì)結(jié)果,而是要把統(tǒng)計(jì)結(jié)果與現(xiàn)實(shí)問題緊密地聯(lián)系起來,獲得真正有價(jià)值的洞察。

然而,在現(xiàn)實(shí)世界中,統(tǒng)計(jì)結(jié)果很有可能與現(xiàn)實(shí)情況并不一致。

面對(duì)以上難題,我們?cè)撛趺崔k呢?

首先,我們要有用數(shù)據(jù)化解難題的意識(shí),不要輕易做出判斷。

其次,我們可以運(yùn)用統(tǒng)計(jì)思維,獲得化解難題的思路,不妨先大膽提出假設(shè),然后再小心進(jìn)行求證,嚴(yán)格按照統(tǒng)計(jì)學(xué)的流程規(guī)范,確保獲得正確的結(jié)論。

最后,我們要理論聯(lián)系實(shí)際,結(jié)合具體領(lǐng)域的知識(shí)背景,提升自己對(duì)業(yè)務(wù)的理解和認(rèn)知水平,進(jìn)而更好地解決實(shí)際的問題。

人生是由一系列選擇組成的,我們每天都要做出各種各樣的選擇,從早上幾點(diǎn)鐘起床,到早餐吃什么,再到一天的時(shí)間怎么安排,以及晚上幾點(diǎn)鐘睡覺等等。

基于統(tǒng)計(jì)思維做出的選擇,通常都會(huì)比隨意選擇得到的結(jié)果要好得多。

學(xué)會(huì)運(yùn)用統(tǒng)計(jì)思維,就像擁有一種透視鏡,讓我們能夠透過表面的現(xiàn)象,看到事物背后的規(guī)律和趨勢,進(jìn)而做出更加睿智的決策。

公眾號(hào):林驥,《數(shù)據(jù)化分析》作者

本文由 @林驥 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!