100種分析思維模型之:大數(shù)定理

0 評(píng)論 1887 瀏覽 5 收藏 11 分鐘

本文將帶你深入了解大數(shù)定理的概念和應(yīng)用,通過實(shí)際案例展示如何利用這一統(tǒng)計(jì)學(xué)原理來提高我們對(duì)隨機(jī)事件的理解和預(yù)測(cè)能力,希望對(duì)你有所幫助。

你好,我是林驥。在我們的日常工作、生活和學(xué)習(xí)中,經(jīng)常會(huì)面對(duì)著各種不確定性的隨機(jī)事件,此時(shí)我們不妨運(yùn)用統(tǒng)計(jì)思維,發(fā)現(xiàn)事物背后的規(guī)律。

在統(tǒng)計(jì)思維的背后,還有一把神奇的鑰匙,那就是大數(shù)定理。

下面介紹 100 種分析思維模型的第 73 種:大數(shù)定理,它能幫助我們更好地理解規(guī)律背后的原理,提升預(yù)測(cè)未來的能力。

一、為什么學(xué)習(xí)大數(shù)定理?

對(duì)于很多人來說,感覺數(shù)學(xué)很難,不知道學(xué)數(shù)學(xué)有什么用,更不知道怎么用。因此,只停留較低的水平,無法跟日常運(yùn)用對(duì)接起來,結(jié)果白白浪費(fèi)了很多時(shí)間和精力。

事實(shí)上,在我們的日常生活中,每天都可以用到數(shù)學(xué),從簡(jiǎn)單的加減乘除,到一些復(fù)雜的公式定理,只要運(yùn)用得當(dāng),就能發(fā)揮出巨大的價(jià)值。

我們每天都在面臨各種各樣的風(fēng)險(xiǎn),出門有風(fēng)險(xiǎn),不出門也有風(fēng)險(xiǎn);吃飯有風(fēng)險(xiǎn),不吃飯也有風(fēng)險(xiǎn);坐車有風(fēng)險(xiǎn),坐飛機(jī)也有風(fēng)險(xiǎn)……

風(fēng)險(xiǎn)幾乎無處不在,但有些風(fēng)險(xiǎn)是可控的,有些風(fēng)險(xiǎn)是不可控的;有些風(fēng)險(xiǎn)是可預(yù)知的,有些風(fēng)險(xiǎn)是不可預(yù)知的;有些風(fēng)險(xiǎn)是比較大的,有些風(fēng)險(xiǎn)是比較小的……

其實(shí),我們完全不必「杞人憂天」,只要學(xué)會(huì)靈活運(yùn)用大數(shù)定理,就可以更合理地評(píng)估風(fēng)險(xiǎn)大小,進(jìn)而做出正確的決策。

如果沒有大數(shù)定理的話,那么所有的隨機(jī)實(shí)驗(yàn),以及一切通過統(tǒng)計(jì)數(shù)據(jù)發(fā)現(xiàn)事物背后的規(guī)律,都將變得沒有什么意義。

正是因?yàn)橛辛舜髷?shù)定理,我們才可以通過現(xiàn)實(shí)觀察到的數(shù)據(jù),去預(yù)測(cè)未知的事物,并且因此有了科學(xué)理論的支撐。

總之,通過學(xué)習(xí)大數(shù)定理,可以幫助我們正確地理解和分析數(shù)據(jù),預(yù)測(cè)隨機(jī)事件發(fā)生的規(guī)律,避免被事物的表象所誤導(dǎo),提高數(shù)據(jù)分析和科學(xué)決策的能力,進(jìn)而提升我們的認(rèn)知水平。

二、什么是大數(shù)定理?

大數(shù)定理是概率論與數(shù)理統(tǒng)計(jì)中的一個(gè)基本定理,它的核心思想是:

如果進(jìn)行多次隨機(jī)試驗(yàn),只要樣本數(shù)量越多,它們的平均值就越趨近于數(shù)學(xué)期望值。

比如,在拋硬幣的試驗(yàn)中,正常情況下出現(xiàn)正面的概率是 50%,按照大數(shù)定理,拋硬幣的次數(shù)越多,出現(xiàn)正面的次數(shù)就越趨近于總次數(shù)的 50%。假如你拋 10 次硬幣,出現(xiàn)了 8 次正面,這并不能說明硬幣有問題,或者說大數(shù)定理有問題,也許是因?yàn)槟銙伒拇螖?shù)還不夠多。當(dāng)你拋的次數(shù)足夠多之后,正常情況下都會(huì)回歸均值的。

下面我用 Python 代碼模擬了拋硬幣的過程:

import numpy as np
import scipy.stats as st
import matplotlib as mpl
import matplotlib.pyplot as plt

# 防止中文亂碼
mpl.rcParams[‘font.sans-serif’]=[u’simHei’]
mpl.rcParams[‘axes.unicode_minus’]=False

# 定義次數(shù)和范圍
n = 1000
x = np.arange(1, n+1, 1)
# 定義數(shù)組:出現(xiàn)正面的比例
y = []
# 循環(huán)計(jì)算
for i in x:
data = st.bernoulli.rvs(size=i, p=0.5) # 伯努利分布數(shù)據(jù)
y.append(sum(data)/len(data)) # 追加出現(xiàn)正面的比例

# 設(shè)置圖表的大小
plt.figure(figsize=(18.8, 8))

# 作圖設(shè)置
plt.xlabel(‘拋硬幣次數(shù)’, fontsize=20)
plt.ylabel(‘出現(xiàn)正面的比例’, fontsize=20)
plt.tick_params(axis=’both’, which=’major’, labelsize=16)

# 作圖并展示
plt.plot(x,y)
plt.plot([n,0.5], [0.5,0.5], ‘r’) # 均值參考線
plt.show()

運(yùn)行結(jié)果如下:

100種分析思維模型之:大數(shù)定理

從圖中可以直觀地看出,隨著拋硬幣次數(shù)的增加,出現(xiàn)正面的比例越來越趨近于 0.5。

大數(shù)定理有多種不同的形式,包括伯努利大數(shù)定理、切比雪夫大數(shù)定理、辛欽大數(shù)定理、波萊爾大數(shù)定理、柯爾莫哥洛夫大數(shù)定理等。

不同的大數(shù)定理,在前提假設(shè)方面略有差異,在結(jié)論的深度和角度等方面也有所不同,但它們都經(jīng)過數(shù)學(xué)家的嚴(yán)格證明,否則就只能叫「大數(shù)定律」。

嚴(yán)格來說,定理與定律是有區(qū)別的。

定理是經(jīng)過邏輯推理或嚴(yán)格證明的原理,不允許有例外情況。比如平面幾何中的勾股定理,無論直角三角形怎么變,兩條直角邊的平方和,一定等于斜邊的平方。

定律是通過觀察或?qū)嶒?yàn)獲得的經(jīng)驗(yàn)規(guī)律,在一定條件下可能會(huì)失效。比如牛頓的經(jīng)典力學(xué)三大定律,在微觀環(huán)境下可能不成立。

盡管定理與定律的概念略有不同,但是由于在「大數(shù)定理」被數(shù)學(xué)家嚴(yán)格證明之前,人們已經(jīng)習(xí)慣稱之為「大數(shù)定律」。所以,現(xiàn)在人們所說的「大數(shù)定律」,通常就是指「大數(shù)定理」。

三、怎么運(yùn)用大數(shù)定理?

無論是在工作中,還是在生活中,大數(shù)定理都為我們提供了一種應(yīng)對(duì)不確定性的方法。

我們可以把運(yùn)用大數(shù)定理,去發(fā)現(xiàn)一些事物背后的規(guī)律,從而幫助我們做出正確的判斷和決策。

比如,通過量化自己的時(shí)間價(jià)值,假設(shè)你每小時(shí)的價(jià)值是 1000 元,現(xiàn)在有一件事情,需要你花 1 個(gè)小時(shí),有 20% 的可能性獲得 8000 元的收益,另外有 80% 的可能性收益為 0 元,那么這件事是否值得去做呢?

答案是肯定的,因?yàn)樽鲞@件事的數(shù)學(xué)期望是 20%*8000=1600 元,明顯高于你的時(shí)間價(jià)值。雖然有 80% 的可能性浪費(fèi)一個(gè)小時(shí)的時(shí)間,但是按照大數(shù)定理,長(zhǎng)期來看,這樣的事情做得越多,就越有可能獲得更多的收益。

運(yùn)用大數(shù)定理,核心不在于梳理已知的事實(shí),而在于推斷未知的可能性。

在推斷未知的過程中,你可能需要用到貝葉斯思維,就是從過去已知條件出發(fā),去推測(cè)未來事件發(fā)生的概率。

這有點(diǎn)像福爾摩斯探案的過程,當(dāng)他發(fā)現(xiàn)在兇手作案的時(shí)間里,平常見人就叫的狗卻沒有叫,因此推斷出肯定是熟人作案。

運(yùn)用大數(shù)定理,當(dāng)一件大概率應(yīng)該發(fā)生的事情沒有發(fā)生時(shí),其中肯定存在某種原因,你在經(jīng)過分析和排查之后,也許就能揭示其中的真相。

四、最后的話

數(shù)據(jù)的應(yīng)用離不開統(tǒng)計(jì)學(xué),而大數(shù)定理是統(tǒng)計(jì)學(xué)的基石,它保障了概率思維和統(tǒng)計(jì)思維的科學(xué)性和實(shí)用性,讓我們能夠更好地認(rèn)識(shí)世界的規(guī)律,進(jìn)而做出更加合理的決策。

有些人喜歡認(rèn)真做好每一件小事,雖然短期來看收益比較小,但是大概率能夠成功,經(jīng)過時(shí)間的日積月累,就有可能形成復(fù)利效應(yīng)。

另外有些人則喜歡潛心做一件大事,雖然成功率比較低,但是一旦成功,收益非常高。

無論你選擇做哪種人,只要符合大數(shù)定理,最終都有可能獲得自己想要的結(jié)果。

然而,有些人卻違背大數(shù)定理去做事。比如,想要靠賭博發(fā)家致富,這幾乎是不可能的,因?yàn)橘€場(chǎng)早已算準(zhǔn)了賭徒輸錢的概率。

一個(gè)人的認(rèn)知,決定了一個(gè)行為。如果我們學(xué)會(huì)運(yùn)用大數(shù)定理,也許就不會(huì)去做賭博和盲目投資之類的傻事了。

人只能賺到自己認(rèn)知范圍之內(nèi)的錢,憑運(yùn)氣贏得的財(cái)富,最后都會(huì)憑實(shí)力輸回去。

只有努力提升自己的認(rèn)知水平,從過去收集數(shù)據(jù),到現(xiàn)在分析思考,再到未來指導(dǎo)行動(dòng),做好風(fēng)險(xiǎn)的管控,才能讓生活變得更加幸福。

公眾號(hào):林驥,《數(shù)據(jù)化分析》作者

本文由 @林驥 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!