客戶體驗:問卷調研的樣本量大小怎么確定?
在問卷調研工作中,不少小伙伴可能會不太清楚如何確定樣本量。本文就對這一問題做了闡述,一起來看看。
在體驗管理日常的問卷調研工作中,樣本量大小的確定一直是很多小伙伴搞不清楚的地方。
現(xiàn)在網上也有一些免費的工具可以幫助進行計算,不過如果你缺少對其中變量的理解,就是拿到一個樣本量的大小,也不知道怎么去解釋,這很容易被其他人質疑。
理解這個事情一點都不難,你花幾分鐘時間,我來給你講講~
以下,enjoy~
一、什么是調研樣本量?
?? 想象一下,你很好奇早餐吃 Weetabix(一種早餐麥片)的長跑運動員和不吃的運動員在比賽中的表現(xiàn)是否有差異???
要弄清楚這個問題,理論上我們需要調查全世界的長跑運動員,但這顯然不現(xiàn)實。
這時候,樣本大小就變得重要了。
樣本大小是指你在調查、研究或實驗中包括的受試對象數(shù)量。
在對大量人群進行調查時,選擇正確的樣本大小至關重要,因為你不可能向每個人收集數(shù)據。相反,你可以從整個群體中隨機抽取一些人,讓他們代表整個群體。
假設你是一家咖啡店??的老板,你想知道顧客對新推出的「榛果拿鐵??」的喜好程度。你的咖啡店在全國有 500 多家分店,服務超過百萬的的顧客。
顯然,你無法詢問每一位顧客他們對「榛果拿鐵??」的看法,因此你需要進行抽樣調查。
在這個例子中,樣本大小就是你選擇調查的顧客數(shù)量。假設你決定調查 1,000 名顧客。
這 1,000 名顧客需要隨機選擇,以確保他們能夠代表你所有的顧客。這樣,無論是常來的老顧客還是偶爾光顧的新顧客,都有機會被包括在你的調查中。
通過這 1,000 名顧客的反饋,你可以得到一個關于顧客對「榛果拿鐵??」喜好度的大致了解。
比如,如果 750 名顧客表示喜歡這款新飲品,你可以說,在一定的置信水平和置信區(qū)間下,大部分顧客對「榛果拿鐵??」持積極態(tài)度。
這樣的調查結果可以幫助你做出是否繼續(xù)推廣「榛果拿鐵??」或調整食譜的決策。
通過這個過程,我們可以看到,合理的樣本大小對于獲取可靠信息,幫助我們做出更好的決策是非常關鍵的。
二、計算樣本量需要了解什么?
當我們想了解一個大群體的某個特征時,通常不可能問遍每個人,這時候就需要抽樣調查。
但怎么確保我們抽取的這一小撮人能代表整個群體呢?這就需要用到幾個關鍵概念:置信區(qū)間、置信水平、人口規(guī)模和標準差。
1)置信區(qū)間(Confidence interval)
置信區(qū)間就像是給我們的調查結果劃定一個合理的誤差范圍(margin of error)。
比如,我們在母親節(jié)調查了一群杭州的朋友,發(fā)現(xiàn) 65% 的人計劃給母親買禮物,置信區(qū)間是 ±2.75%。
這就像是說,我們非常有信心(但不是 100% 確定)真實的比例會落在 63.25% 到 67.75% 之間。
想象一下,你用尺子量東西,但尺子上的刻度有點模糊,所以你會說這個長度大概在 9 到 11 厘米之間,這個“大概”就類似置信區(qū)間。
2)置信水平(Confidence level)
置信水平告訴我們這個“大概”有多靠譜。
如果置信水平是 95%,那就像是說,如果我們進行 20 次獨立的同樣調查,有 19 次的結果都會落在那個置信區(qū)間內。
這就像是你重復 20 次測量,19 次的結果都在 9 到 11 厘米之間。
3)人口規(guī)模(Population size)
人口規(guī)模就是你研究對象的總數(shù)。
比如全杭州人就是你的研究對象,那人口規(guī)模就是杭州的總人口數(shù)。
4)標準差(Standard Deviation)
標準差是衡量數(shù)據變化的一種方式。
如果大家的回答的選項都差不多,那標準差就??;如果大家的回答參差不齊,標準差就大。標準差小,你需要的樣本量就會少一些;標準差大,你需要更多樣本來確保調查結果的準確性。
當我們把這些因素結合起來,就可以計算出需要多大的樣本量才能讓我們的調查結果既準確又有信心。
如果我們不希望誤差太大,就需要更多的樣本;如果能容忍較大的誤差,樣本量可以少一些。
當然,如果調查的問題非常關鍵,比如涉及到重大決策,我們就會希望誤差盡可能小,這時就需要更多的樣本來確保結果的可靠性。
三、如何計算樣本量的大???
要計算樣本大小,了解如何使用 Z 分數(shù)和樣本大小公式是關鍵。即使你不知道總體的確切規(guī)模,這些信息仍然可以幫助你確定需要多少樣本來進行有效的調查或研究。
1. 什么是 Z 分數(shù)(Z-score)?
Z 分數(shù)是統(tǒng)計學中的一個概念,它表示你的分數(shù)距離平均值有多少個標準差。在計算樣本大小時,Z 分數(shù)代表了你想要的置信水平。
常見的置信水平有 90%,95%,和 99%,它們對應的 Z 分數(shù)分別大約是 1.645, 1.96, 和 2.576。
這里面我們需要使用到「正態(tài)分布Z值表」來幫助我們進行查找,下面是完整的表,可以存起來后面方便使用。
正態(tài)分布 Z 值表怎么看呢?
比如,我們想要找到置信水平為 90% 的時候,Z 分數(shù)是多少?(說明:你只知道置信水平是 90%,但不知道相應的 Z 分數(shù)是 1.645)
1)理解置信水平與 Z 分數(shù)的關系
90% 的置信水平意味著中間覆蓋了總體的 90%,留下兩端各占 5%(100% – 90% = 10%,兩端各占一半,所以是 5%)。
在標準正態(tài)分布中,這意味著你需要找到累積概率為 95%(50% + 45%)的 Z 分數(shù)。因為從最左端到中間覆蓋了 50%,再加上從中間到你的 Z 點的 45%。
同樣的,可以知道 95% 和 99% 應該通過以下數(shù)字查表:
- 95% → 5%/2 = 2.5% → 97.5%
- 99% → 1%/2 = 0.5% → 99.5%
2)使用Z分數(shù)表
在正態(tài)分布 Z 值表中,你通常會找到累積概率(從最左側開始計算的面積),或者從平均值到 Z 點的累積概率。你需要找到累積概率接近 95% 的 Z 分數(shù)。
3)查找累積概率
在正態(tài)分布 Z 值表中,找到累積概率最接近 95% 的條目。通常的表類型會是從最左側到 Z 值的累積概率,意味著是從標準正態(tài)分布的最左端(理論上是負無窮大)到特定 Z 值的累積概率。你需要在表中,找的是 0.9500 左右的值。
注意,還有另外一種表是顯示從平均值到Z點的累積概率,即從標準正態(tài)分布的平均值(Z = 0)到特定Z值的累積概率。如果屬于這種情況,你應該找接近 45%(或 0.4500)的值。
我所演示內容是前者,直接找接近 0.9500 左右的值就可以。
4)確定 Z 分數(shù)
找到對應的行和列,然后沿著這行和列確定交點,你就可以找到對應的 Z 分數(shù)。如果表是從最左側到 Z 點的累積概率,你會找到累積概率為 0.9500 左右的 Z 分數(shù)。
從表中,我們可以看出 95% 存在于 1.64 到 1.65 之間,所以我們找到中間值,Z 分數(shù)就等于 1.645。
所以,置信區(qū)間為 90%,Z 分數(shù)為 1.645。
同樣,置信水平 95% 和 99%,也可以通過對照表找到相應的 Z 分數(shù)。
2. 使用樣本量公式計算
計算樣本大小時,你需要知道以下幾點信息:
1)置信水平(Z 分數(shù)):你需要多大的置信度?這決定了你的 Z 分數(shù)。
2)預期的效應大?。≒):這通常是你希望能夠檢測到的最小變化或差異。假設我們沒有先驗知識,通常使用 P = 0.5 作為保守估計,因為這會給出最大的樣本大小。
3)標準差(e):預期答案的變化范圍。如果你不確定,可接受的誤差范圍 e 可以用 0.05(即 5%)作為一個保守估計。
一旦你有了這些信息,就可以使用樣本大小公式來計算所需的樣本量。樣本大小公式可以幫助你根據上述因素確定需要調查多少人,以確保你的調查結果既有統(tǒng)計意義又具備代表性。
以一個簡化的公式為例,樣本大小可以用下面的公式估計:
如果你不知道總體規(guī)模,這個公式可以給出一個不考慮總體大小的樣本估計。這個方法特別適用于大總體,因為當總體規(guī)模非常大時,樣本大小不太受總體大小的影響。
假設我們要計算的情景如下:
- 置信水平是 95%,所以 Z = 1.96
- 預計效應大?。ū壤㏄ = 0.5
- 可接受的誤差范圍 e = 0.05(即 5%)
我們將這些值代入公式中:
N = (1.962 × 0.5 × (1 – 0.5)) / 0.052 = 384.16
根據計算,當置信水平為 95%,預期效應大小為 0.5,且可接受的誤差范圍為 5% 時,所需的樣本大小大約為 384.16。
在實踐中,我們通常會取整數(shù),因此需要約 384 或 385 個樣本來滿足這些條件。這意味著如果你進行調查或實驗,你需要至少 384 名參與者來確保你的結果具有統(tǒng)計意義。
以上。
專欄作家
龍國富,公眾號:龍國富,人人都是產品經理專欄作家,CxHub主理人。致力于終身學習和自我提升,分享用戶研究、客戶體驗、服務科學等領域資訊,觀點和個人見解。
本文原創(chuàng)發(fā)布于人人都是產品經理,未經授權,禁止轉載。
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!