O2O商戶運(yùn)營(yíng)成效評(píng)價(jià):因子分析

3 評(píng)論 61572 瀏覽 89 收藏 11 分鐘
🔗 产品经理的核心价值是能够准确发现和满足用户需求,把用户需求转化为产品功能,并协调资源推动落地,创造商业价值

因子分析主要用于分析商戶O2O運(yùn)營(yíng)數(shù)據(jù),了解商家的行為信息,找出數(shù)據(jù)背后的共性,最終對(duì)商家進(jìn)行綜合評(píng)價(jià),挖掘商家特點(diǎn)。

應(yīng)用背景

獲得企業(yè)所屬的商戶O2O運(yùn)營(yíng)數(shù)據(jù)后,通過分析它們?cè)谝欢螘r(shí)間內(nèi)的線上線下行為信息,找出這些變量的共性,降低分析維度,對(duì)商戶進(jìn)行綜合評(píng)價(jià),可以知道產(chǎn)品運(yùn)營(yíng)效果是否達(dá)到預(yù)期。

分析方法

因子分析(探索結(jié)構(gòu),簡(jiǎn)化數(shù)據(jù),綜合評(píng)價(jià))

分析工具

SPSS(數(shù)據(jù)分析的重量級(jí)應(yīng)用,與SAS二選一)

實(shí)例:100個(gè)商戶的O2O運(yùn)營(yíng)數(shù)據(jù)

一、基礎(chǔ)知識(shí)講解

因子分析的目的是什么?

  1. 探索結(jié)構(gòu):在變量之間存在高度相關(guān)性的時(shí)候,我們希望用較少的因子數(shù)目來概括其信息。
  2. 簡(jiǎn)化數(shù)據(jù):把原始變量轉(zhuǎn)化為因子后,使用因子得分進(jìn)行分析,比如聚類分析、回歸分析等。
  3. 綜合評(píng)價(jià):通過每個(gè)因子得分計(jì)算出綜合得分,對(duì)分析對(duì)象進(jìn)行綜合評(píng)價(jià)。

因子分析的步驟

  1. 判斷數(shù)據(jù)是否適合因子分析
  2. 構(gòu)造因子變量
  3. 利用銀子旋轉(zhuǎn)方法使得因子更有實(shí)際意義
  4. 計(jì)算每個(gè)個(gè)案的因子得分

如何判斷數(shù)據(jù)是否適合因子分析?

  1. 因子分析的變量要求為連續(xù)變量,分類變量不適合直接進(jìn)行因子分析。
  2. 建議個(gè)案?jìng)€(gè)數(shù)為變量個(gè)數(shù)的5倍以上,這只是參考值,不是絕對(duì)標(biāo)準(zhǔn)。
  3. KMO檢驗(yàn)統(tǒng)計(jì)量:小于0.5時(shí)不適合因子分析;大于0.5小于0.7時(shí),尚可以接受因子分析;大于0.7小于0.8時(shí),比較適合因子分析;大于0.8時(shí)非常適合因子分析。

二、如何展開因子分析?

不瞎說,直接開干。

【描述】

勾選“KOM和巴特利特球形度檢驗(yàn)”,目的是用于生成檢驗(yàn)因子分析適合度的統(tǒng)計(jì)指標(biāo)。

【提取】

方法選擇“主成分”,這是最常用的提取因子的方法;

勾選“碎石圖”,用于輔助判斷因子個(gè)數(shù)。

【旋轉(zhuǎn)】

選擇“最大方差法”,用于更好的解釋因子所包含的意義。

最大方差法師最常用的,該方法能夠使每個(gè)變量盡可能的在一個(gè)引子上有較高的載荷,在其余因子上載荷較低,從而方便對(duì)因子進(jìn)行解釋。

【得分】

勾選“保存為變量”,方法選擇“回歸”,用于保存計(jì)算的到的因子得分。

【選項(xiàng)】

勾選系數(shù)顯示格式中的“按大小排序”,是為了讓系數(shù)大小有序,方便觀察;勾選“排除小系數(shù)”,輸入0.4,這樣在結(jié)果中相關(guān)系數(shù)小于0.4的會(huì)被排除,不再顯示,也是為了方便觀察(因?yàn)槲覀兪菍ふ蚁嚓P(guān)系數(shù)高的)

注意:這里不必生搬硬套,也不必也定時(shí)0.4,可視具體情況而定

分析結(jié)果解讀:

該結(jié)果主要用來檢驗(yàn)數(shù)據(jù)是否適合因子分析,主要參考KMO統(tǒng)計(jì)量即可。

KMO統(tǒng)計(jì)量為0.627,大于0.5小于0.7,尚可以接受因子分析。

這個(gè)結(jié)果是“變量共同度”,顯示了原始變量能被提取的因子解釋的程度。

本例中所有變量共同度都在60%以上,可以認(rèn)為所提取的因子對(duì)各變量的解釋能力是可以接受的。

該圖是“總方差解釋”,顯示了通過分析所提起的因子數(shù)量,以及所提取的因子對(duì)所有變量的累計(jì)方差貢獻(xiàn)率。

累計(jì)方差貢獻(xiàn)率大于60%,則說明因子對(duì)變量的解釋能力尚可接受,達(dá)到80%,說明因子對(duì)變量的解釋能力非常好。

本例根據(jù)“初始特征值”大于1的標(biāo)準(zhǔn)提取了兩個(gè)因子,旋轉(zhuǎn)之后累計(jì)方差貢獻(xiàn)率達(dá)到72.367%,因子的解釋能力較好。

碎石圖”能輔助我們判斷最佳因子個(gè)數(shù),通常是選區(qū)取現(xiàn)中比較陡峭的位置所對(duì)應(yīng)的因子個(gè)數(shù)。

本例前三個(gè)音字都在較陡峭的曲線上,所以提取2~~3個(gè)因子都可以對(duì)原始變量有較好的解釋。

如何確定提取的因子個(gè)數(shù)?

  1. 初始特征值(總方差解釋圖)大于1的因子個(gè)數(shù)
  2. 累計(jì)方差貢獻(xiàn)率(總方差解釋圖)達(dá)到一定水平的因子個(gè)數(shù)(如60%)
  3. 碎石圖中處于陡峭曲線上的對(duì)應(yīng)因子個(gè)數(shù)。
  4. 根據(jù)經(jīng)驗(yàn)或研究,指定個(gè)數(shù)。

這是旋轉(zhuǎn)之前的因子載荷矩陣,難以對(duì)因子進(jìn)行明確定義,可以忽略不看,直接看旋轉(zhuǎn)后的因子載荷矩陣。

“旋轉(zhuǎn)后的成分矩陣”顯示的是旋轉(zhuǎn)后的因子載荷矩陣,這個(gè)結(jié)果能夠凸顯因子含義。

第一個(gè)因子:載荷較大的變量是“網(wǎng)店瀏覽量”、“論壇瀏覽量”、“線上廣告費(fèi)用”、“實(shí)體店訪客數(shù)”,說明這四個(gè)變量與該因子的相關(guān)程度較高,其中前三個(gè)是反映的是線上數(shù)據(jù),“實(shí)體店訪客數(shù)”放映的雖然是線下數(shù)據(jù),但是與第一個(gè)因子呈現(xiàn)反向關(guān)系。綜上所述可以吧第一個(gè)因子命名為“線上商務(wù)”。

第二個(gè)因子:載荷較大的是“實(shí)體店鋪貨數(shù)”、“線下廣告費(fèi)用”、“地面推廣引入量”,說明這個(gè)變量與因子的先關(guān)程度較高,并且反映的都是線下情況。綜上所述可以命名為“線下商務(wù)”。

注意:系數(shù)是按我們?cè)O(shè)置的降序排列,并且有的為空,是因?yàn)槲覀冊(cè)O(shè)置的排除小于0.4的系數(shù)是因子結(jié)果更加清晰,可讀。

這個(gè)圖沒什么卵用,忽略不計(jì)。

新生成了兩個(gè)變量就是每個(gè)商戶在兩個(gè)因子上的得分:第一個(gè)因子的得分,第二個(gè)因子的得分。

三、如何計(jì)算綜合得分?

下面我們計(jì)算綜合得分。

公式:第一個(gè)因子占的加權(quán)比重?cái)?shù)*第一個(gè)因子得分+第二個(gè)因子占的加權(quán)比重?cái)?shù)*第二個(gè)因子得分

本例中旋轉(zhuǎn)后的方差解釋圖知:

因子1貢獻(xiàn)率為38.968%,因子2貢獻(xiàn)率為33.399,累積貢獻(xiàn)率為72.367

所以因子1占的加權(quán)比重?cái)?shù)=38.968/72.367

因子2所占的加權(quán)比重?cái)?shù)=33.399/72.367

對(duì)綜合得分進(jìn)行將序排列,就能知道哪些商戶在O2O的運(yùn)營(yíng)方式下表現(xiàn)優(yōu)異。

知道了那些商家表現(xiàn)優(yōu)異,那些商戶表現(xiàn)比較差,就可以進(jìn)行后的詳細(xì)分析,以提升企業(yè)的商業(yè)價(jià)值,達(dá)到某些商業(yè)目的。

 

作者:膝蓋哥,是一枚“跪著提需求”的產(chǎn)品經(jīng)理。常說“不用不用,真的不用了,我跪著就好!”

本文由 @膝蓋哥 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 天書。。。

    來自廣東 回復(fù)
  2. 啊哈哈哈哈

    回復(fù)
  3. 看不懂。。

    回復(fù)
专题
19130人已学习13篇文章
在B端产品设计中,数据的筛选是其中必不可少的一个步骤。本专题的文章提供了B端数据筛选查询的设计思路。
专题
13045人已学习12篇文章
数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的数据中通过算法搜索隐藏于其中信息的过程。本专题的文章分享了如何挖掘数据。
专题
36525人已学习15篇文章
击溃顾客最后的心理防线,让他们心甘情愿按下购买按钮。
专题
12220人已学习12篇文章
构建UGC社区是很多社区平台的必经之路,它能助力平台内容生产,为社区提供活水源泉。本专题的文章分享了如何构建UGC社区。
专题
14636人已学习12篇文章
数据库对于产品经理来说是一个既熟悉又陌生的概念,虽然产品设计中的数据基本都要与数据库交互,但平时的工作中也很少接触到数据库的具体操作和细节。本专题的文章分享了数据库的基础知识。