當(dāng)toB產(chǎn)品經(jīng)理遇到數(shù)據(jù)分析

1 評(píng)論 7795 瀏覽 44 收藏 20 分鐘
🔗 产品经理的职业发展路径主要有四个方向:专业线、管理线、项目线和自主创业。管理线是指转向管理岗位,带一个团队..

編輯導(dǎo)語(yǔ):toB產(chǎn)品經(jīng)理不僅需要與設(shè)計(jì)師打交道,還需要和數(shù)據(jù)分析打交道。當(dāng)你在業(yè)務(wù)方面遭受到了瓶頸,這時(shí)候就需要用分析自己的產(chǎn)品的數(shù)據(jù)變化,因此toB產(chǎn)品經(jīng)理該如何做好數(shù)據(jù)分析呢?

對(duì)于我來(lái)講,我本身是學(xué)的軟件工程,后來(lái)從事產(chǎn)品經(jīng)理,作為toB端的產(chǎn)品經(jīng)理,可能最爽的點(diǎn)在于設(shè)計(jì)軟件的過(guò)程中,能把業(yè)務(wù)吃透,面對(duì)龐大的業(yè)務(wù)體系和復(fù)雜的邏輯,很難讓自己在專(zhuān)業(yè)方面沒(méi)有提升。

但是在經(jīng)歷面向的大多數(shù)是大客戶和領(lǐng)導(dǎo)層面的人之后,難免會(huì)產(chǎn)生枯燥的感覺(jué)和到達(dá)瓶頸的挫敗感,因?yàn)榇蠖鄶?shù)情況下,toB產(chǎn)品不需要?jiǎng)?chuàng)新,不需要美感,更不需要突然爆發(fā)的靈感,需要的是對(duì)客戶業(yè)務(wù)場(chǎng)景的深入調(diào)研和理解,強(qiáng)調(diào)的是客戶的價(jià)值。

在toC端數(shù)據(jù)分析一片紅海的情況下,toB在此領(lǐng)域倒是顯得有些呆萌,說(shuō)到底,toB的產(chǎn)品對(duì)于數(shù)據(jù)分析這項(xiàng)技能用的很少甚至不會(huì)用到。

但是,在經(jīng)歷了上述心路歷程之后,也會(huì)有新的發(fā)現(xiàn),那就是在toB端工作久了,越來(lái)越發(fā)現(xiàn)對(duì)于政策的把控和對(duì)于民生發(fā)展的趨勢(shì)的把握顯得十分重要,然而在公司的背景下,對(duì)于有些東西是現(xiàn)成的,直接拿來(lái)上手去做就可以,這就導(dǎo)致了對(duì)自身思維的禁錮。

但是哪怕假設(shè)假如以后會(huì)創(chuàng)業(yè)(每一個(gè)產(chǎn)品都有一顆創(chuàng)業(yè)的心),對(duì)于數(shù)據(jù)分析來(lái)講也是寫(xiě)好計(jì)劃書(shū)的一小部分不可忽視的技能,所以當(dāng)toB遇到數(shù)據(jù)分析未嘗不能擦出一些火花。

后續(xù)會(huì)更新更加詳細(xì)的步驟包括用到的工具。

以下內(nèi)容均來(lái)自一個(gè)初步認(rèn)知數(shù)據(jù)分析的toB產(chǎn)品的總結(jié):

數(shù)據(jù)分析大致可以分為以下幾個(gè)步驟:

  1. 問(wèn)題工程:得到什么結(jié)果
  2. 信源工程:數(shù)據(jù)從哪來(lái)
  3. 數(shù)據(jù)工程:也可以叫數(shù)據(jù)處理(為了格式一致就叫那個(gè)名字吧),目的是得到“好”數(shù)據(jù)
  4. 特征工程:從哪些維度入手
  5. 模型工程:標(biāo)簽應(yīng)該怎么分析
  6. 展示工程:結(jié)果怎么呈現(xiàn)

最后,講好一個(gè)故事,一個(gè)可以將上述步驟都包含進(jìn)去的故事。

一、問(wèn)題工程

問(wèn)題工程簡(jiǎn)單來(lái)講就是想要得到什么結(jié)果。什么樣的曲調(diào)決定了歌詞情感動(dòng)向,如果在一開(kāi)始就沒(méi)有想清楚到底研究的是什么問(wèn)題,或者沒(méi)有一個(gè)明確地主旨的話,那么后面所做的東西都用不上(簡(jiǎn)稱(chēng):垃圾)。所以第一步雖然是最簡(jiǎn)單的,卻也是最重要的。

二、信源工程

1. 信源劃分

可以將信源劃分為信息發(fā)布者、行業(yè)類(lèi)型、所屬地域和網(wǎng)站類(lèi)型這幾個(gè)維度。

(1)信源類(lèi)型

①信息發(fā)布者

可以分為UGC(個(gè)人)、PGC(專(zhuān)業(yè)生產(chǎn)內(nèi)容)、OGC(職業(yè)生產(chǎn)內(nèi)容)。

信息發(fā)布者類(lèi)型:

行業(yè)類(lèi)型:

  • 保險(xiǎn)業(yè)
  • 能源
  • 餐飲
  • 電訊業(yè)
  • 房地產(chǎn)
  • 服務(wù)業(yè)
  • 服裝業(yè)
  • 公益組織
  • 廣告業(yè)
  • 航空航天
  • 化學(xué)
  • 健康
  • 保健
  • 建筑業(yè)
  • 教育
  • 培訓(xùn)
  • 計(jì)算機(jī)
  • 農(nóng)業(yè)
  • 旅游業(yè)
  • 律師
  • 體育運(yùn)動(dòng)
  • 演藝
  • 醫(yī)療服務(wù)
  • 設(shè)計(jì)
  • 金融
  • 交通運(yùn)輸業(yè)
  • 咨詢(xún)等等行業(yè)

所屬地域:

可以按省市劃分,按國(guó)家劃分等。

網(wǎng)站類(lèi)型:

例如咨詢(xún)、社交、百科、視頻、百度經(jīng)驗(yàn)、企業(yè)類(lèi)。

再細(xì)化一點(diǎn)比如電商的分類(lèi):

  • 綜合類(lèi):淘寶、天貓、京東、蘇寧
  • 飲食類(lèi):美團(tuán)、餓了么
  • 鍛煉類(lèi):keep、薄荷健康
  • 旅游類(lèi):大眾點(diǎn)評(píng)、攜程、去哪兒

2. 數(shù)據(jù)類(lèi)型的劃分

還是舉個(gè)例子,對(duì)于電商來(lái)講,包括但不限于:產(chǎn)品名稱(chēng)、任務(wù)數(shù)據(jù)、動(dòng)態(tài)數(shù)據(jù)(評(píng)論數(shù)、轉(zhuǎn)發(fā)數(shù))、轉(zhuǎn)發(fā)數(shù)據(jù)、收藏量。

3. 定位有價(jià)值的信源基本步驟

第一步:讀題,解析命題

第二步:拓開(kāi)思路,列出信源可能的來(lái)源

第三步:按照第二步的列表去篩選需采集的信源和數(shù)據(jù)

第四步:在已采集的數(shù)據(jù)中再次精加工,得到有價(jià)值的基礎(chǔ)數(shù)據(jù)

*商品類(lèi)的分析一定會(huì)需要商品售賣(mài)的數(shù)據(jù)、商品的描述、商品的口碑、品牌的口碑等等,所以電商數(shù)據(jù)、評(píng)論數(shù)據(jù)、口碑?dāng)?shù)據(jù)、微博數(shù)據(jù)這些不可或缺。

*事件類(lèi)的分析一定會(huì)有官媒數(shù)據(jù)、民眾討論的數(shù)據(jù)等等,所以,資訊數(shù)據(jù)、微博、貼吧、論壇這些數(shù)據(jù)不可或缺。

*行業(yè)類(lèi)的分析一定會(huì)有行業(yè)專(zhuān)業(yè)網(wǎng)站、國(guó)家政策、行業(yè)論壇等等,所以,需要找的就是專(zhuān)業(yè)性論壇、專(zhuān)業(yè)網(wǎng)站、官方站點(diǎn)、可能還需要toB站點(diǎn)的相關(guān)數(shù)據(jù)。

4. 從信源得到數(shù)據(jù)

收集信源我一般會(huì)用火狐,因?yàn)闀?huì)有好用的插件。 注:在用Python爬蟲(chóng)時(shí)可以根據(jù)可以根據(jù)網(wǎng)址的規(guī)律提取連接。

火狐的插件

信源可以根據(jù)列表頁(yè)和正文頁(yè)獲取,信源的獲取過(guò)程中有以下情形:

  • 正常的信源頁(yè),我們從源碼中就可以看到可以采集的正文頁(yè)鏈接,非常好提取。
  • 有嵌套的信源頁(yè),這種直接看源碼是看不到正文頁(yè)的,需要我們找到正確的列表頁(yè),比如下圖的某政府網(wǎng)站,需要點(diǎn)開(kāi)真正的列表。

  • 信源頁(yè)中的正文頁(yè)鏈接是需要拼接的
  • 信源頁(yè)中有多條信息,需要從中直接提取每條數(shù)據(jù)的字段的(例如:搜索引擎頁(yè)面)
  • 需要登錄的
  • 其他一些做特殊配置的

其實(shí)可以思考一下,按照網(wǎng)站類(lèi)型可以將以下情景的信源劃分為哪些維度,并給出合適的數(shù)據(jù)(網(wǎng)站)來(lái)源。

  1. 分析天津市針對(duì)人工智能專(zhuān)業(yè)博士的需求情況
  2. 分析互聯(lián)網(wǎng)上針對(duì)綜藝節(jié)目《乘風(fēng)破浪的姐姐》節(jié)目評(píng)價(jià)及該節(jié)目的受眾人群

以下只是簡(jiǎn)單提供一種思路:

第一個(gè)場(chǎng)景按照網(wǎng)站類(lèi)型可以將信源劃分為判決文書(shū)、電商類(lèi)、資訊類(lèi)、行政處罰、企業(yè)工商注冊(cè)數(shù)據(jù)、百度經(jīng)驗(yàn)、企業(yè)類(lèi)、法院類(lèi)、百科等這些維度。

第一個(gè)情景分析天津市針對(duì)人工智能專(zhuān)業(yè)博士的需求情況:

首先組合幾個(gè)維度分析,所屬地域限定在北京,行業(yè)類(lèi)型限定為人工智能,信息發(fā)布者為PGC內(nèi)容,網(wǎng)站類(lèi)型為行業(yè)專(zhuān)業(yè)網(wǎng)站、國(guó)家政策和行業(yè)論壇,進(jìn)一步定位有價(jià)值的信源,就要從專(zhuān)業(yè)性論壇、專(zhuān)業(yè)網(wǎng)站、官方站點(diǎn)、toB站點(diǎn)獲取相關(guān)數(shù)據(jù)

第二個(gè)情景分析互聯(lián)網(wǎng)上針對(duì)綜藝節(jié)目《乘風(fēng)破浪的姐姐》節(jié)目評(píng)價(jià)及該節(jié)目的受眾人群:

首先組合幾個(gè)維度分析,行業(yè)類(lèi)型定位在娛樂(lè)和影視,信息發(fā)布者UGC和PGC都要分析,因?yàn)閷儆谑录?lèi)的分析,主要分析節(jié)目評(píng)價(jià)及該節(jié)目的受眾人群。

所以就要有官媒數(shù)據(jù)、民眾討論的數(shù)據(jù)、民眾自身年齡的數(shù)據(jù)等,所以網(wǎng)站類(lèi)型要從資訊和社交兩個(gè)方面分析,例如從《乘風(fēng)破浪的姐姐》官方微博、貼吧、論壇找出這些數(shù)據(jù)。

三、數(shù)據(jù)工程(數(shù)據(jù)處理)

1. 數(shù)據(jù)結(jié)構(gòu)化

將數(shù)據(jù)整理成能看的結(jié)構(gòu):

數(shù)據(jù)結(jié)構(gòu)化:

  • 傳播力分析:標(biāo)題、出處、發(fā)布時(shí)間
  • 人物畫(huà)像:微博人物字段
  • 消費(fèi)者人物畫(huà)像:評(píng)論字段
  • 汽車(chē)指標(biāo):汽車(chē)網(wǎng)站字段
  • 電商人物畫(huà)像:消費(fèi)習(xí)慣

2. 數(shù)據(jù)處理

其實(shí)上學(xué)的時(shí)候也學(xué)過(guò)很多數(shù)據(jù)處理的知識(shí),有各種插值法,回歸,聚類(lèi)等方式處理數(shù)據(jù),但凡有一點(diǎn)在腦子里,我也不至于重新學(xué)。不過(guò)基本的我還是印象深刻的:

(1)數(shù)據(jù)清洗

主要是刪除原始數(shù)據(jù)集中的無(wú)關(guān)數(shù)據(jù)、重復(fù)數(shù)據(jù),平滑噪聲數(shù)據(jù),處理缺失值、異常值等,讓數(shù)據(jù)變得“干凈”。

(2)缺失值處理

處理缺失值的方法可分為三類(lèi):刪除記錄、數(shù)據(jù)插補(bǔ)和不處理。其中常用的數(shù)據(jù)插補(bǔ)方法見(jiàn)下表:

其中,插值有兩個(gè)比較重要的是拉格朗日插值和牛頓插值。

(3)異常值處理

(4)數(shù)據(jù)變換

主要是對(duì)數(shù)據(jù)進(jìn)行規(guī)范化的操作,將數(shù)據(jù)轉(zhuǎn)換成“適當(dāng)?shù)摹备袷?,以適用于挖掘任務(wù)及算法的需要。會(huì)涉及到歸一化處理、屬性構(gòu)造、小波變換等方式,從而達(dá)到數(shù)據(jù)使用的標(biāo)準(zhǔn)。

(5)數(shù)據(jù)規(guī)約

數(shù)據(jù)規(guī)約是將海量數(shù)據(jù)進(jìn)行規(guī)約,規(guī)約之后的數(shù)據(jù)仍接近于保持原數(shù)據(jù)的完整性,但數(shù)據(jù)量小得多。通過(guò)數(shù)據(jù)規(guī)約,可以達(dá)到:

  • 降低無(wú)效、錯(cuò)誤數(shù)據(jù)對(duì)建模的影響,提高建模的準(zhǔn)確性
  • 少量且具代表性的數(shù)據(jù)將大幅縮減數(shù)據(jù)挖掘所需的時(shí)間
  • 降低儲(chǔ)存數(shù)據(jù)的成本

數(shù)據(jù)規(guī)約會(huì)對(duì)屬性和數(shù)值兩個(gè)方面進(jìn)行(具體的我也忘得差不多了),但是講真,簡(jiǎn)單的數(shù)據(jù)分析(給自己看的數(shù)據(jù)分析)不會(huì)進(jìn)行到這一步的。

3. 數(shù)據(jù)建模

這塊到后面會(huì)詳細(xì)說(shuō)一下,因?yàn)橐坏┱归_(kāi)就真的太多了。大概會(huì)有聚類(lèi)、分類(lèi)、關(guān)聯(lián)、回歸、時(shí)序模式、離群點(diǎn)檢測(cè)等。

四、特征工程/數(shù)據(jù)分析

分析可以從以下幾個(gè)方面入手:

  1. 關(guān)注點(diǎn):分析用戶使用情境中的核心訴求,用戶在產(chǎn)品購(gòu)買(mǎi)使用中最關(guān)注什么?影響用戶選擇的關(guān)鍵要素
  2. 用戶場(chǎng)景:產(chǎn)品問(wèn)題是在什么情況下發(fā)生的
  3. 產(chǎn)品抱怨:用戶集中反饋的產(chǎn)品缺陷,用戶對(duì)產(chǎn)品的主要抱怨是什么?
  4. 競(jìng)品分析:與競(jìng)品對(duì)比的主要差距,產(chǎn)品哪些地方不如競(jìng)品?

選擇對(duì)用戶體驗(yàn)和銷(xiāo)售最有價(jià)值的產(chǎn)品改進(jìn)方向,實(shí)現(xiàn)產(chǎn)品有效優(yōu)化。

1. 關(guān)注點(diǎn)

聚焦資源,主動(dòng)讓顧客選擇,不讓顧客思考。

  • 關(guān)注點(diǎn)提及分析
  • 判斷用戶關(guān)注點(diǎn)(四象限圖)

用戶產(chǎn)品需求分析:分析用戶對(duì)本品類(lèi)產(chǎn)品使用的最主要功能性能要求。

用戶購(gòu)買(mǎi)因素分析:監(jiān)測(cè)本品類(lèi)產(chǎn)品用戶認(rèn)知度對(duì)比關(guān)系。

2. 用戶抱怨

(1)類(lèi)型

非投訴型抱怨:不會(huì)直接抱怨但是會(huì)向其他人傳遞不好

投訴型抱怨:產(chǎn)品的不好會(huì)直接反饋回來(lái)

(2)用戶抱怨分析

  • 用戶對(duì)產(chǎn)品的主要抱怨是什么?
  • 用戶集中反饋的產(chǎn)品缺陷有哪些?
  • 這些言論在哪些媒體出現(xiàn)?

①不同維度的PSR和NSR

  • PSR=正面/(正+負(fù))
  • NSR=負(fù)面/(正+負(fù))

②用戶抱怨實(shí)時(shí)監(jiān)測(cè)分析(四象限圖)

3. 應(yīng)用場(chǎng)景

什么人在什么時(shí)間、地點(diǎn),帶著什么樣的情緒、動(dòng)機(jī),通過(guò)什么行為來(lái)滿足什么要求。

這里有四個(gè)因素:用戶(用戶所屬的群體、所帶有的角色標(biāo)簽)、需求(核心)、行為(用戶采取什么行為滿足需求)、情景。

要時(shí)刻思考應(yīng)用的意義,其實(shí)慢慢的又回歸到了產(chǎn)品經(jīng)理的思路上來(lái)了,所以數(shù)據(jù)分析有時(shí)離不開(kāi)產(chǎn)品思維,比如要思考:

  • 誰(shuí)是產(chǎn)品的目標(biāo)用戶?他們的核心需求是什么?
  • 在特定場(chǎng)景下,是什么讓他們決定使用或者放棄使用一款產(chǎn)品?

toB只在乎用著順不順手:

toC在乎多方面:

每個(gè)環(huán)節(jié)都要有場(chǎng)景:

用戶場(chǎng)景梳理方法:

4. 競(jìng)品分析

(1)找到競(jìng)品top3-5,核心1-2個(gè)

(2)排除非競(jìng)品:關(guān)聯(lián)詞相似度,話題討論

(3)判斷競(jìng)爭(zhēng)強(qiáng)度 各維度提及次數(shù)

(4)案頭研究:價(jià)格

(5)輿情指數(shù)分析:消費(fèi)者情感偏好和討論聲量判斷優(yōu)劣勢(shì)構(gòu)建四象限圖 橫坐標(biāo)討論聲量,縱坐標(biāo)PSR,四個(gè)維度分別是基本產(chǎn)品、優(yōu)勢(shì)產(chǎn)品、小眾產(chǎn)品、劣勢(shì)產(chǎn)品。

(6)各維度進(jìn)行抱怨度NSR分析

五、模型工程

根據(jù)RFM模型和NSR、PSR模型進(jìn)行分析,這一點(diǎn)我也會(huì)單獨(dú)拎出來(lái)做出一個(gè)文章詳細(xì)寫(xiě)一下。

六、展示工程/數(shù)據(jù)可視化

工具可以用PowerBI,也可以用Python,Python還是很萬(wàn)能的,而且python有很多現(xiàn)成的包,直接導(dǎo)入直接用,各種好看的分析圖都有,我將單獨(dú)寫(xiě)一章介紹python的可視化分析。

1. 數(shù)據(jù)標(biāo)簽可視化

2. 例子(PowerBI)

(1)進(jìn)行數(shù)據(jù)的拆分(年月日、性別等等)

(2)數(shù)據(jù)分組

(3)數(shù)據(jù)的篩選

例如:性別統(tǒng)計(jì)。

3. 地域統(tǒng)計(jì)、自我認(rèn)知詞云

4. 頁(yè)面大小的調(diào)整

5. 標(biāo)簽數(shù)據(jù)的可視化

四級(jí)標(biāo)簽的可視化,設(shè)置二級(jí)標(biāo)簽的篩選器,詞云圖可以設(shè)置不顯示某些詞。

七、最重要的就是講故事

具體怎么講,我打算放在后面的文章去說(shuō)明,因?yàn)檫@篇文章就是一個(gè)小概括而已,也是大概梳理了一下近期學(xué)習(xí)的思路。

作為toB端的產(chǎn)品經(jīng)理有些人覺(jué)得著實(shí)是沒(méi)必要研究這些,我一開(kāi)始也是這樣覺(jué)得,但是我越學(xué)習(xí)就會(huì)越發(fā)現(xiàn)數(shù)據(jù)分析的思路其實(shí)是離不開(kāi)產(chǎn)品的思維,產(chǎn)品的思維也能從數(shù)據(jù)分析的思路中得到靈感加以開(kāi)闊,因?yàn)槲覀兊哪繕?biāo)不是一直做產(chǎn)品經(jīng)理,而是去到更大的平臺(tái)更高的地方去看這個(gè)世界。

沒(méi)有人一拿起來(lái)這件東西馬上就能上手去做的,除非天賦異稟,但是大多數(shù)人都是在一步步泥濘中摸爬滾打過(guò)來(lái)的,我是想說(shuō),接受自己平凡,并不斷向前,就已經(jīng)贏過(guò)絕大多數(shù)的人了,因?yàn)榭偸菚?huì)有人自命不凡。

 

本文由 @別動(dòng)我的可樂(lè) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 寫(xiě)的很好!??????

    來(lái)自廣東 回復(fù)