從零建立賦能業(yè)務(wù)的數(shù)據(jù)中心「邏輯框架」
轉(zhuǎn)崗到業(yè)務(wù)公司新的數(shù)據(jù)團(tuán)隊(duì),需要從零開(kāi)始建立數(shù)據(jù)中心,時(shí)常讓人無(wú)從下手。本文作者結(jié)合自身轉(zhuǎn)崗經(jīng)歷,根據(jù)實(shí)踐中的邏輯思路在文中詳實(shí)舉例,幫助數(shù)據(jù)分析師新人進(jìn)一步學(xué)習(xí)數(shù)據(jù)庫(kù)的應(yīng)用,推薦迷茫中的數(shù)據(jù)分析師閱讀學(xué)習(xí)~
數(shù)據(jù)中心整體的思路是基于現(xiàn)有的業(yè)務(wù)系統(tǒng),接入數(shù)據(jù)后,將模型部署在前端,用于支持業(yè)務(wù)分析場(chǎng)景。
1. 項(xiàng)目目標(biāo)
此次項(xiàng)目希望能與你分享一個(gè)可以賦能業(yè)務(wù)的數(shù)據(jù)中心是如何從零開(kāi)始構(gòu)思設(shè)計(jì)的,不過(guò)這并不是技術(shù)開(kāi)發(fā)中數(shù)據(jù)倉(cāng)庫(kù),而是定位在用于數(shù)據(jù)分析工作的數(shù)據(jù)庫(kù)。
借此機(jī)會(huì),也供剛接觸SQL的朋友,有一個(gè)更貼近業(yè)務(wù)現(xiàn)實(shí)的實(shí)戰(zhàn)案例。
2. 業(yè)務(wù)場(chǎng)景
為簡(jiǎn)化業(yè)務(wù)邏輯,此次案例是基于電商企業(yè),涉及的業(yè)務(wù)部門(mén)有用戶(hù)運(yùn)營(yíng)部門(mén)、及產(chǎn)品部門(mén)。
我經(jīng)常說(shuō)數(shù)據(jù)分析師的價(jià)值在于解決業(yè)務(wù)問(wèn)題,那么此次的數(shù)據(jù)中心項(xiàng)目是在解決什么樣的解決問(wèn)題,以及是如何解決的?我們來(lái)按「以終為始」的思考邏輯來(lái)梳理一番。
一、從業(yè)務(wù)層面思考,需要解決哪些業(yè)務(wù)問(wèn)題
數(shù)據(jù)分析師的價(jià)值在于賦能業(yè)務(wù),所以「數(shù)據(jù)中心」建設(shè)的起點(diǎn)要從終點(diǎn)出發(fā):業(yè)務(wù)需求。
1. 用戶(hù)運(yùn)營(yíng)部門(mén)
隨著電商市場(chǎng)的飽和,現(xiàn)在電商進(jìn)入存量運(yùn)營(yíng)時(shí)期,要求品牌對(duì)存量用戶(hù)進(jìn)行精細(xì)化管理,并實(shí)現(xiàn)業(yè)務(wù)增長(zhǎng)。因此用戶(hù)運(yùn)營(yíng)部門(mén)的需求是用戶(hù)價(jià)值的分層模型,可以幫助業(yè)務(wù)把精力集中在最高收益的人群。與用戶(hù)運(yùn)營(yíng)部門(mén)溝通,明確建立RFM模型對(duì)人群進(jìn)行分層,并形成不同人群的營(yíng)銷(xiāo)策略。
2. 產(chǎn)品部門(mén)
產(chǎn)品部門(mén)的職能大體能分為兩個(gè)方面:一個(gè)是需要前瞻市場(chǎng)的產(chǎn)品開(kāi)發(fā),另一個(gè)是“確保子彈供及”的庫(kù)存管理。與產(chǎn)品部門(mén)溝通后,明確需求是要做「新品分析」,根據(jù)新品的表現(xiàn)情況,調(diào)整生產(chǎn)及庫(kù)存計(jì)劃。簡(jiǎn)單點(diǎn)說(shuō)就是表現(xiàn)好的新品,就多生產(chǎn)/進(jìn)貨,反之則清倉(cāng)處理。
二、從數(shù)據(jù)層面思考,需要解決哪樣的數(shù)據(jù)問(wèn)題
到這一步,已經(jīng)明確了業(yè)務(wù)需求,接下來(lái)要建立能支撐業(yè)務(wù)發(fā)展的數(shù)據(jù)中心。
按數(shù)據(jù)處理流程,可以把數(shù)據(jù)中心分為:落地層、建模層、及數(shù)據(jù)層
1. 落地層
離業(yè)務(wù)最近,是業(yè)務(wù)看得見(jiàn)摸得著的數(shù)據(jù)應(yīng)用,比如在線(xiàn)BI系統(tǒng),業(yè)務(wù)可以直接登錄看到需要的報(bào)表;還可以是數(shù)據(jù)分析報(bào)告,業(yè)務(wù)從報(bào)告中獲得直接的洞察分析及建議;還可以是專(zhuān)項(xiàng)的數(shù)據(jù)分析項(xiàng)目,把通過(guò)分析形成的策略方案在業(yè)務(wù)場(chǎng)景下執(zhí)行,直接實(shí)現(xiàn)增長(zhǎng)。也就是說(shuō),在這一層,需要考慮數(shù)據(jù)分析價(jià)值落地的具體形式。
2. 建模層
建模層和數(shù)據(jù)層都是業(yè)務(wù)部門(mén)不可感知的。建模層是支撐價(jià)值落地的數(shù)據(jù)模型,比如在線(xiàn)BI系統(tǒng)中的報(bào)表,背后復(fù)雜的表間關(guān)系,需要業(yè)務(wù)邏輯和表格模型支撐;數(shù)據(jù)分析報(bào)告背后的洞察分析,需要如帕累托分析、關(guān)聯(lián)算法等數(shù)據(jù)模型支撐。
3. 數(shù)據(jù)層
到這一層,就需要關(guān)注最小顆粒度的數(shù)據(jù),也就是數(shù)據(jù)庫(kù)層面的表格與字段,它們是建模層具體操作的要素。通俗地說(shuō),需要從不同數(shù)據(jù)源中接入業(yè)務(wù)數(shù)據(jù),并通過(guò)同步更新、數(shù)據(jù)清洗等過(guò)程確保數(shù)據(jù)的完整性及準(zhǔn)確性。
三、如何把業(yè)務(wù)需求轉(zhuǎn)為數(shù)據(jù)問(wèn)題
了解完數(shù)據(jù)賦能的三個(gè)層次,回過(guò)頭來(lái)看看如何把業(yè)務(wù)需求轉(zhuǎn)為數(shù)據(jù)問(wèn)題。
1. 用戶(hù)運(yùn)營(yíng)
(1)落地層
業(yè)務(wù)部門(mén)都有KPI指標(biāo),在運(yùn)營(yíng)工作中,需要定期回顧運(yùn)營(yíng)成效及執(zhí)行下一階段的運(yùn)營(yíng)策略。對(duì)業(yè)務(wù)來(lái)說(shuō),運(yùn)營(yíng)策略的落地需要借助觸達(dá)工具:發(fā)短信。因此,「RFM模型」的落地不能只是給出算法模型報(bào)告,而是要以報(bào)表的形式,對(duì)存量用戶(hù)進(jìn)行分群的同時(shí),搭配策略分析工具,并提供用戶(hù)信息下載
根據(jù)業(yè)務(wù)場(chǎng)景,確定可以通過(guò)PowerBI在線(xiàn)報(bào)表的形式,為用戶(hù)運(yùn)營(yíng)部門(mén)提供在線(xiàn)人群分層報(bào)表,并交叉零售行業(yè)常用的「人貨場(chǎng)模型」及「指標(biāo)拆解」作為策略分析工具。
(2)建模層
明確了落地的形式后,需要對(duì)背后的「RFM模型」和「人貨場(chǎng)模型」及「指標(biāo)拆解」進(jìn)行數(shù)據(jù)層面的定義。
- 對(duì)于「RFM模型」來(lái)說(shuō),需要明確分層邏輯,具體包括行為周期、R/F/M的閾值計(jì)算。
- 對(duì)于「人貨場(chǎng)模型」來(lái)說(shuō),在RFM模型已解決「人」層面的分析,需要進(jìn)一步補(bǔ)充:「貨」通過(guò)「產(chǎn)品結(jié)構(gòu)分析」解決,「場(chǎng)」通過(guò)「活動(dòng)周期分析」解決。
- 對(duì)于「指標(biāo)拆解」來(lái)說(shuō),因?yàn)樽罱K是交付給用戶(hù)運(yùn)營(yíng)部門(mén),所以需要盡量從用戶(hù)的角度來(lái)拆解銷(xiāo)售額,比如銷(xiāo)售額 = 新客銷(xiāo)售 + 老客銷(xiāo)售,這樣就符合業(yè)務(wù)關(guān)注的新客指標(biāo)及老客指標(biāo)。
(3)數(shù)據(jù)層
明確了需要開(kāi)發(fā)的數(shù)據(jù)模型,需要對(duì)更細(xì)顆粒度的數(shù)據(jù)庫(kù)表格及字段進(jìn)行設(shè)計(jì)。
- 模型圍繞著用戶(hù)訂單數(shù)據(jù)進(jìn)行,所以至少需要訂單表,包括下單時(shí)間、購(gòu)買(mǎi)商品、購(gòu)買(mǎi)金額、商品件數(shù)等字段。
- 另外,落地層提到用戶(hù)運(yùn)營(yíng)側(cè)的落地需要結(jié)合觸達(dá)工具,所以還需要用戶(hù)表,提供會(huì)員昵稱(chēng)、手機(jī)號(hào)、地址等字段。
2. 產(chǎn)品部門(mén)
(1)落地層
對(duì)于企業(yè)來(lái)說(shuō),產(chǎn)品策略背后的影響因素多且復(fù)雜,比如市場(chǎng)培育、公司戰(zhàn)略等。也就是說(shuō),對(duì)于數(shù)據(jù)部門(mén)來(lái)說(shuō),做的新品分析或許更多只是輔助工作,供產(chǎn)品部門(mén)參考新品表現(xiàn)。此外,與產(chǎn)品部門(mén)溝通業(yè)務(wù)流程時(shí),他們還提及日常還會(huì)用數(shù)據(jù)部門(mén)提供的表格做二次分析。
根據(jù)此業(yè)務(wù)場(chǎng)景,確定可以通過(guò)Metabase平臺(tái)的形式做在線(xiàn)報(bào)表,業(yè)務(wù)部門(mén)能在平臺(tái)上下載數(shù)據(jù)的同時(shí),也可以在線(xiàn)做透視分析。
此場(chǎng)景其實(shí)為了介紹Metabase平臺(tái)設(shè)計(jì)的,該工具在解決業(yè)務(wù)們自助取數(shù),及簡(jiǎn)單BI報(bào)表方面很實(shí)用??梢韵韧ㄟ^(guò)官網(wǎng)了解:www.metabase.com。后面會(huì)有具體的教程出來(lái)。
(2)建模層
明確了以報(bào)表形式提供新品分析后,需要考慮新品分析背后的表格模型,可以結(jié)合「存銷(xiāo)分析」來(lái)實(shí)現(xiàn),即分析新品的銷(xiāo)售與庫(kù)存之前的相關(guān)指標(biāo),體現(xiàn)新品表現(xiàn)。
(3)數(shù)據(jù)層
銷(xiāo)售及庫(kù)存相關(guān)的指標(biāo)分析,需要用到訂單表、庫(kù)存表,除了用戶(hù)運(yùn)營(yíng)提及的訂單字段外,還需要貨品批次號(hào)、數(shù)量等庫(kù)存字段。
至此,我們完成了從業(yè)務(wù)需求出發(fā),到落地層、建模層及數(shù)據(jù)層的倒推,形成了數(shù)據(jù)賦能業(yè)務(wù)的整體框架:
(后續(xù)會(huì)豐富此框架)
四、從執(zhí)行層面思考,把框架落地
接下來(lái),需要逆著第二步的思考邏輯,形成執(zhí)行計(jì)劃。
1. 數(shù)據(jù)層
- 建立數(shù)據(jù)庫(kù)模型:從業(yè)務(wù)模型、概念模型到物理模型。
- 新建數(shù)據(jù)庫(kù),并從數(shù)據(jù)源(業(yè)務(wù)系統(tǒng))接入存量數(shù)據(jù)。
- 通過(guò)存儲(chǔ)過(guò)程同步增量數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)動(dòng)態(tài)更新。
- SQL SERVER代理完成定時(shí)任務(wù):執(zhí)行ETL、定期備份。
2. 建模層
- RFM模型在用戶(hù)運(yùn)營(yíng)中的落地。
- 如何進(jìn)行新品分析。
3. 落地層
- RFM模型在PowerBI的部署落地
- Metabase的安裝及應(yīng)用案例:存銷(xiāo)分析
接下來(lái)會(huì)按照上述計(jì)劃,逐步實(shí)現(xiàn)數(shù)據(jù)中心的落地。
本文由 @餅干哥哥 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!