說(shuō)透數(shù)據(jù)建設(shè)的四大核心能力
數(shù)字化轉(zhuǎn)型這個(gè)概念相信大多數(shù)人都不陌生,那么,你知道如果想做好數(shù)字化轉(zhuǎn)型,需要做好哪方面的內(nèi)容嗎?答案之一,便是數(shù)據(jù)建設(shè)。怎么理解數(shù)據(jù)建設(shè)之于數(shù)字化轉(zhuǎn)型的重要性,以及數(shù)據(jù)建設(shè)中的核心能力?一起來(lái)看看本文的分享。
開篇語(yǔ)
近代人類文明的飛速發(fā)展和社會(huì)面貌的改變,要從開啟工業(yè)時(shí)代的蒸汽機(jī)發(fā)明說(shuō)起,隨著工業(yè)革命,人類開啟了技術(shù)變革經(jīng)濟(jì)、技術(shù)變革政治乃至技術(shù)變革生活的技術(shù)變革歷程。從工業(yè)時(shí)代到電子時(shí)代,再到信息時(shí)代,逐步走進(jìn)了如今這個(gè)數(shù)字化和智能化的時(shí)代。不管是全球經(jīng)濟(jì)大勢(shì),還是國(guó)家頂層設(shè)計(jì)發(fā)文,言必談及“數(shù)字化轉(zhuǎn)型”這樣一個(gè)熱門詞匯。
數(shù)字化轉(zhuǎn)型,又包含哪些核心內(nèi)涵呢?答案是數(shù)據(jù)。如果做不好數(shù)據(jù)建設(shè),數(shù)字化轉(zhuǎn)型就如同無(wú)根之木,無(wú)源之水,因此,數(shù)字化轉(zhuǎn)型必先做好數(shù)據(jù)建設(shè)。
一、數(shù)字化轉(zhuǎn)型
1. 什么是數(shù)字化轉(zhuǎn)型
下面這段話摘自MBA智庫(kù)的“數(shù)字化轉(zhuǎn)型”詞條解釋:
數(shù)字化轉(zhuǎn)型是指順應(yīng)新一輪科技革命和產(chǎn)業(yè)變革趨勢(shì),不斷深化應(yīng)用云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能、區(qū)塊鏈等新一代信息技術(shù),激發(fā)數(shù)據(jù)要素創(chuàng)新驅(qū)動(dòng)潛能,打造提升信息時(shí)代生存和發(fā)展能力,加速業(yè)務(wù)優(yōu)化升級(jí)和創(chuàng)新轉(zhuǎn)型,改造提升傳統(tǒng)動(dòng)能,培育發(fā)展新動(dòng)能,創(chuàng)造、傳遞并獲取新價(jià)值,實(shí)現(xiàn)轉(zhuǎn)型升級(jí)和創(chuàng)新發(fā)展的過(guò)程。
從大背景上來(lái)說(shuō),為什么“數(shù)字化轉(zhuǎn)型”浪潮正在席卷全球呢?
簡(jiǎn)言之,數(shù)字化轉(zhuǎn)型已成為企業(yè)適應(yīng)數(shù)字經(jīng)濟(jì),謀求生存發(fā)展的必然選擇。特別是對(duì)于中國(guó),經(jīng)歷連續(xù)高速增長(zhǎng),中國(guó)經(jīng)濟(jì)增長(zhǎng)已經(jīng)由高速增長(zhǎng),轉(zhuǎn)入低速增長(zhǎng)和高質(zhì)量驅(qū)動(dòng)的階段。面對(duì)產(chǎn)業(yè)結(jié)構(gòu)調(diào)整、資源環(huán)境挑戰(zhàn)、數(shù)字技術(shù)與創(chuàng)新帶來(lái)的行業(yè)顛覆與機(jī)遇,中國(guó)企業(yè)逆水行舟,不進(jìn)則退。因此,應(yīng)對(duì)新環(huán)境和新時(shí)代的挑戰(zhàn),企業(yè)轉(zhuǎn)型勢(shì)在必行。
2. 數(shù)字化轉(zhuǎn)型的關(guān)鍵
我們已經(jīng)知道了數(shù)字化轉(zhuǎn)型的重要性和必要性,那么,數(shù)字化轉(zhuǎn)型要成功,關(guān)鍵在于什么呢?人、信息與基礎(chǔ)架構(gòu)。
具體來(lái)說(shuō),數(shù)字化轉(zhuǎn)型要做的就是將人的創(chuàng)造力、由信息衍生的智慧與結(jié)合萬(wàn)物和流程的連接性這三大關(guān)鍵價(jià)值驅(qū)動(dòng)因素匯集起來(lái)。
3. 數(shù)字化轉(zhuǎn)型的相關(guān)技術(shù)
俗話說(shuō):工欲善其事,必先利其器。
那么數(shù)字化轉(zhuǎn)型的“利器”是什么?技術(shù)。
需要哪些技術(shù)?筆者羅列如下。
- 云平臺(tái):基于硬件的服務(wù),提供計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)能力。
- 移動(dòng)化:在綜合通信平臺(tái)基礎(chǔ)上,通過(guò)應(yīng)用、服務(wù)及網(wǎng)絡(luò)三個(gè)層面,實(shí)現(xiàn)管理和服務(wù)的移動(dòng)化、電子化和網(wǎng)絡(luò)化,向社會(huì)提供高效優(yōu)質(zhì)等全方位管理與服務(wù)。
- 物聯(lián)網(wǎng):通過(guò)智能感知、識(shí)別技術(shù)與普適計(jì)算、泛在網(wǎng)絡(luò)的融合應(yīng)用,實(shí)現(xiàn)智能化識(shí)別和管理。
- 人工智能:通過(guò)普通電腦實(shí)現(xiàn)的智能化。
- 網(wǎng)絡(luò)分析:依托網(wǎng)絡(luò)拓?fù)潢P(guān)系,考察網(wǎng)絡(luò)元素的空間及屬性數(shù)據(jù),對(duì)網(wǎng)絡(luò)性能進(jìn)行多方面分析。
- 互聯(lián)網(wǎng)安全:使網(wǎng)絡(luò)系統(tǒng)的硬件、軟件及其系統(tǒng)中的數(shù)據(jù)受到保護(hù)。
- 云計(jì)算:通過(guò)網(wǎng)絡(luò)以按需、易擴(kuò)展的方式獲得所需的服務(wù)。
- SDCI(軟件定義互聯(lián)基礎(chǔ)架構(gòu)):增強(qiáng)數(shù)據(jù)中心虛擬化的收益,提高資源靈活性和利用率。
4. 數(shù)字化轉(zhuǎn)型與數(shù)據(jù)建設(shè)的聯(lián)系
雖然數(shù)字化轉(zhuǎn)型的相關(guān)技術(shù)里并沒有提到大數(shù)據(jù)、數(shù)據(jù)建設(shè)等關(guān)鍵詞,但所提到的云平臺(tái)、云計(jì)算、人工智能等,則是個(gè)個(gè)都離不開數(shù)據(jù)建設(shè)和應(yīng)用。云平臺(tái)所提供的存算能力正是為了數(shù)據(jù)服務(wù)的,云計(jì)算所提供的服務(wù)也大多是以數(shù)據(jù)結(jié)果的方式,而人工智能則是完全的以數(shù)據(jù)為載體的應(yīng)用和服務(wù)。因此,數(shù)據(jù)建設(shè)是數(shù)字化轉(zhuǎn)型這個(gè)系統(tǒng)工程的核心子工程。
二、數(shù)據(jù)建設(shè)
1. 數(shù)據(jù)中臺(tái)
有人說(shuō),在數(shù)字化時(shí)代,數(shù)據(jù)將成為地位等同于黃金、石油等稀缺物質(zhì)資源的新型戰(zhàn)略資源。如果把數(shù)據(jù)比作石油,數(shù)據(jù)最終的價(jià)值變現(xiàn)則是體現(xiàn)在所有會(huì)用到“石油”的場(chǎng)景里。那么數(shù)據(jù)這種“石油”是直接就可以應(yīng)用并產(chǎn)生價(jià)值了嗎?那肯定是不行的,需要“煉油廠”。
“煉油廠”是什么?就是數(shù)據(jù)中臺(tái)。
數(shù)據(jù)將由數(shù)據(jù)中臺(tái)進(jìn)行“采集”->“加工提純”->“分發(fā)應(yīng)用”的整個(gè)鏈路,最終轉(zhuǎn)化為數(shù)據(jù)應(yīng)用或者數(shù)據(jù)服務(wù)提供業(yè)務(wù)價(jià)值。
而在這個(gè)場(chǎng)景里,數(shù)據(jù)中臺(tái)的價(jià)值是什么?
數(shù)據(jù)中臺(tái)的價(jià)值在于——讓數(shù)據(jù)穩(wěn)定持續(xù)地發(fā)揮業(yè)務(wù)價(jià)值,實(shí)現(xiàn)業(yè)務(wù)賦能。
2. 數(shù)據(jù)生產(chǎn)消費(fèi)全鏈路
數(shù)據(jù)生產(chǎn)消費(fèi)全鏈路如下圖所示。
從圖中我們可以知道,要實(shí)現(xiàn)整個(gè)全鏈路的搭建和穩(wěn)定持續(xù)地產(chǎn)生價(jià)值,需要做很多個(gè)模塊的構(gòu)建和協(xié)同,經(jīng)過(guò)進(jìn)一步抽象和提煉,其實(shí)是要依托四大核心能力,分別是:數(shù)據(jù)采集、數(shù)據(jù)開發(fā)、數(shù)據(jù)管理和數(shù)據(jù)應(yīng)用。
3. 數(shù)據(jù)中臺(tái)架構(gòu)
對(duì)于數(shù)據(jù)中臺(tái)架構(gòu),業(yè)界內(nèi)基本上都是大同小異的,這里放一個(gè)相對(duì)標(biāo)準(zhǔn)的以供參考。
4. 四大核心能力
1)數(shù)據(jù)采集
首先,數(shù)據(jù)采集是整個(gè)數(shù)據(jù)全鏈路的源頭。數(shù)據(jù)采集解決的是什么問(wèn)題?數(shù)據(jù)來(lái)源。整個(gè)數(shù)據(jù)鏈路上,到底有哪些數(shù)據(jù)資源可以用來(lái)做加工?獲取這些數(shù)據(jù)資源的時(shí)效性如何,有延遲還是實(shí)時(shí)?這是由數(shù)據(jù)采集決定的,更深一層,這也是由需求和終端業(yè)務(wù)場(chǎng)景所決定的。
為了把這個(gè)問(wèn)題說(shuō)得更清晰一點(diǎn),這里舉個(gè)簡(jiǎn)單的例子。
我們投入了很大的精力和成本,把來(lái)自業(yè)務(wù)系統(tǒng)的訂單數(shù)據(jù)采集做成了實(shí)時(shí)同步(即每當(dāng)業(yè)務(wù)系統(tǒng)中產(chǎn)生了一條新的訂單數(shù)據(jù),馬上就采集過(guò)來(lái)了),但實(shí)際在數(shù)據(jù)應(yīng)用上,不管是看數(shù)(使用數(shù)據(jù)看板等可視化功能)、分析(使用BI等數(shù)據(jù)分析功能)還是取數(shù)(使用自助取數(shù)功能),用戶都僅僅是拉取以月粒度為主的數(shù)據(jù)來(lái)使用,對(duì)數(shù)據(jù)更新的敏感程度最多到天這個(gè)粒度,并且有沒有當(dāng)天的數(shù)據(jù)參與分析,也不是特別重要。
那么這時(shí)候,我就會(huì)發(fā)現(xiàn),至少在數(shù)據(jù)采集這個(gè)工作上,“殺雞”用上了“牛刀”。雖然我們?cè)诩夹g(shù)上很厲害,支持到了實(shí)時(shí)級(jí)別的同步更新,但實(shí)際上投產(chǎn)比很低,并不是一個(gè)好的實(shí)踐。
這個(gè)例子想要說(shuō)明的是,在數(shù)據(jù)采集的實(shí)務(wù)落地上,應(yīng)面向需求制定方案,而不是面向技術(shù)。
除了切合需求本身,想要做好數(shù)據(jù)采集,還需要關(guān)注哪些關(guān)鍵點(diǎn)呢?
① 打破數(shù)據(jù)孤島
在兼顧技術(shù)可行性和成本的情況下,能夠盡可能地連接與業(yè)務(wù)相關(guān)的數(shù)據(jù)資源,是打破數(shù)據(jù)孤島的路徑。除了打通業(yè)務(wù)系統(tǒng)獲取主業(yè)務(wù)流中的數(shù)據(jù)以外,格局還可以放大一些,我們還可以去關(guān)注公司自研系統(tǒng)之外的數(shù)據(jù)來(lái)源,比如公司外采的系統(tǒng)(常見的如SAP的業(yè)財(cái)、ERP、WMS等系統(tǒng))、公司在第三方電商平臺(tái)/渠道上開展了線上業(yè)務(wù)所沉淀在平臺(tái)上的數(shù)據(jù)、公司競(jìng)對(duì)的市場(chǎng)競(jìng)爭(zhēng)數(shù)據(jù)、公司業(yè)務(wù)相關(guān)的流量/信息渠道的聲量、輿情、用戶興趣偏好等非結(jié)構(gòu)化數(shù)據(jù)(如百度搜索、抖音、小紅書等)。
② 解決多源異構(gòu)問(wèn)題
在我們的努力下,數(shù)據(jù)孤島被各個(gè)擊破,隨著數(shù)據(jù)來(lái)源的逐步豐富,數(shù)據(jù)的多源異構(gòu)問(wèn)題浮上水面,這是必須要解決的問(wèn)題,它決定了數(shù)據(jù)效率的上限和數(shù)據(jù)質(zhì)量的下限。
玩過(guò)文明系列電腦游戲的應(yīng)該都知道,在邁向工業(yè)化時(shí)代及工業(yè)化走向成熟時(shí)期的標(biāo)志性事件是什么?零件標(biāo)準(zhǔn)化。這個(gè)道理對(duì)標(biāo)到這里,也是一樣的。解決多源異構(gòu)問(wèn)題的過(guò)程,就是源數(shù)據(jù)標(biāo)準(zhǔn)化的過(guò)程。在數(shù)據(jù)采集環(huán)節(jié)解決多源異構(gòu)問(wèn)題是數(shù)據(jù)標(biāo)準(zhǔn)化工作的第一道關(guān)卡。
③ 源數(shù)據(jù)質(zhì)量管控
說(shuō)到數(shù)據(jù)質(zhì)量,其實(shí)這是整個(gè)數(shù)據(jù)建設(shè)和治理工作中的一個(gè)專題了,甚至可以專門為了管理好數(shù)據(jù)質(zhì)量做一個(gè)系統(tǒng),這屬于數(shù)據(jù)管理的范疇。但為什么把“源數(shù)據(jù)質(zhì)量管控”放到數(shù)據(jù)采集這里來(lái)說(shuō)呢?那是因?yàn)橐WC最終的數(shù)據(jù)質(zhì)量達(dá)標(biāo),源頭是重中之重。就好比污水治理,如果不把控好上游的源頭,下游花重金治理一定是事倍功半的。
怎么做好源數(shù)據(jù)質(zhì)量管控?需要在數(shù)據(jù)同步進(jìn)來(lái)的時(shí)候做好把關(guān)。一些很明顯的數(shù)據(jù)質(zhì)量問(wèn)題,如空值、數(shù)據(jù)取值不合邏輯、數(shù)據(jù)結(jié)構(gòu)混亂等,是很容易發(fā)現(xiàn)的,這一類數(shù)據(jù)一經(jīng)發(fā)現(xiàn)就應(yīng)該拒絕入湖,并且反饋問(wèn)題到業(yè)務(wù)系統(tǒng)的產(chǎn)研團(tuán)隊(duì),明確要求整改,整改完畢后再行補(bǔ)數(shù)。
④ 采集SDK必要性辯證
像字節(jié)跳動(dòng)的火山引擎出品的DataLeap套件,就提供了采集SDK的功能,即用戶可自行配置SDK完成個(gè)性化的數(shù)據(jù)連接和采集入湖。采集SDK做還是不做的必要性,需要具體情況具體分析,需要根據(jù)自身的業(yè)務(wù)需求和場(chǎng)景、數(shù)據(jù)資源分布情況、可投入技術(shù)資源等進(jìn)行辯證后得出結(jié)論。
2)數(shù)據(jù)開發(fā)
對(duì)于數(shù)據(jù)開發(fā),其實(shí)就是需要給出一套工具和規(guī)范來(lái)承載整個(gè)數(shù)據(jù)存儲(chǔ)、計(jì)算和開發(fā)的過(guò)程,并且盡可能使這個(gè)過(guò)程標(biāo)準(zhǔn)化、高效率和可控。
比如在工具層面,很多大廠都已經(jīng)完成了商業(yè)化封裝并提供了一整套數(shù)據(jù)開發(fā)套件,感興趣的同學(xué)可以去搜索DataLeap(火山)、DataWork(阿里)、TBDS(騰訊)等產(chǎn)品白皮書和技術(shù)文檔以作詳細(xì)的對(duì)比和了解。
再比如在工具集成開發(fā)流程和規(guī)范方面,美團(tuán)、嗶哩嗶哩都有被稱為“一體化建?!钡膬?yōu)秀實(shí)踐。
總之,在數(shù)據(jù)開發(fā)這個(gè)能力下,我們關(guān)注的是:
- 數(shù)據(jù)存哪里?遷移和備份怎么搞?
- 整合與完善
- 數(shù)據(jù)建模的規(guī)范性、健壯性和可擴(kuò)展性
- 從業(yè)務(wù)流到數(shù)據(jù)流的抽象與組織
- 數(shù)據(jù)范圍與實(shí)體
- 數(shù)據(jù)分層建模、維度建模等方法論的代碼層落地
- 數(shù)據(jù)開發(fā)的質(zhì)量管控,CodeReview機(jī)制
以上,不一而足。
3)數(shù)據(jù)管理
關(guān)于數(shù)據(jù)管理,又有些什么內(nèi)涵呢?如果有讀者感興趣,希望詳細(xì)了解,筆者推薦一本書《DAMA數(shù)據(jù)管理知識(shí)體系指南》。這本書不僅系統(tǒng)性地把數(shù)據(jù)管理范疇的所有要點(diǎn)做了概述和解析,同時(shí)還是數(shù)據(jù)領(lǐng)域權(quán)威認(rèn)證——數(shù)據(jù)治理工程師(CDGA)證書的教材用書。
筆者對(duì)數(shù)據(jù)管理范疇的關(guān)鍵內(nèi)涵進(jìn)行簡(jiǎn)單介紹。
① 數(shù)據(jù)標(biāo)準(zhǔn)
內(nèi)涵:是指保障數(shù)據(jù)的內(nèi)外部使用和交換的一致性與準(zhǔn)確性的規(guī)范性約束。
應(yīng)用場(chǎng)景:應(yīng)用于數(shù)據(jù)開發(fā)、數(shù)據(jù)質(zhì)量管理,要點(diǎn)如下:
- 基于數(shù)據(jù)標(biāo)準(zhǔn)編制數(shù)據(jù)質(zhì)量規(guī)則,聚焦業(yè)務(wù)域和質(zhì)量問(wèn)題,持續(xù)監(jiān)控應(yīng)用情況。
- 業(yè)務(wù)術(shù)語(yǔ)管理是數(shù)據(jù)標(biāo)準(zhǔn)管理的基礎(chǔ)性工作。
② 數(shù)據(jù)資產(chǎn)管理
內(nèi)涵:對(duì)數(shù)據(jù)資產(chǎn)進(jìn)行規(guī)劃、控制和供給的一組活動(dòng)職能。
兩個(gè)關(guān)鍵環(huán)節(jié):
數(shù)據(jù)資源化:將原始數(shù)據(jù)轉(zhuǎn)變?yōu)閿?shù)據(jù)資源,使數(shù)據(jù)具備一定的潛在價(jià)值,是數(shù)據(jù)資產(chǎn)化的必要前提。以提升數(shù)據(jù)質(zhì)量、保障數(shù)據(jù)安全為工作目標(biāo);包括以下活動(dòng)職能:數(shù)據(jù)模型管理、數(shù)據(jù)標(biāo)準(zhǔn)管理、數(shù)據(jù)質(zhì)量管理、主數(shù)據(jù)管理、數(shù)據(jù)安全管理、元數(shù)據(jù)管理、數(shù)據(jù)開發(fā)管理等
數(shù)據(jù)資產(chǎn)化:將數(shù)據(jù)資源轉(zhuǎn)變?yōu)閿?shù)據(jù)資產(chǎn),使數(shù)據(jù)資源的潛在價(jià)值得以充分釋放。以擴(kuò)大數(shù)據(jù)資產(chǎn)的應(yīng)用范圍、厘清數(shù)據(jù)資產(chǎn)的成本與效益為工作重點(diǎn),并使數(shù)據(jù)供給端與數(shù)據(jù)消費(fèi)端之間形成良性反饋閉環(huán);包括以下活動(dòng)職能:數(shù)據(jù)資產(chǎn)流通、數(shù)據(jù)資產(chǎn)運(yùn)營(yíng)、數(shù)據(jù)價(jià)值評(píng)估等活動(dòng)職能。
作用:逐步提高數(shù)據(jù)價(jià)值密度,奠定數(shù)據(jù)要素化基礎(chǔ)
在實(shí)踐中,我們可以通過(guò)搭建數(shù)據(jù)資產(chǎn)管理系統(tǒng)來(lái)完成企業(yè)級(jí)的數(shù)據(jù)資產(chǎn)管理。數(shù)據(jù)資產(chǎn)管理系統(tǒng)中需要有以下功能模塊:
數(shù)據(jù)資產(chǎn)門戶:
提供全局統(tǒng)計(jì)企業(yè)數(shù)據(jù)資產(chǎn)情況的功能,讓企業(yè)管理者對(duì)數(shù)據(jù)的分布、增長(zhǎng)、使用、質(zhì)量情況有所直觀了解。具體呈現(xiàn)數(shù)據(jù)包括:
- 指標(biāo)統(tǒng)計(jì):數(shù)據(jù)源數(shù)量、表數(shù)量、存儲(chǔ)量、使用量、質(zhì)量評(píng)分。
- 趨勢(shì)統(tǒng)計(jì):數(shù)據(jù)分布、數(shù)據(jù)增長(zhǎng)趨勢(shì)、數(shù)據(jù)使用熱度。
- 數(shù)據(jù)排行:數(shù)據(jù)存儲(chǔ)排行、質(zhì)量規(guī)范排行。
數(shù)據(jù)地圖:
數(shù)據(jù)地圖也可稱為“可視化的數(shù)據(jù)資產(chǎn)中心”,支持查看所有數(shù)據(jù)表,同時(shí)全方位管理數(shù)九資產(chǎn)。具體功能點(diǎn)包括:
- 數(shù)據(jù)查找:匯聚所有數(shù)據(jù)表信息,方便開發(fā)人員快速定位,方便業(yè)務(wù)人員快速查詢,支持依類目、表名、項(xiàng)目、狀態(tài)等篩選和檢索。
- 元數(shù)據(jù)卡片:針對(duì)某張具體的數(shù)據(jù)表,在卡片中展示該表的基本信息,如表名、物理存儲(chǔ)大小、生命周期、分區(qū)信息、字段列表等,同時(shí)支持少量數(shù)據(jù)預(yù)覽。
- 數(shù)據(jù)類目管理:用戶可自定義層級(jí)、名稱并將數(shù)據(jù)表指定到類目節(jié)點(diǎn)上。
- 審批授權(quán):提供表級(jí)別數(shù)據(jù)權(quán)限的管理,當(dāng)用戶需要跨項(xiàng)目訪問(wèn)表時(shí),需通過(guò)審批授權(quán)進(jìn)行權(quán)限申請(qǐng),審批通過(guò)后才可訪問(wèn)。
- 生命周期管理:支持用戶建表時(shí)指定生命周期,定時(shí)檢測(cè)數(shù)據(jù)更新時(shí)間,自動(dòng)清除超效期數(shù)據(jù),釋放存儲(chǔ)空間,降低存儲(chǔ)壓力和成本。
- 數(shù)據(jù)血緣:可自動(dòng)解析同步任務(wù)和SQL代碼,生成表級(jí)別、字段級(jí)別血緣關(guān)系,用戶可查詢每個(gè)指標(biāo)的“來(lái)龍去脈”,便于開發(fā)人員快速定位排查問(wèn)題,業(yè)務(wù)人員深度理解指標(biāo)。
③ 數(shù)據(jù)質(zhì)量
數(shù)據(jù)質(zhì)量是整個(gè)數(shù)據(jù)建設(shè)和治理工作的“可用基線”。不能保證數(shù)據(jù)質(zhì)量的數(shù)據(jù)體系,即使數(shù)據(jù)應(yīng)用建設(shè)得再炫酷,那也是“空中樓閣”,既不可信,也不可用。因此,數(shù)據(jù)質(zhì)量管理是數(shù)據(jù)管理中不可或缺的部分。
我們?nèi)绾魏饬繑?shù)據(jù)質(zhì)量是否達(dá)標(biāo)?看六個(gè)維度:完整性、規(guī)范性、一致性、準(zhǔn)確性、唯一性、及時(shí)性。
我們又該如何開展數(shù)據(jù)質(zhì)量管理工作呢?如下步驟可供參考:
- Step1 計(jì)劃:參考數(shù)據(jù)標(biāo)準(zhǔn)->定義數(shù)據(jù)質(zhì)量規(guī)則庫(kù)->構(gòu)建數(shù)據(jù)質(zhì)量評(píng)價(jià)指標(biāo)體系->制定數(shù)據(jù)質(zhì)量管理策略和計(jì)劃。
- Step2 執(zhí)行:依托工具,管理內(nèi)外部要求、規(guī)則庫(kù)、評(píng)價(jià)指標(biāo)體系->確定業(yè)務(wù)、項(xiàng)目、數(shù)據(jù)范疇,開展質(zhì)量稽核和差異化管理。
- Step3 檢查/分析:記錄稽核結(jié)果,分析問(wèn)題成因,確定責(zé)任人,出具報(bào)告和整改建議。
- Step4 改進(jìn):建立數(shù)據(jù)質(zhì)量管理知識(shí)庫(kù),完善管理流程,提升管理效率,優(yōu)化管理策略。
在數(shù)據(jù)質(zhì)量管理這件事上,我們應(yīng)該遵循兩大原則:源頭治理和閉環(huán)管理。
④ 數(shù)據(jù)安全
數(shù)據(jù)安全也是數(shù)據(jù)管理的一項(xiàng)重頭戲,關(guān)乎整個(gè)企業(yè)的合法合規(guī)紅線。我們?nèi)绾伪U掀髽I(yè)的數(shù)據(jù)安全?通過(guò)包括兩方面的內(nèi)涵:其一是數(shù)據(jù)防外泄;其二是數(shù)據(jù)內(nèi)部共享需合規(guī)。
我們需要做那些工作來(lái)實(shí)現(xiàn)這兩個(gè)內(nèi)涵呢?
宏觀上,我們需要:組織建立數(shù)據(jù)安全治理團(tuán)隊(duì),制定數(shù)據(jù)安全相關(guān)制度規(guī)范,構(gòu)建數(shù)據(jù)安全技術(shù)體系,建設(shè)數(shù)據(jù)安全人才梯隊(duì)等。
實(shí)務(wù)上,我們需要做如下事項(xiàng):
制度規(guī)范類:理解安全需求和監(jiān)管要求并制定制度體系(包括個(gè)人信息保護(hù)管理制度、數(shù)據(jù)分類分級(jí)標(biāo)準(zhǔn)規(guī)范、合規(guī)稽查及安全審計(jì)制度)
技術(shù)體系類:
- 搭建工具,識(shí)別敏感數(shù)據(jù),應(yīng)用分類分級(jí)規(guī)范
- 根據(jù)敏感級(jí)別,部署防控措施(如權(quán)限管控、數(shù)據(jù)脫敏、數(shù)據(jù)防泄漏、安全審計(jì)等)
改進(jìn)執(zhí)行類:總結(jié)問(wèn)題與風(fēng)險(xiǎn),動(dòng)態(tài)評(píng)估規(guī)范適用性、有效性并予以更符合實(shí)務(wù)的調(diào)整,持續(xù)優(yōu)化安全管理過(guò)程。
4)數(shù)據(jù)應(yīng)用
數(shù)據(jù)應(yīng)用是整個(gè)數(shù)據(jù)鏈路的最后一個(gè)關(guān)鍵環(huán)節(jié),同時(shí)也是最重要的,直接與數(shù)據(jù)價(jià)值體現(xiàn)掛鉤的。所有終端的用戶,都是通過(guò)數(shù)據(jù)應(yīng)用來(lái)消費(fèi)數(shù)據(jù),感受數(shù)據(jù)價(jià)值的。
而相比于前三項(xiàng)核心能力,數(shù)據(jù)應(yīng)用能力的最大不同在于:前三項(xiàng)核心能力在業(yè)界相對(duì)有比較固定或通用的做法和方案,而數(shù)據(jù)應(yīng)用能力則是可能呈現(xiàn)“百花齊放”的現(xiàn)象,根據(jù)企業(yè)所處行業(yè)、企業(yè)自身、服務(wù)用戶、業(yè)務(wù)場(chǎng)景等不同而具有不同的形態(tài)。但總的來(lái)說(shuō)可分類以下幾類:
- 面向C端用戶的數(shù)據(jù)產(chǎn)品:比如高德地圖(以地圖為呈現(xiàn)載體的數(shù)據(jù)產(chǎn)品,但其核心能力支撐來(lái)自于數(shù)據(jù)能力的建設(shè))。
- 智能化數(shù)據(jù)產(chǎn)品:比較常見的比如內(nèi)容生成、內(nèi)容推薦、智能商品推薦、AI問(wèn)答機(jī)器人等。
- 可視化數(shù)據(jù)產(chǎn)品:如數(shù)據(jù)門戶、業(yè)務(wù)專題數(shù)據(jù)看板(如銷售域看板)等。
- 分析類數(shù)據(jù)產(chǎn)品:如BI、自助取數(shù)、決策分析系統(tǒng)等。
- 數(shù)據(jù)服務(wù):一般是指將最終的數(shù)據(jù)結(jié)果封裝為API的形式提供給下游應(yīng)用的信息服務(wù)。
結(jié)語(yǔ)
以上內(nèi)容所探討的主要是數(shù)字化轉(zhuǎn)型的概念,數(shù)據(jù)建設(shè)之于數(shù)字化轉(zhuǎn)型的重要性,數(shù)據(jù)建設(shè)中的四大核心能力內(nèi)涵及范圍等內(nèi)容,至于每一項(xiàng)能力具體在應(yīng)用場(chǎng)景上如何構(gòu)建,那又是一整個(gè)從需求到上線的完整過(guò)程和獨(dú)立議題了,后續(xù)筆者會(huì)逐步開專題做詳細(xì)分享。希望本篇文章的內(nèi)容對(duì)你有所幫助和啟發(fā)。
本文由 @maggieC 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!