指標(biāo)生命周期管理
本文旨在通過(guò)分享一系列從實(shí)踐出發(fā)的方法和策略,解決指標(biāo)管理中的混亂問(wèn)題,提升業(yè)務(wù)與數(shù)據(jù)團(tuán)隊(duì)的工作效率。我們將探討如何規(guī)范指標(biāo)的上線、使用和下線流程,以確保數(shù)據(jù)的準(zhǔn)確性和一致性,從而幫助企業(yè)更好地做出決策和優(yōu)化業(yè)務(wù)流程。
前幾天一個(gè)同學(xué)前來(lái)訴苦,說(shuō)他們公司指標(biāo)太混亂了,一大堆相似的指標(biāo),每次用起來(lái)都要花大量的時(shí)間去確認(rèn)到底該用哪一個(gè)。時(shí)不時(shí)就會(huì)出現(xiàn)彼此對(duì)不齊的情況,業(yè)務(wù)部門(mén)滿意度不高,數(shù)據(jù)部門(mén)也比較痛苦。受到這個(gè)的啟發(fā),決定把之前處理類似問(wèn)題的經(jīng)驗(yàn)總結(jié)下來(lái),希望對(duì)大家有所幫助
一、指標(biāo)上線
一個(gè)指標(biāo)上線前,要明確指標(biāo)的各種元數(shù)據(jù)信息,其中包含指標(biāo)中英文名稱,指標(biāo)類型(原子、派生、復(fù)合),指標(biāo)等級(jí)(業(yè)務(wù)、安全),指標(biāo)分類(業(yè)務(wù)、主題、標(biāo)簽),指標(biāo)負(fù)責(zé)人(DS、DE、業(yè)務(wù))和指標(biāo)口徑(業(yè)務(wù)、技術(shù))。以上都是最基本的指標(biāo)元數(shù)據(jù)信息,實(shí)際在業(yè)務(wù)落地中,可能還會(huì)配置支持查詢的數(shù)據(jù)源、指標(biāo)支持的維度等。
這些的核心是要保證指標(biāo)的規(guī)范和標(biāo)準(zhǔn),具體的操作方式和需要注意的點(diǎn)舉例如下:
- 指標(biāo)命名:指標(biāo)命名要有遵循一定的規(guī)范,避免出現(xiàn)有的指標(biāo)用中文“安卓”,有的指標(biāo)用英文“Android”,這樣的情況
- 默認(rèn)含義:一些默認(rèn)的含義要提前預(yù)定好,避免出現(xiàn)歧義。例如時(shí)間指標(biāo)單位有的是分鐘有的是秒,如果默認(rèn)是秒,那指標(biāo)單位是分鐘的時(shí)候就需要進(jìn)行特別標(biāo)識(shí)。再比如曝光默認(rèn)是指只要1個(gè)像素曝光就算,如果是有效曝光(不同情況下,有效曝光的定義也可能不同)要特別說(shuō)明。
二、指標(biāo)使用
指標(biāo)上線之后,就要開(kāi)始對(duì)指標(biāo)各方面的情況進(jìn)行例行監(jiān)控,發(fā)現(xiàn)問(wèn)題及時(shí)處理,以免影響業(yè)務(wù)。
1. 使用量監(jiān)控
對(duì)指標(biāo)的使用情況進(jìn)行分時(shí)間段監(jiān)控,例如配置近30天、90天、180天指標(biāo)的使用情況的報(bào)表,最好包含指標(biāo)中英文名稱、業(yè)務(wù)負(fù)責(zé)人、數(shù)據(jù)負(fù)責(zé)人和被引用次數(shù)等信息。如果之前沒(méi)做過(guò)指標(biāo)的清理下線,并且業(yè)務(wù)也發(fā)展了一段時(shí)間,可能會(huì)發(fā)現(xiàn)多數(shù)指標(biāo)使用的頻率非常低甚至都沒(méi)有使用(之前出現(xiàn)過(guò)近30天,70%多的指標(biāo)都沒(méi)有被使用),這些指標(biāo)是應(yīng)該被識(shí)別和處理的。
2. 一致性監(jiān)控
一個(gè)指標(biāo)的業(yè)務(wù)口徑往往可以明確且唯一,但技術(shù)口徑可能會(huì)存在多個(gè)。例如一個(gè)指標(biāo)在Hive中有,同時(shí)也在StarRocks中有,正常情況下不同數(shù)據(jù)源不同表中出來(lái)的數(shù)據(jù)應(yīng)該是相同的。但實(shí)際在使用過(guò)程中,難免會(huì)出現(xiàn)數(shù)據(jù)對(duì)不齊的情況,這時(shí)就需要檢查哪個(gè)數(shù)據(jù)源出現(xiàn)了問(wèn)題,保障不同數(shù)據(jù)源不同表產(chǎn)出的同一個(gè)指標(biāo)的數(shù)據(jù)是一致的。
三、指標(biāo)下線
隨著業(yè)務(wù)的發(fā)展,指標(biāo)覆蓋的場(chǎng)景越來(lái)越多,粒度也往往會(huì)越來(lái)越細(xì),同時(shí)一些業(yè)務(wù)口徑也會(huì)進(jìn)行調(diào)整,這樣就會(huì)使得指標(biāo)的數(shù)量會(huì)越來(lái)越多。指標(biāo)數(shù)量的膨脹不僅浪費(fèi)存儲(chǔ)資源,也會(huì)在使用時(shí)造成更多的困惑,我們不得不花時(shí)間去區(qū)分一些相近的指標(biāo),進(jìn)而確認(rèn)具體使用哪個(gè)指標(biāo)。
基于這樣的情況,我們要形成指標(biāo)下線的流程,具體觸發(fā)下線的標(biāo)準(zhǔn)可以基于業(yè)務(wù)和數(shù)據(jù)量決定。如果現(xiàn)在業(yè)務(wù)在初期,數(shù)據(jù)量也并不大,可以把下線閾值放大一些,如果現(xiàn)在數(shù)據(jù)存儲(chǔ)壓力大,或者在使用的時(shí)候相近的指標(biāo)已經(jīng)造成比較大的困擾,這時(shí)可以把閾值設(shè)置的小一些。
當(dāng)確認(rèn)一些指標(biāo)要下線時(shí),不能簡(jiǎn)單粗暴的刪除,這里主要要考慮兩個(gè)方面。
一是因?yàn)橛械闹笜?biāo)可能業(yè)務(wù)只是暫時(shí)不用,其實(shí)以后還會(huì)用到。例如有些指標(biāo)只在階段性評(píng)估時(shí)使用,這樣就造成使用間隔比較久,但確實(shí)是需要使用的。
二是還可能存在一些對(duì)當(dāng)前指標(biāo)的依賴,如果刪除會(huì)造成一些報(bào)錯(cuò)。例如有的報(bào)表使用了該指標(biāo),刪除后可能會(huì)造成報(bào)表整體異?;虿糠之惓?。同時(shí)一些復(fù)合指標(biāo)使用了該指標(biāo),例如ctr = 點(diǎn)擊數(shù)/曝光數(shù),如果刪除了曝光數(shù),ctr也會(huì)出問(wèn)題。
結(jié)合具體的業(yè)務(wù)情況,具體處理的方案有很多,這里提供一個(gè)之前使用的方案共大家借鑒:
- 業(yè)務(wù)溝通:和業(yè)務(wù)進(jìn)行溝通,明確指標(biāo)是否還需要繼續(xù)使用,如果反饋不需要進(jìn)行第二步
- 指標(biāo)下線:對(duì)指標(biāo)進(jìn)行下線處理,下線意味著不能再基于指標(biāo)新增報(bào)表和指標(biāo),但之前使用到指標(biāo)的地方不受影響,還可以進(jìn)行進(jìn)行查詢。這一步相當(dāng)于關(guān)閉入水口。
- 指標(biāo)刪除:對(duì)使用到下線指標(biāo)的地方進(jìn)行刪除或者替換,完成后對(duì)指標(biāo)進(jìn)行刪除,刪除前最好使用郵件或者群聊的方式周知相關(guān)方
上面聊到的都是具體處理問(wèn)題的方案,但更重要的是方案的執(zhí)行,要讓大家都嚴(yán)格按照一套規(guī)則去做事,其實(shí)有的時(shí)候更難,后面有機(jī)會(huì)再詳細(xì)聊聊如何推進(jìn)落地。
本文由 @暮雪云然 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)
- 目前還沒(méi)評(píng)論,等你發(fā)揮!