四千字全面解析數(shù)據(jù)產(chǎn)品經(jīng)理必知概念:標簽、維度、指標
編輯導(dǎo)語:作為產(chǎn)品經(jīng)理,很多行業(yè)概念都需要一一了解,本篇文章作者分享了產(chǎn)品經(jīng)理必知概念——標簽、維度、指標的相關(guān)內(nèi)容,分析了其概念以及與各個方面的聯(lián)系,一起來學(xué)習(xí)一下吧。
最近一直在講數(shù)據(jù)產(chǎn)品的基礎(chǔ)概念,我發(fā)現(xiàn)可以把這些基礎(chǔ)概念進行串講了。
今天,我就來重點講講:標簽、維度、指標。在開始講之前,我想定個調(diào):抽象的詞,再怎么用文字解釋也解釋不清,我也無意構(gòu)建對這些詞的標準化的定義。
希望讀者朋友們能跟我一樣,借用費曼學(xué)習(xí)法,構(gòu)建對這些抽象概念的理解。
一、什么是標簽
標簽,是為了描述事物、區(qū)分事物的某種縮略代指。
我們?nèi)粘1磉_里,經(jīng)常說的一個詞是:貼標簽。生動又形象,有一種貼便簽紙、或者給某個人貼紙條的感覺。
比如,做完核酸檢測,小朋友往自己身上貼一個冰墩墩的卡通標簽。
人人都可以創(chuàng)標簽。
比如,每個人都可以用文字描述自己看到下面這兩段話的感受:
我家門口有兩棵樹,一棵是棗樹,另一棵也是棗樹。
情況就是這么個情況,具體什么情況,還是要相關(guān)部門介入去了解實際情況。
諸如「廢話文學(xué)」、「沒營養(yǎng)」等等,而這些描述性的內(nèi)容,都可以用來打標簽。
再比如,產(chǎn)品經(jīng)理回老家,如何給非互聯(lián)網(wǎng)人的親戚介紹自己呢?
你可以這么介紹:我們這些小經(jīng)理,完全不管人只負責做事兒,搞互聯(lián)網(wǎng)的起了這么個名兒也就是為了好聽,天天加班干活,跟廠里其他普通員工一樣的。
「不管人」、「只負責做事兒」、「為了好聽」、「天天加班」、「跟廠里其他普通員工一樣」,就可以提煉出來幾個標簽,給自己貼上。
標簽比較具體,比較隨意。
標簽也是用來做區(qū)分和描述的,標簽可以隨意、很散裝,可以很有創(chuàng)意性,也可以很有特異性,可以很長,也可以很短。
「不出遠門過五一」、「來拍照了」這些個標簽放一起,就很有代表性了。
其實,任何描述性的文本,都可以作為標簽。它可以是成語,也可以是詞語,也可以是不完整的句子。
只不過,為了簡潔性、易讀性、傳播性,我們通常會用更加短小精悍的文字來描述一類東西,觀點更鮮明,更有穿透性。
甚至也可以是形象、圖片、符號,也能是標簽。一個笑臉、一個紅心、一個太陽就能代表很多很多,一圖勝千言。當然,每個人都有自己的解讀。
另外提前說一句,標簽和維度值的概念重疊度比較高。
二、什么是維度
大家常說,物以類聚人以群分。
一個自然而然的邏輯是:先有物和人,再有類和群。
面對新事物,人類最自然的反應(yīng)是將其描述出來,或者代指。對應(yīng)到標簽和維度上的話,一般來說,都是先打標簽,再分類。
比如,印第安人的由來,其實哥倫布團隊以為他們到了印度,然后用了這么個很像的詞去命名的。印第安人稱呼自己,大概也是印第安語的「俺們、咱們」,他們稱呼哥倫布,可能也是老外。
我們習(xí)慣性會對事物進行打標簽,但是當我們碰到了太多的新種類的東西,打的標簽太多之后,這個時候要繼續(xù)區(qū)分,就要整理和歸總,就得要有「類」和「群」了。
維度是什么呢?簡單理解就是上文的「類」和「群」。建立維度,其實是歸納歸類,繼續(xù)做了一層抽象。
最簡單的維度,是二元的:是/否。比如,測過核酸 / 沒測過核酸。
1. 維度是靈活變通的,可以持續(xù)細化,不同維度可以相互組合的
為了講清楚維度,我不得不再引入一個相關(guān)的詞,粒度。
粒度,其實就是描述事物、事情過程的細致程度。
為了更細粒度的分類描述,我們可以利用更多不同的前后綴修飾詞創(chuàng)建新的維度。
就拿測核酸這個事情來舉例。
假如一開始只區(qū)分是否測過核酸,后來病毒持續(xù)演進,抗疫成了持久戰(zhàn),后來開始區(qū)分時間:近30天、近7天、近3天是否測過核酸。
后續(xù)為了更加精細化防控,再加上來小區(qū)的維度,那就變成:A 小區(qū)近 7 天是否測過核酸、B 小區(qū)近 3 天是否測過核酸。
2. 維度之間也可以合并和歸總
正向可以,反之亦然,我們也可以將細粒度的維度合并成更粗的維度。
如果一開始就高瞻遠矚,基于現(xiàn)實情況,設(shè)定了較為貼切的粒度,將統(tǒng)計的維度設(shè)置為近N天、小區(qū)、是否測核酸。
后續(xù)抗疫效果顯著,粒度不需要再那么細,只需要按照月份、城市進行統(tǒng)計的時候,這些維度也可以歸總:月份、城市、是否測過核酸。
3. 維度的下鉆和上卷
按照很多文章的說法,這個兩個模塊叫做維度的下鉆和上卷。
但是,下鉆和上卷比較抽象,我比較建議大家通過實際例子來構(gòu)建自己的理解。
其實可以看到,維度和粒度之間相互影響、相互解釋:維度越多,粒度越細。
為了方便,也可以將常見的特別細粒度的維度組合,合并成一個新的維度進行統(tǒng)稱。
任何維度的設(shè)定,以及維度的下鉆和上卷,都是基于我們想了解什么粒度的信息。
三、什么是指標
我們?nèi)粘I罾?,會聽到很多的故事。有的故事很豐富,很精確,而有的故事,則很模糊,很朦朧。
豐富、精確,其實描述層面是模糊和朦朧的。
一個事情到底多好多賴,要基于某個標準或者數(shù)據(jù)進行明確的衡量、確定的度量(度量也是一個常見的詞哈)。
指標,是為了客觀量化某些事物,一般用數(shù)據(jù)表示。
比如下屬給老板匯報:老板,這個季度我們的用戶增長率很高,達到了200%!老板反問,具體多少人呢?下屬答曰:從 1000 到 3000 !
有了用數(shù)據(jù)描述的指標,這種一般性描述就真的很精確了,反映客觀事實了。
四、差別和聯(lián)系
維度和標簽的差別,之前說過了,可以看這篇文章:數(shù)據(jù)產(chǎn)品經(jīng)理必看知識:標簽和維度
這篇文章重點討論維度、標簽和指標之間的聯(lián)系和差別。
- 差別是:維度、標簽用于分類,指標用于量化。
- 聯(lián)系是:維度、標簽和指標需要一起出現(xiàn)、共同描述客觀事物和過程。
如果只有光光的指標,什么維度和標簽都沒有,那讀者可以腦補維度,或者自動認為是認知范圍里面的全部。
比如,北京奧運會總?cè)藬?shù)是 23452 人。
大家就會疑問了:哪屆奧運會?這個總?cè)藬?shù)指的是什么人?運動員還是開幕式演職人員?
而下面這個就比較清晰了:
北京冬奧會中國代表團總?cè)藬?shù)為 387 人,其中運動員 176 人,教練員、領(lǐng)隊、科醫(yī)人員等運動隊工作人員 164 人,團部工作人員 47 人(標黃的是指標,下劃線部分是標簽或者維度值)。
五、為什么會出現(xiàn)標簽
為什么會出現(xiàn)標簽?
有時候數(shù)據(jù)很簡單,窮舉很容易。
比如,冬奧會獎牌榜上(金牌)前三名分別是:挪威隊(16枚)、德國(12枚)、中國(9枚)。
但有時候,數(shù)據(jù)很多,且大家不想知道全部的細節(jié)。比如,只關(guān)注中國美國,這時候少廢話,直接概括:中國隊排前三,美國隊不在前三。
很多時候,數(shù)據(jù)是離散的、無限的,或者說樣本極大的時候,近乎無限。
比如,全國的的身高、體重,樣本的數(shù)據(jù)就很多了,十幾億數(shù)據(jù),怎么描述呢?
「一覽眾山小」、「怎么吃都不胖」就是大家很容易理解的描述。
不同的標簽,概括的粗細粒度不一樣。
標簽組合越多,概括的粒度就越細(和維度是一樣的)。
很多事物,是可以被直接度量的。比如,一個板凳多長多寬多高、一個學(xué)期幾個月幾天、籃子里有幾個雞蛋。
但是,有的事物是沒法直接度量的,比如顏值。
這時候,只能通過另外的事物去間接度量。并且,我們要抽象和總結(jié),去概括。
一個人很漂亮,多漂亮?粗暴地分兩個標簽:漂亮,不漂亮。
小李(萊昂納多,電影《盜夢空間》的男主角)走在路上,碰到 100人, 99 人回頭看他,漂亮不?
另一個小李也走在路上,碰到 100個人, 1 人回頭看 ta,漂亮不?
多少人回頭,是客觀的,但是到底漂不漂亮,每個人心里都會有主觀答案的。
標簽也可以通過某些標簽的基礎(chǔ)上,繼續(xù)劃定更細區(qū)間的方式進行定義。
這個層面,標簽和維度是類似的。
六、看待這些概念的兩個視角
光講概念,不結(jié)合數(shù)據(jù)產(chǎn)品的實際應(yīng)用,也是沒用的。所以在這個模塊,我?guī)е蠹覐臉I(yè)務(wù)、技術(shù)兩個視角來看更多的例子。
1.?業(yè)務(wù)視角
業(yè)務(wù)視角簡單來說,就是給普通人描述一件事情。大家不要被我?guī)牧?,問我什么是「業(yè)務(wù)」,不糾結(jié)哈。
比如,我們看到某個新聞:A 集團本季度 GMV 增長率為 45%,發(fā)展緩慢。
公式版本:
GMV 增長率 = (本季度 GMV – 上季度 GMV) 上季度GMV
(后續(xù)用GMV代指 A 集團本季度GMV)
2. 技術(shù)視角
技術(shù)視角,則是給計算機描述一件事。
比如,我們要將剛剛說的規(guī)則、共識,翻譯成技術(shù)語言。
這里,我給出偽代碼版本(SQL什么的,我就不寫了):gmv_growth = (cur_gmv – last_gmv )/ last_gmv 。
3. 兩者的聯(lián)系
標簽的技術(shù)定義,來源于標簽的業(yè)務(wù)定義。
再來舉例,標簽和指標的關(guān)系。
當然,這里的例子,僅僅是舉例哈,沒結(jié)合行業(yè)特性,也沒說具體粒度和維度。
七、一個虛擬的例子來理解這些概念
拿我非常熟悉的視頻、直播來給大家舉例吧(這些例子都是虛構(gòu)的)。
隨著硬件、互聯(lián)網(wǎng)、移動網(wǎng)絡(luò)、移動支付的發(fā)展,某視頻網(wǎng)站 Dilidili 開始上線了。
D 站借鑒了其他的網(wǎng)站,上線的時候就開發(fā)了點贊、評論、打賞服務(wù)。也對內(nèi)容進行了劃分:番劇、科技、娛樂、體育、資訊、時尚。
網(wǎng)站開始有了第一個UP主上傳了視頻,有了第一個觀眾,觀眾看完視頻:留下了評論,哇, 太真實了吧,太搞笑的吧,說的就是我吧。
數(shù)據(jù)分析師和產(chǎn)品經(jīng)理,在上線的時候就制定了初版的指標體系,定了很多維度和指標,比如不同地區(qū)、不同品類、不同年齡段人群的觀看時長、觀看次數(shù)、觀看人數(shù)、打賞人數(shù)等等。
大的角度,會分幾個:內(nèi)容供給(上傳視頻數(shù)、有效播放視頻數(shù)、直播人數(shù)、次數(shù)等)、內(nèi)容消費(觀看停留時長等)、金錢消費(營收維度)
當然了,當中的一些指標,產(chǎn)品經(jīng)理們也會讓 UP 主們在后臺也能看到,以便調(diào)整自己的視頻內(nèi)容和方向。
后來為了精準地基于用戶喜好(用戶觀看歷史、觀看不同品類的時長、次數(shù)等指標),產(chǎn)品經(jīng)理增加了新功能:UP主上傳視頻的時候可以帶一些關(guān)鍵詞,也就是給視頻打標簽。
這個功能發(fā)布后,其他UP 主開始豐富視頻標簽。
慢慢地,內(nèi)容運營和產(chǎn)品經(jīng)理發(fā)現(xiàn)一個詞開始流行起來:鬼畜。
隨著帶這個標簽的視頻越來越多,索性產(chǎn)品經(jīng)理就單獨搞了把這個設(shè)置成了一個新的分類,放到網(wǎng)站首頁,后來也成了該站的一大特色。
這些品類和標簽不斷地演進和變換,最終慢慢相對固定下來:
D站在視頻領(lǐng)域站穩(wěn)了腳跟,在很多精神股東的真金白銀支持下,公司成功上市了!
這個故事里,我就借用了一個半虛擬的故事,講了標簽、維度、指標的相關(guān)故事了,當然,真實的工作場景里,會更復(fù)雜、更艱難。
希望對你有所啟發(fā)~
八、總結(jié)
因為我比較笨,不太適應(yīng)概念套概念的學(xué)習(xí)方法,所以我在寫的過程中,也盡量不抽象,盡量不抽象,盡量講解我理解的例子。
總結(jié)環(huán)節(jié),幫大家回顧下幾個要點吧:
- 維度和標簽是為了分類。標簽很具體,維度更抽象,按需創(chuàng)建。
- 指標是為了度量。缺了維度和標簽,光光的指標啥也不是。
- 要結(jié)合業(yè)務(wù)視角、技術(shù)視角去理解這些概念并運用。
維度、標簽、粒度、指標,這些概念,都是相愛相殺的。要結(jié)合實際案例,系統(tǒng)性地去理解這幾個概念。
相關(guān)知識,可以看:
做數(shù)據(jù)產(chǎn)品,不妨先看看這五個概念
作者:數(shù)據(jù)產(chǎn)品小lee;公眾號:樂說樂言
本文由 @ 數(shù)據(jù)產(chǎn)品小lee 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于 CC0 協(xié)議。
關(guān)注了!
整個系列都看了,寫得真好,很感謝!
小李和小李子的差別哈哈哈哈
哈哈哈
清晰明了,言簡意賅,而且還很好理解~厲害厲害
感謝肯定~歡迎轉(zhuǎn)發(fā)~
標簽就像是對一件事的言簡意賅總結(jié),能讓人快速提取事件里的主要信息
嗯,也可以這么理解。為了傳播效率,不得不言簡意賅~
這篇文章邏輯結(jié)構(gòu)真的好清晰,長篇大論的我還是很有耐心的看完了。
感謝認可~也歡迎分享給需要的朋友??
公眾號也是【數(shù)據(jù)產(chǎn)品小lee】