互聯(lián)網(wǎng)人群畫像和你所不知道的真相(二)
如何準(zhǔn)確把握用戶行為,制定精準(zhǔn)的用戶畫像,關(guān)鍵在于獲取用戶行為的相關(guān)數(shù)據(jù),其中的獲取方式移動(dòng)端與Web端方法不一。
前一回(前一回內(nèi)容請(qǐng)見(jiàn)這里:互聯(lián)網(wǎng)人群畫像和你所不知道的真相(一))我們講了互聯(lián)網(wǎng)人群畫像的構(gòu)成要素的結(jié)構(gòu)、PC端用戶唯一身份識(shí)別的理想狀況和真正的現(xiàn)實(shí),在這一回中,我們開(kāi)始講Mobile端用戶和跨終端(跨屏)的唯一身份識(shí)別問(wèn)題,同樣是理想和現(xiàn)實(shí)并存的故事.
Mobile端的唯一身份標(biāo)識(shí)
Mobile上的唯一身份標(biāo)識(shí)看起來(lái)比PC上要好,因?yàn)檎l(shuí)也不能輕易干掉自己手機(jī)的IMEI號(hào)碼,也沒(méi)有幾個(gè)人知道怎么樣在蘋果手機(jī)中清除IDFA。所以在mobile端的唯一身份標(biāo)識(shí)應(yīng)該既簡(jiǎn)單又美好。
但其實(shí)不然。
Mobile環(huán)境的復(fù)雜度比PC有過(guò)之而無(wú)不及。首先,mobile上用戶對(duì)網(wǎng)站和APP的使用大約各站半壁江山。光這一點(diǎn)就比PC痛苦萬(wàn)分了。但是,為了讓你更能夠了解mobile上到底發(fā)生了什么,我們先假設(shè)兩種最簡(jiǎn)單的情況:mobile上只有網(wǎng)站的情況和mobile上支持APP的情況。
假如這個(gè)世界上所有的mobile都只支持網(wǎng)站,而不支持APP,那么我們可以基本上把mobile當(dāng)做PC,用cookie來(lái)解決這個(gè)問(wèn)題。不過(guò),就算到了mobile上,cookie本身的短板還是一切照舊。不過(guò),你會(huì)說(shuō),mobile上不是有IMEI或IDFA號(hào)碼嗎?難道不能彌補(bǔ)cookie的短板嗎?可惜的是,mobile上的網(wǎng)站對(duì)人的唯一身份標(biāo)識(shí)不能用這些跟手機(jī)捆綁的識(shí)別號(hào)碼——無(wú)論對(duì)網(wǎng)站做何種技術(shù)改造,都不能讓網(wǎng)站獲得這些ID。所以,如果mobile只支持網(wǎng)站,那么你可以認(rèn)為它就跟前面講的PC的情況沒(méi)太多差別。
假設(shè)這個(gè)世界上所有的mobile都支持APP呢?那會(huì)是另外一種景象。前面講過(guò),APP不能用cookie,但APP的追蹤卻可以用IMEI或者IDFA等。不過(guò),它們會(huì)好用嗎?
先看IMEI,IMEI一定準(zhǔn)確嗎?如果這個(gè)世界上不存在水貨機(jī)、翻新機(jī),而全部是經(jīng)過(guò)工信部認(rèn)證批準(zhǔn)的通信設(shè)備的話,那么IMEI是最靠譜的。但我們?cè)谥袊?guó),水貨泛濫,翻新機(jī)也很多,這些來(lái)路不明的手機(jī)的IMEI就有可能是人為修改的。所以很多手機(jī)共用一個(gè)IMEI號(hào)碼,或IMEI號(hào)碼都是0的情況就很多了。這種情況造成IMEI的唯一身份的識(shí)別率未必高于cookie。另外,IMEI是機(jī)器硬件的編碼,這些硬件編碼都涉及到硬件安全性和隱私問(wèn)題,因此使用它們不能明目張膽。
替代IMEI的方案是一個(gè)被稱為OpenUDID,這是被各廣告平臺(tái)廣泛使用的開(kāi)源方案,但隨著AppStore開(kāi)始拒絕接受使用UDID的應(yīng)用,導(dǎo)致OpenUDID無(wú)法被不同應(yīng)用共享相同的值,注定了上面提到的這些ID們不得不退出歷史的舞臺(tái)。
需要提醒的一點(diǎn)是,IMEI這種跟手機(jī)硬件綁定的識(shí)別符,只能在安卓手機(jī)上起效,蘋果手機(jī)iOS系統(tǒng)通通把它們封鎖了,作為唯一身份標(biāo)識(shí)是沒(méi)指望了,除非是越獄后的iPhone。
不過(guò)蘋果沒(méi)有把所有的路都堵絕,它關(guān)閉了所有的門,但是“良心發(fā)現(xiàn)”(事實(shí)上是不得已而為之)開(kāi)了一個(gè)小窗,這個(gè)小窗就是IDFA。IDFA是蘋果手機(jī)獨(dú)有的用戶唯一身份標(biāo)識(shí)ID。這個(gè)東西能夠?qū)崿F(xiàn)對(duì)APP上用戶的唯一標(biāo)識(shí)。我們有救了嗎?
好一點(diǎn),但是只能用于識(shí)別自己開(kāi)發(fā)的APP的唯一用戶,別人開(kāi)發(fā)的APP用戶的IDFA,你就完全沒(méi)法知道了。因?yàn)镮DFA不像前面講的第三方cookie,可以由一個(gè)廣告公司所掌握,而IDFA是完全被蘋果公司掌握的。進(jìn)行人群畫像的時(shí)候,對(duì)于用戶唯一身份標(biāo)識(shí)的服務(wù)商幾乎都不是APP開(kāi)發(fā)商,而幾乎全部是第三方(廣告公司或者第三方數(shù)據(jù)公司),因此只能通過(guò)跟眾多APP開(kāi)發(fā)商合作才能獲得多個(gè)APP中同一個(gè)用戶的IDFA,也才能給同一個(gè)用戶進(jìn)行畫像。這基本上不是技術(shù)問(wèn)題,而是純商業(yè)問(wèn)題了。商業(yè)問(wèn)題的難度在于,跟一家兩家合作容易,但是跟一百家兩百家合作,而且還是“與虎謀皮”(拿別人這么機(jī)密的數(shù)據(jù)信息),難度太大了。畢竟你不是BAT這樣在市場(chǎng)支配地位的廠商。
所以,對(duì)用戶進(jìn)行畫像,安卓手機(jī)要好于蘋果手機(jī),原因就在于蘋果的封閉性,第三方的生存空間很窄小。
上面這些都還不是最麻煩的問(wèn)題。
工程師們告訴我,移動(dòng)端最大的麻煩是終端的極端多樣性,硬件、操作系統(tǒng)、軟件等等,全部是碎片化的,而利用了各種不同的人的標(biāo)識(shí)手段,相互之間也沒(méi)法互通互聯(lián),所以,移動(dòng)端的唯一身份識(shí)真的很難。
可是,這還只是在我們假設(shè)的最簡(jiǎn)單的兩種情況下!
現(xiàn)實(shí)世界中,mobile既支持網(wǎng)站,又支持APP,同一個(gè)人基本上都既會(huì)用mobile,又會(huì)用APP,我們能夠?qū)崿F(xiàn)跨mobile和APP的唯一用戶識(shí)別,并在這個(gè)基礎(chǔ)上做人群畫像嗎?
技術(shù)方法目前沒(méi)辦法。雖然有一些變通的方法,比如設(shè)置一個(gè)APP和網(wǎng)站通用的ID系統(tǒng),或者需要同一個(gè)用戶先用APP,然后又用網(wǎng)站才能實(shí)現(xiàn)一個(gè)功能什么的,但這些變通的方法只能在很小的局部范圍內(nèi)使用,完全不是通用解決方法。這離我們需要的人群畫像的對(duì)所有網(wǎng)民的唯一身份標(biāo)識(shí)還相距甚遠(yuǎn)。
所以,移動(dòng)端同樣不存在準(zhǔn)確的唯一身份標(biāo)識(shí),這意味著我們并不擁有全局性的上帝視角,無(wú)法記錄任一用戶使用mobile上的全部網(wǎng)站和APP的相關(guān)信息,或者退一步,不說(shuō)全部,想知道大部分網(wǎng)站和APP的相關(guān)信息都很難獲得。甚至,即使是僅僅想知道這些網(wǎng)站的URL和APP的名字都不那么可能。
跨設(shè)備的唯一身份識(shí)別
終于講到了跨設(shè)備的唯一身份識(shí)別,估計(jì)你已經(jīng)等不及了。這個(gè)領(lǐng)域可是曾經(jīng)被熱炒過(guò)一陣,但用在人群畫像中似乎并沒(méi)有聽(tīng)聞什么案例,后來(lái)似乎有些“不了了之”。原因何在?
原來(lái),既然在一個(gè)mobile設(shè)備內(nèi),想要實(shí)現(xiàn)一個(gè)人在同一個(gè)設(shè)備上跨APP和網(wǎng)站的識(shí)別都沒(méi)有全局性的通用解決方案,那么一個(gè)人使用多個(gè)設(shè)備就更沒(méi)有全局解決方案了。你早上用手機(jī)、中午用PC、晚上用iPad訪問(wèn)互聯(lián)網(wǎng),然后讓一個(gè)廣告商(或者一個(gè)第三方服務(wù)商)知道是同一個(gè)人在使用這些設(shè)備,難,真是太難了。
部分互聯(lián)網(wǎng)服務(wù)提供商(過(guò)去它們常常是一些媒體)具有跨設(shè)備唯一身份識(shí)別能力,比如,它們擁有強(qiáng)賬號(hào)體系。所謂強(qiáng)賬號(hào)體系,是指無(wú)論你在PC上還是手機(jī)上使用它們的服務(wù)或內(nèi)容的時(shí)候,都需要登錄自己的賬號(hào)。這意味著它們“先天”就能知道你是同一個(gè)人。
另外還有一些服務(wù)商,它們可以通過(guò)判斷不同設(shè)備經(jīng)常同時(shí)出現(xiàn)在某一個(gè)IP號(hào)段的現(xiàn)象來(lái)判斷這些設(shè)備是不是屬于同一個(gè)人。這個(gè)方法很可行,因?yàn)闊o(wú)論是APP還是網(wǎng)站,獲取設(shè)備所處的IP的難度并不大,這樣就可以在沒(méi)有強(qiáng)賬號(hào)體系的情況下,判斷這些設(shè)備是否屬于同一個(gè)人了。如果算法得到,數(shù)據(jù)也充分,這種方法的識(shí)別率隨時(shí)間流逝,可以變得相當(dāng)精準(zhǔn)。當(dāng)然,我指的相當(dāng)精準(zhǔn)是能夠有超過(guò)30%的識(shí)別率,80%以上,利用這種方法基本上不太可能。
如果沒(méi)有強(qiáng)賬號(hào),也沒(méi)有技術(shù)方法,那么最后一種跨設(shè)備的唯一身份識(shí)別就是通過(guò)一些營(yíng)銷手段來(lái)實(shí)現(xiàn)。比如,要在手機(jī)上掃碼(比如獲得優(yōu)惠券),然后在PC上實(shí)現(xiàn)某個(gè)功能什么的(比如完成購(gòu)物)。這聽(tīng)起來(lái)夠折騰的,但是確實(shí)比完全沒(méi)轍強(qiáng)。當(dāng)然,這種跨設(shè)備的唯一身份識(shí)別的范圍那就是極小極小了,因此不具備人群畫像所需要具備的普遍性。
但問(wèn)題在于,如果你希望得到某個(gè)人(或者是某群人)的畫像,你不太可能只依靠某一個(gè)互聯(lián)網(wǎng)服務(wù)提供商就能完成。因?yàn)檫@個(gè)人(或者這群人)的互聯(lián)網(wǎng)使用行為一定不會(huì)囿于這一個(gè)服務(wù)提供商的范圍內(nèi),而是遍際于互聯(lián)網(wǎng)的各處——他們一會(huì)兒用百度搜索點(diǎn)什么,一會(huì)兒用騰訊QQ聊聊天,一會(huì)兒用淘寶買點(diǎn)東西——沒(méi)有任何第三方可以同時(shí)獲得同一個(gè)用戶在不同設(shè)備上使用各種互聯(lián)網(wǎng)服務(wù)的數(shù)據(jù)。即使可能,難度也極端巨大。
所以,我們希望的用全網(wǎng)用戶數(shù)據(jù)來(lái)給人群畫像那根本不可能,所有的人群畫像,都只能基于局部的數(shù)據(jù)。而實(shí)現(xiàn)跨設(shè)備識(shí)別唯一身份,除了少數(shù)服務(wù)商之外,基本上都只能停留在口頭上。這跟數(shù)據(jù)處理能力,或者什么大數(shù)據(jù)毛線關(guān)系都沒(méi)有,再牛逼的數(shù)據(jù)能力也沒(méi)用,這就是現(xiàn)實(shí)世界的事實(shí)。
好了,下面我自己總結(jié)了一下PC和Mobile端各種用戶身份識(shí)別方式的優(yōu)缺點(diǎn),并不定量,所以僅大家參考:
各種方式識(shí)別唯一身份的優(yōu)點(diǎn):
各種方式識(shí)別唯一身份的缺點(diǎn):
via:chinawebanalytics
作者:宋星
來(lái)源:http://www.36dsj.com/archives/44559
本文來(lái)源于人人都是產(chǎn)品經(jīng)理合作媒體@36大數(shù)據(jù),作者@宋星
看來(lái)大數(shù)據(jù)被很多人的鼓吹的很玄了