大數(shù)據(jù)不僅屬于大角色:智能推薦時代的C類電商

算法屬于每一個人。
如今電商平臺的形式越來越豐富:完全跟從平臺自身的直營模式、數(shù)據(jù)體系更完善的大品牌B類模式,以及低門檻的小微個人C類模式。其中,C類電商的智能推薦系統(tǒng)是最為復雜的。
在機器學習剛剛投入應用時,最常見的就是電商領域——讓人們在網(wǎng)上買下自己不需要的東西。
C店的智能推薦為什么會難做?直營電商就不用討論太多了,統(tǒng)一的商品類目管理、統(tǒng)一的商品排序,在做智能推薦時,更多的是注重對用戶行為的識別和用戶數(shù)據(jù)的挖掘。天貓一類的B類品牌店鋪也一樣,店鋪數(shù)量較少,品牌店通常都有自己的專業(yè)的運營團隊、歷史數(shù)據(jù),在平臺方面,品牌店也會更加遵守規(guī)則??蓪τ诨鶖?shù)巨大、體量差異巨大、從業(yè)者生態(tài)復雜的C類店鋪來說,想要做出一套人人都滿意的智能推薦系統(tǒng),可沒那么容易。今天,我們就從C店賣家的角度出發(fā),看看智能推薦系統(tǒng)如何為其賦能。
逆推協(xié)同過濾算法,不僅僅是推薦
在C類電商中,智能推薦系統(tǒng)不僅僅要幫助用戶找到心儀的產(chǎn)品,還要幫助普通賣家更好的把握住流量。我們可以看看早期的電商推薦系統(tǒng)是怎樣的。
以搜索展示為例,早期電商推薦最主要的原理就是文本相關性——也就是關鍵詞。最典型的表現(xiàn),就是淘寶商品往往會有一個特別長的標題。
比如輸入“滑板”二字,會發(fā)現(xiàn)大多數(shù)商品會把滑板、長板、刷街、舞板甚至滑板車等等相關不相關的關鍵詞都加入了標題中。這已經(jīng)是今天經(jīng)過多次修正后的搜索效果,可以想象一下,幾年前的電商搜索結果會是什么樣子:用戶想購買滑板,結果搜索結果里有一堆滑板車、滑板鞋、滑板襪……在標題中加入多種名詞是商家為了獲取更多流量的無奈之舉,可對于用戶來說,這樣的體驗并不好。
而面對這種情況,電商行業(yè)衍生出了一種很有趣的解決方式——創(chuàng)造更豐富的數(shù)據(jù)體系,應用更多的關聯(lián)推薦。
在電商買東西時,平臺總是向我們要求很多行為:收藏店鋪、收藏產(chǎn)品、加入購物車、為產(chǎn)品評分。這些行為都被平臺記錄,豐富著每個人的用戶畫像。
在應用協(xié)同過濾推薦算法時,這些豐富的個人用戶畫像就成了重要的根據(jù),對單一用戶數(shù)據(jù)行為挖掘越深入、越準確,就可以幫助用戶量較小的C類店鋪更好的預測買家行為、甚至對產(chǎn)品銷售進行預判。
比如我是一位第一次搜索滑板關鍵詞的買家,進入了一家C類店鋪,而我曾經(jīng)購買過運動休閑服飾,通過協(xié)同過濾算法,運動休閑服飾也會被推薦給在這家店鋪有過購買行為的用戶。這樣一來,賣家就能判斷我是一位有價值的用戶。
這樣的解釋或許有點復雜,但我們只要記住一點:豐富的行為數(shù)據(jù)體系會讓電商的協(xié)同過濾算法更加精準,而精準的協(xié)同過濾算法不僅僅能把商品推薦給人,還能逆推得知人與商品的匹配程度。對于賣家來說,他們可以從此得知每一次引流活動是否精準,更好的提高流量轉化率。
建立預測模型,讓數(shù)據(jù)找到彼此
對于如今的電商來說,搜索和頁面廣告兩個入口已經(jīng)不足以滿足賣家展示商品的需要和平臺間的競爭。主流的形式是在單一平臺上開拓更多的品類入口,比如京東的精品、淘寶的iFashion等等。而平臺建立某一垂直品類的入口,自然不是拍腦門的決定,而是來自于流量、銷量的預測模型。
以iFashion這類面向年輕人的時裝入口為例,首先要做的就是數(shù)據(jù)特征的轉換,提取出用戶年齡、購買行為、消費能力,關聯(lián)出最受他們歡迎的產(chǎn)品品類。利用隨機森林或向量回歸等方式建模,模擬用戶在單一品類中的瀏覽行為、停留時間、甚至購買行為等等。
有了大概的估計后,再將入口上線、輔以流量支持。而對于C類店鋪的賣家而言,在更符合自己屬性的入口中不僅僅意味著獲取更精準的流量,也能夠讓類似產(chǎn)品、用戶、店鋪進行關聯(lián)。產(chǎn)品、用戶、店鋪三者形成一個三角,三者之間產(chǎn)生的任何數(shù)據(jù)關系帶來效果都是三倍計數(shù)。從而更好哺育未來預測模型的建立。
智能推薦的未來:識別非結構化數(shù)據(jù)
除了以上兩種方式,目前的新趨勢,是通過NLP技術挖掘更多的非結構化數(shù)據(jù)。我們逐漸發(fā)現(xiàn),現(xiàn)在購物網(wǎng)站上的文字越來越多了——買家評價、電商頭條、商品問答等等。用戶在這些文字中流露出的情緒,對于賣家而言也是珍貴的數(shù)據(jù)資料。
對于C店而言,NLP技術的作用不僅僅是機器閱讀,更多的還有自然語言生成。阿里媽媽就推出過這樣的功能,利用NLP技術理解爆款產(chǎn)品的標題,生成模型后為其他賣家修改產(chǎn)品標題。相信未來通過算法模型生成爆款商品描述、宣傳文案等等也指日可待。
同樣的道理也能應用在計算機視覺上,通過計算機視覺識別商品拍攝圖、店鋪網(wǎng)頁設計等等,歸納出適應于不同品類、人群的設計風格,供以賣家參考。想的更遙遠一些,或許在未來,計算機視覺技術還可以通過商品圖片識別設計侵權,從售賣渠道上斷絕侵權產(chǎn)品出現(xiàn)的可能。
總之。對于C類店鋪來說,在運營中對于智能營銷和機器學習等等的新技術的依賴要更加強烈。我們也能逐漸發(fā)現(xiàn),推薦算法本身似乎很少有改變,我們所做的,還是在更多的挖掘數(shù)據(jù),不管是設置用戶行為系統(tǒng)這樣主動的獲取方式,還是利用機器學習技術識別圖片、文字這樣被動的獲取。而這對于平臺和C類店鋪賣家個人來說,都是最具性價比的方法。挖掘數(shù)據(jù)帶來好處更具普適性,C店電商本該是物種豐富的,平臺不能插手其中作物的生長,但有了數(shù)據(jù)作土壤,會讓整個生態(tài)更加繁茂。
作者:?我堂堂一個熊貓,微信公眾號:腦極體
本文由 @腦極體 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉載。
題圖來自PEXELS,基于CC0協(xié)議
阿里媽媽就推出過這樣的功能,利用NLP技術理解爆款產(chǎn)品的標題?這個技術,是阿里媽媽率先使用的嗎?
手握數(shù)據(jù),但是沒有很好利用起來的比比皆是,主要還是歸結于技術和財力,像bat這種級別的公司太少了~~~