如何通過算法,提升產(chǎn)品轉(zhuǎn)化率?
在設(shè)計工作中,如果想提升產(chǎn)品服務(wù)、推動轉(zhuǎn)化率提升,結(jié)合數(shù)據(jù)算法找到優(yōu)化方向,是一個相對不錯的選擇。那么在實際業(yè)務(wù)中,我們可以如何利用機器學(xué)習(xí)、數(shù)據(jù)算法等內(nèi)容進行結(jié)合應(yīng)用?本文便從概念、實操等維度入手做了內(nèi)容解讀,一起來看。
以用戶為中心的產(chǎn)品設(shè)計中,根據(jù)不同的用戶畫像提供個性化的服務(wù)是必然趨勢。設(shè)計師如何利用數(shù)據(jù)算法,參與設(shè)計開發(fā)千人千面的產(chǎn)品服務(wù),提高轉(zhuǎn)化率?
今天我們從設(shè)計師的視角來了解人工智能和機器學(xué)習(xí),以及在實際業(yè)務(wù)中如何應(yīng)用千人千面。
一、什么是人工智能與機器學(xué)習(xí)
相信看過斯皮爾伯格電影《人工智能》電影的小伙伴對影片中的人造人大衛(wèi)都印象深刻,享受視覺盛宴和精彩劇情的同時,也想對人工智能一窺究竟。
(像這樣人工智能機器人題材的好萊塢電影還有很多,比如機械姬、機械公敵、超能查派、機器管家、終結(jié)者、黑客帝國,甚至是前幾年熱播的美劇西部世界。)
1. 基礎(chǔ)概念
首先,我們需要理清3個概念??:
? 人工智能-AI
讓機器變得像人一樣智能的科學(xué)。
比如像前面提到的各類好萊塢電影中的AI機器人,他們能夠像人一樣擁有情感和思考能力。
? 機器學(xué)習(xí)
讓計算機像人一樣能從數(shù)據(jù)中學(xué)習(xí)出規(guī)律的科學(xué)。
機器學(xué)習(xí)是人工智能的一個分支,是實現(xiàn)人工智能的重要途徑,即以機器學(xué)習(xí)為手段解決人工智能中的問題。
? 深度學(xué)習(xí)
以神經(jīng)網(wǎng)絡(luò)為架構(gòu),對數(shù)據(jù)進行表征學(xué)習(xí)。
深度學(xué)習(xí)是機器學(xué)習(xí)的一個分支,常見的深度學(xué)習(xí)有卷積神經(jīng)網(wǎng)絡(luò),例如給計算機一堆圖片,讓計算機快速分辨出哪些是人類、哪些是小貓小狗。
2. 人工智能的發(fā)展歷程和現(xiàn)狀
人工智能的發(fā)展起源于20世紀50年代,1950年英國科學(xué)家艾倫圖靈提出了著名的圖靈測試:如果一臺機器能夠與人類展開對話而不能被辨別出其機器身份,那么稱這臺機器具有智能。人工智能(Artificial Intelligence,AI)經(jīng)歷了超過半個世紀的起伏,在2011年后隨著云計算和大數(shù)據(jù)能力的發(fā)展迎來爆發(fā)。
我們將目光投向國內(nèi)的人工智能發(fā)展現(xiàn)狀,截至2020年底,中國人工智能企業(yè)布局側(cè)重在應(yīng)用層和技術(shù)層。其中,應(yīng)用層人工智能企業(yè)數(shù)占比最高(84.05%);其次是技術(shù)層企業(yè)數(shù),占比為13.65%;基礎(chǔ)層企業(yè)數(shù)占比最低,為2.30%。
可以看出,我國人工智能產(chǎn)業(yè)發(fā)展主要受應(yīng)用需求牽引,對于基礎(chǔ)層(算法+模型)新研發(fā)、新算力硬件研發(fā)、大數(shù)據(jù)和技術(shù)層的投入目前還處于一個較低的水平。
二、機器學(xué)習(xí)基礎(chǔ)知識
基于人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)三者的概念,我們知道機器學(xué)習(xí)是實現(xiàn)人工智能的重要途徑,準確來說是實現(xiàn)高級人工智能的重用途徑。
1. 機器學(xué)習(xí)三要素
機器學(xué)習(xí)的三要素是數(shù)據(jù)、算法、算力。這里的數(shù)據(jù)既可以是指標型數(shù)據(jù),也可以是一堆圖像、聲紋樣本等等;算法其實包括模型+算法,在后續(xù)的章節(jié)中會用案例來闡述什么是模型、什么是算法;而算力指的是計算機的計算能力,比如在計算機視覺領(lǐng)域GPU的算力就比普通的CPU算力要強。
2. 機器學(xué)習(xí)類型
機器學(xué)習(xí)的分類目前主流觀點是分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)。
乍一聽可能有點抽象,我們來看幾個經(jīng)典的??例子來幫助理解。
首先,所謂的監(jiān)督學(xué)習(xí)就是給計算機指定一個標簽,比如說貓,然后給一堆各種類型、各種角度貓的照片讓計算機進行表征學(xué)習(xí),類似于媽媽教小孩子一張一張認圖的過程。經(jīng)過一段時間訓(xùn)練后,當(dāng)你再給計算機一張貓的圖片時它便能很快識別出這張圖里的動物是一只貓。
無監(jiān)督學(xué)習(xí)與監(jiān)督學(xué)習(xí)最大的不同就是只有訓(xùn)練數(shù)據(jù)、沒有標簽,也就是說給計算機一堆貓貓狗狗的圖片,讓計算機通過表征學(xué)習(xí)來做分類識別(聚類),再給計算機一張貓貓狗狗的圖片時,它能很快識別出這張圖片是屬于哪一類。
強化學(xué)習(xí)則較前兩者復(fù)雜許多,它涉及較大的系統(tǒng)工程,比如波士頓動力的人形機器人Atlas就是一個典型的強化學(xué)習(xí)案例,它涉及環(huán)境感知(將傳感器中的數(shù)據(jù)轉(zhuǎn)化為對路徑和形態(tài)規(guī)劃的依據(jù))、路線規(guī)劃、運動控制等等,本質(zhì)上是機器在在復(fù)雜環(huán)境中的自主任務(wù)處理能力。
無論你使用哪個類型的機器學(xué)習(xí)模型,大體都需要經(jīng)歷“建?!?、”訓(xùn)練”(找到最合適的參數(shù))、“驗證”、“測試”、“應(yīng)用“幾個階段,且其中訓(xùn)練到測試可能會經(jīng)歷好幾輪反復(fù),這種過程跟一個嬰兒認識世界、學(xué)習(xí)知識到應(yīng)用知識的過程類似。
三、機器學(xué)習(xí)算法與模型舉例
對機器學(xué)習(xí)概念有了初步的認知,我們平時常聽到的算法與機器學(xué)習(xí)又是什么關(guān)系?
前面我們說過機器學(xué)習(xí)是讓計算機像人一樣能從數(shù)據(jù)中學(xué)習(xí)出規(guī)律的科學(xué),其本質(zhì)是通過數(shù)學(xué)方式來解決指令型程序不能解決的問題。
這里我們先來拋出幾個概念,然后通過實際的例子來認識這幾個概念。首先,”模型“可以簡單理解為把實際問題抽象成數(shù)學(xué)問題的函數(shù),而”算法“則是求解這個函數(shù)的計算方法,接下來我們用一個簡單的案例來加深理解。
一元線性回歸
我們假設(shè)房子的售價與面積存在一定關(guān)系,現(xiàn)在給計算機一組房子售價與面積的數(shù)據(jù),讓計算機通過學(xué)習(xí)找到這個關(guān)系,以便下次我們給定一個房屋面積時計算機能預(yù)測出房屋的售價。
假設(shè)房屋的面積為自變量x,售價為因變量y,我們將這些面積與售價(x,y)數(shù)據(jù)還原到一個直角坐標系當(dāng)中大致可以呈現(xiàn)出以下的狀態(tài)。
可以看出這些點的整體趨勢趨向一條直線,假設(shè)存在這樣一條直線,使得坐標上的每個點到這條直線的距離之和都能最小,那是不是就可以根據(jù)面積做房屋售價的預(yù)測了?
中學(xué)時學(xué)過的一元線性方程就能描述出這條直線,即y=f(x)=wx+b,而每個點到這條直線的距離之和的函數(shù)就是???【損失函數(shù)E】,即我們要通過對已有的數(shù)據(jù)來求解使得損失函數(shù)E最小的w和b,這個模型就是一元線性回歸模型。
實際上,真實房價有可能高于預(yù)測值也有可能低于預(yù)測值,為了使得累加之后不會正負抵消,我們會把得出來的距離數(shù)值做一個平方,這個方法叫做最小二乘法,將方程寫出來便成了以下形式:(其中E、w、b為未知,y、yi、Xi為已知,∑為累加符號)
到這里可能已經(jīng)開始意識模糊,沒關(guān)系,這部分不是設(shè)計師需要掌握的內(nèi)容,理解即可。我們回顧一下這個案例中的概念:
- 模型:一元線性回歸模型
- 算法:最小二乘法
- 損失函數(shù)E:使得每個點到這條直線的距離之和最小的w和b構(gòu)成的函數(shù)
- 權(quán)重:w,b
在求解E,w,b這三個未知數(shù)的過程中,計算機在初始訓(xùn)練時會賦予w和b一個隨機數(shù),這2個隨機參數(shù)數(shù)可能會設(shè)置的過小或過大,通過不斷地調(diào)整參數(shù)值來求出最小的E,將這個過程可視化便是一個三維圖像大致呈現(xiàn)出以下樣式,這個計算方法叫做梯度下降法。
線性回歸模型適用的范圍比較局限、只能解決一些線性可分的問題,碰到非線性可分的問題時需要用更為復(fù)雜的【深度學(xué)習(xí)】來解決。
人工神經(jīng)網(wǎng)絡(luò)便是典型的深度學(xué)習(xí),其特點是通過無數(shù)互相連接的神經(jīng)元構(gòu)成了一個高復(fù)雜、高度互聯(lián)的網(wǎng)絡(luò),通常第一個神經(jīng)元的信號輸出會是下一個神經(jīng)元的信號輸入,神經(jīng)元之間互相發(fā)送電信號以幫助人類處理信息。
這部分的內(nèi)容由于更為復(fù)雜,在這里就不做贅述了,感興趣的同學(xué)可以自行上網(wǎng)查找相關(guān)資料。
四、機器學(xué)習(xí)在業(yè)務(wù)中的應(yīng)用
1. 整體概念
根據(jù)用戶特征提供個性化的界面——千人千面的原理就是利用深度學(xué)習(xí)模型(XGB梯度上升模型)。例如根據(jù)用戶數(shù)據(jù)來學(xué)習(xí)用戶可能的偏好類型,從而推薦對應(yīng)偏好的商品、榜單等卡片樣式。
這里的用戶數(shù)據(jù)包括電商APP中用戶注冊信息數(shù)據(jù)和用戶打開APP后的操作行為數(shù)據(jù)。
算法側(cè)會根據(jù)用戶的注冊信息對用戶可能的偏好進行打分并推薦分值最高的那一類偏好樣式。
用戶看到對應(yīng)的各類樣式后會有相應(yīng)的行為數(shù)據(jù)(比如點擊)反饋到算法,算法再根據(jù)反饋回的用戶行為數(shù)據(jù)不斷地優(yōu)化模型里的權(quán)重值。
2. 執(zhí)行流程
執(zhí)行流程我們可分為算法線和設(shè)計線兩條線,其中算法線交互同學(xué)需要關(guān)注的是前兩個步驟,也就是數(shù)據(jù)收集和數(shù)據(jù)準備,而設(shè)計線則需要我們做樣式輸出、將素材上傳到后臺并打標,以及上線后的數(shù)據(jù)復(fù)盤并根據(jù)數(shù)據(jù)優(yōu)化樣式。
1)數(shù)據(jù)準備
在收集數(shù)據(jù)前需要要和算法同學(xué)明確我們的建模指標是什么?即基于什么樣的用戶行為數(shù)據(jù)輸入讓機器去學(xué)習(xí)(比如點擊PV或者曝光PV)。
而數(shù)據(jù)準備階段需要我們對歷史數(shù)據(jù)按照一定比例進行分割,一般是70%作為訓(xùn)練集、30%作為驗證集和測試集。訓(xùn)練集的作用是讓模型對初始權(quán)重值進行訓(xùn)練;而驗證集則是用模型和學(xué)習(xí)來的權(quán)值來進行預(yù)測,驗證學(xué)習(xí)來的權(quán)值是否是最優(yōu)解;測試集則是評估模型的最終性能,比如評估模型的準確率、召回率等等。
打個比方訓(xùn)練集就像是學(xué)生的課本,學(xué)生根據(jù)課本里的內(nèi)容來掌握知識。驗證集就像是作業(yè),通過作業(yè)可以知道 不同學(xué)生學(xué)習(xí)情況、進步的速度快慢。而最終的測試集就像是考試,考的題是平常都沒有見過,考察學(xué)生舉一反三的能力。
2)樣式輸出
設(shè)計線則是我們設(shè)計同學(xué)比較擅長的部分了。在執(zhí)行設(shè)計線時,我們首先要對現(xiàn)有各類型卡片的信息結(jié)構(gòu)做拆解和歸類,再根據(jù)前面定義的用戶類型對樣式做相應(yīng)設(shè)計(強化某類偏好信息的可視度)。
以feed流的商品卡片為例,對于價格偏好的樣式我們會以價格波動曲線的樣式來表達,而對于品質(zhì)偏好的樣式我們則會強化好評率信息的表達。
完成各類型卡片的樣式輸出后,我們還需要將這些卡片素材上傳到運營后臺并進行打標,以便前端能夠根據(jù)這些標簽進行樣式的調(diào)用。做完這些后還有最后一步,就是收集線上數(shù)據(jù)并以此做樣式的持續(xù)迭代和樣式擴充。
3. 上線效果
完成模型的訓(xùn)練、部署以及設(shè)計樣式的輸出、后臺錄入打標后,我們在活動期間進行了大規(guī)模應(yīng)用,促銷會場的曝光UV轉(zhuǎn)化率上取得了5%~45%不等的提升,同時也帶來了不菲的GMV增量。
作者:海蛟,編輯:五零
原文標題:設(shè)計師如何通過算法提升產(chǎn)品轉(zhuǎn)化率
來源公眾號:ASAK設(shè)計(ID:ASAK_Design),ASAK設(shè)計團隊(Astro x Akira)
本文由 @ASAK設(shè)計 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!