一文說清AI智能平臺
編輯導(dǎo)語:如今平臺產(chǎn)品已不是新概念,隨著AI技術(shù)的成熟,AI平臺產(chǎn)品也越來越多。那么,為什么要做AI平臺?這些AI平臺又有哪些類別呢?讓我們跟著作者,一起去探尋吧。
有一天,小李的領(lǐng)導(dǎo)說:“我們要做AI平臺!”。
雖然平臺產(chǎn)品也不是新概念了,隨著AI技術(shù)的成熟,AI平臺產(chǎn)品也越來越多,但光憑做平臺一句話,小李還是犯了難——大大小小的“平臺”很多,究竟我們要做什么樣的AI平臺呢?磨刀不誤砍柴功,小李決定先研究下市面上已有的AI平臺找找靈感。
一、AI平臺產(chǎn)品分類
AI平臺大致可以分為AI開發(fā)平臺和AI支撐平臺(名字是小李瞎起的)兩類。
1. AI開發(fā)平臺
AI開發(fā)平臺面向的是模型開發(fā)者,圍繞AI模型/算法的生命周期(數(shù)據(jù)收集、標(biāo)注、模型結(jié)構(gòu)設(shè)計、模型訓(xùn)練、模型部署等階段)提供工具。開發(fā)平臺產(chǎn)品需要對算法開發(fā)流程、算法種類豐富度都有較好的積累,因此大部分平臺類產(chǎn)品是由內(nèi)功比較深厚的大廠推出的。
(百度BML功能架構(gòu))
1)用戶
都叫開發(fā)平臺啦,用戶想必應(yīng)該是開發(fā)人員,使用AI開發(fā)平臺的研發(fā)人員對人工智能的了解程度不盡相同,他們可能是業(yè)務(wù)應(yīng)用的開發(fā)人員(只需要調(diào)用某個模型API),也可能是AI工程師(需要對模型調(diào)參數(shù),甚至重新設(shè)計網(wǎng)絡(luò)結(jié)構(gòu)),但歸根到底AI開發(fā)平臺是面向開發(fā)人員的B端產(chǎn)品。
2)場景
在需要AI能力支撐的時候,用戶可以使用AI開發(fā)平臺提供的不同層級的工具/功能(嵌入級、API級、數(shù)據(jù)訓(xùn)練級、模型定制級、算法開發(fā)級),實現(xiàn)所需的AI能力。
3)解決問題
AI賦能其他產(chǎn)品。AI平臺作為一個產(chǎn)品,想解決的核心問題是如何便捷的讓其他應(yīng)用或產(chǎn)品獲得智能化的能力。看到很多強調(diào)AI平臺是為了讓AI算法開發(fā)更簡單的說法,但歸根到底,如果不是其他產(chǎn)品需要AI模型或者AI能力,自然也不需要算法開發(fā),更就沒有必要有所謂AI開發(fā)平臺存在了。
2. AI支撐平臺
AI支撐平臺大多是面向運營人員/業(yè)務(wù)人員,為某個AI應(yīng)用提供能夠使之work的配置、管理等“支撐”功能。智能對話平臺就是一種非常典型的AI支撐平臺,因為智能對話應(yīng)用并非只依賴某個模型就能實現(xiàn),所以需要根據(jù)業(yè)務(wù)場景進行技能管理、對話設(shè)置等工作,智能對話平臺就是這些配置功能的載體。
1)用戶
主要是業(yè)務(wù)人員或者運營人員,也就是需要對某個應(yīng)用的具體規(guī)則、具體內(nèi)容進行設(shè)置的工作人員。
2)場景
在使用某個智能應(yīng)用時,用戶需要根據(jù)實際業(yè)務(wù)場景對應(yīng)用中的某些功能進行配置,才能使應(yīng)用按照需求運行起來。
3)解決問題
使智能應(yīng)用按照用戶的期望運行起來。那為什么這些應(yīng)用需要配置呢?為什么不能固化呢?因為應(yīng)用的使用場景千差萬別,比如在銀行的智能客服和商場的智能客服,雖然底層的技術(shù)途徑一致,但具體客服面對的問題、使用的話術(shù)完全不一樣。
從產(chǎn)品角度看,為了使產(chǎn)品的通用性更強,我們往往會設(shè)計一個通用的應(yīng)用框架,然后把高頻且重要的功能做成可配置項以適應(yīng)更多用戶的需求。也不是說把功能固化下來不行,但那樣的話產(chǎn)品就變成了定制化的項目,成本非常高且無法復(fù)用。
(AI開發(fā)&支撐平臺對比)
二、AI開發(fā)平臺
1. 按AI模型生命周期拆解
知乎看到的一個比較好的平臺產(chǎn)品定義:“平臺產(chǎn)品提供共用性強的工具,連接多端多角色之間的活動或交易”。AI開發(fā)平臺產(chǎn)品也一樣,是圍繞著圍繞AI模型/算法的生命周期提供工具,連接不同層次開發(fā)者對AI模型設(shè)計、訓(xùn)練、使用等活動。
AI模型的生命周期,大概是這樣的:
AI開發(fā)平臺即然是服務(wù)于AI模型生命周期的工具,自然也離不開以上這些模塊。所謂平臺,可以只針對某一個環(huán)節(jié),比如數(shù)據(jù)收集+標(biāo)注環(huán)節(jié),或者模型部署環(huán)節(jié),也可以針對整個生命周期,這就解釋了為什么同是AI平臺,有大有小。
如果我們從AI模型生命周期角度拆分,那么就有:
1)數(shù)據(jù)標(biāo)注平臺
面向數(shù)據(jù)接入、清洗、標(biāo)注等和訓(xùn)練數(shù)據(jù)有關(guān)的工作。數(shù)據(jù)接入、清洗的工作其實和大數(shù)據(jù)的關(guān)聯(lián)性比較強,有些標(biāo)注平臺甚至是大數(shù)據(jù)系統(tǒng)的組件。
對于AI標(biāo)注/數(shù)據(jù)平臺來說,一個思路是類似百度的EasyData,針對模型訓(xùn)練數(shù)據(jù)提供一部分預(yù)處理功能(如縮放、翻轉(zhuǎn)圖像提高模型魯棒性,或者對圖像進行濾波、降噪等增強操作)和智能標(biāo)注功能(先利用已經(jīng)訓(xùn)練好的模型自動標(biāo)注一把,然后再由人工校準(zhǔn)或微調(diào)),正是這些功能支撐起了數(shù)據(jù)標(biāo)注平臺。
另外一個不錯的思路是更側(cè)重“標(biāo)注”這個動作本身,類似basicFinder,做數(shù)據(jù)需求方和數(shù)據(jù)標(biāo)注商的撮合生意并提供標(biāo)注工具。
2)模型設(shè)計平臺
這個一般不會作為單獨的產(chǎn)品,個人猜測原因主要是模型結(jié)構(gòu)設(shè)計門檻高、需求小。從我自己的經(jīng)驗來看,使用開源框架開發(fā)和使用平臺提供的工具效率差別不大。
模型設(shè)計的功能大多是作為開發(fā)平臺一個模塊,通過可視化拖拉拽、notebook等方式進行模型結(jié)構(gòu)設(shè)計。
3)模型訓(xùn)練平臺
提供模型訓(xùn)練的算力、環(huán)境,這個是AI平臺中比較常見的產(chǎn)品,由于模型訓(xùn)練對硬件資源的高消耗,通常會租用云計算資源來完成模型訓(xùn)練,所以很多模型訓(xùn)練平臺是與云平臺捆綁的,完成包括負(fù)載均衡、并行訓(xùn)練等工作。
4)模型部署平臺
提供把模型從訓(xùn)練環(huán)境部署到推理環(huán)境(云端、邊緣端等)的工具。這個功能相對簡單,較少單獨作為一個產(chǎn)品,一般是也是作為開發(fā)平臺的一個功能模塊。
一個例外是邊緣/嵌入式環(huán)境部署平臺(如百度EasyEdge),由于硬件適配比較繁瑣,所以目前看到百度是做成一個相對獨立的產(chǎn)品的。
5)模型推理平臺
提供各式各樣的模型接口,供用戶直接調(diào)用,一般還提供包括模型調(diào)用管理、接口管理等功能,這種推理平臺主要是以模型作為核心競爭力的。另一種推理平臺則以算力作為競爭力,類似云平臺,用戶將模型部署在平臺上可獲得彈性擴縮容等能力。
2. 按業(yè)務(wù)需求拆解
參考螞蟻AI平臺的一篇分享,AI平臺按照不同層級的業(yè)務(wù)需求可以分為5級:功能嵌入、API調(diào)用、數(shù)據(jù)訓(xùn)練、模型定制、算法開發(fā)。
- 功能嵌入:通過iframe等實現(xiàn)成本最低的手段,將某個功能模塊嵌入到自己的系統(tǒng)中。
- API調(diào)用:直接調(diào)用平臺提供的成熟API,比如調(diào)用身份證、駕駛證之類的OCR識別API。
- 數(shù)據(jù)訓(xùn)練:平臺的模型符合需求,但需要提供自己的訓(xùn)練數(shù)據(jù)來解決具體場景需求。
- 模型定制:平臺的現(xiàn)成模型不太符合要求,所以要對算法參數(shù)進行配置,然后訓(xùn)練出符合自己需求的新模型。
- 算法開發(fā):最高級的情況,就是業(yè)務(wù)方懂算法、要開發(fā)新算法。平臺則提供“算法開發(fā)、數(shù)據(jù)管理、模型訓(xùn)練、模型測試和發(fā)布”等一系列深層次的能力,來提升算法研發(fā)的效率。
把5級業(yè)務(wù)需求和生命周期對比來看,業(yè)務(wù)的按需分層和模型生命周期的各個階段基本是呈對應(yīng)關(guān)系的。需求越高級,追溯到的生命周期越靠前。
功能嵌入和API調(diào)用級需求只涉及模型推理,數(shù)據(jù)訓(xùn)練級需求涉及數(shù)據(jù)標(biāo)注、訓(xùn)練、部署以及推理過程,模型定制和算法開發(fā)級需求就涉及全流程的功能了。
3. 一些典型產(chǎn)品
上圖給出了一些AI開發(fā)平臺產(chǎn)品的AI模型生命周期覆蓋情況,可以看到大部分產(chǎn)品其實都是提供全生命周期的功能的。當(dāng)然不是說以上的分析沒有意義,按生命周期或者按需求層次拆解還是可以幫助我們捋清產(chǎn)品架構(gòu)的。
個人覺得其中百度的功能架構(gòu)是最舒服、邏輯性最好的。百度的AI開發(fā)平臺包括BML和EasyDL兩個,BML是全流程的開發(fā)平臺,覆蓋了AI模型全生命周期;EasyDL定位是零門檻開發(fā),所以只支持到數(shù)據(jù)訓(xùn)練級別的開發(fā)。
這樣的拆分其實就是依據(jù)前邊所說的業(yè)務(wù)需求等級進行的,拆分之后目標(biāo)用戶要清晰很多。BML中相對獨立的數(shù)據(jù)相關(guān)功能和邊緣部署相關(guān)功能又都拆成組件/小平臺,可以供用戶單獨調(diào)用,從而提高靈活性。
騰訊TI系列平臺中,TI-ONE定位是“一站式機器學(xué)習(xí)服務(wù)平臺”,但暫時沒有看到關(guān)于數(shù)據(jù)標(biāo)注方面的功能,數(shù)據(jù)處理只提供相對簡單的數(shù)據(jù)接入和數(shù)據(jù)預(yù)處理功能。預(yù)置模型相對來說也比較少,大部分是機器學(xué)習(xí)方面的模型,深度學(xué)習(xí)模型較少。
TI系列的其他兩個平臺TI-Matrix和Ti-EMS分別是“AI應(yīng)用服務(wù)平臺”和“無服務(wù)推理平臺”,個人感覺都更偏向云服務(wù)一些,主要是服務(wù)調(diào)度、擴縮容等能力。
華為ModelArts也提供從數(shù)據(jù)標(biāo)注到模型推理全流程的開發(fā)工具,其中“自動學(xué)習(xí)”的功能模塊基本對標(biāo)百度EasyDL,提供重訓(xùn)練級別的模型生成,但暫時沒有按照需求層級進行產(chǎn)品拆分。
三、AI支撐平臺
AI支撐平臺比起AI開發(fā)平臺,更類似業(yè)務(wù)平臺,比如內(nèi)容審核、智能對話等。圍繞的是一個核心算法,通過配置提升這個算法/能力的通用性。
下圖舉個內(nèi)容審核平臺作為栗子~橫向是發(fā)布圖片的業(yè)務(wù)流程,縱向是審核平臺的功能,可見審核平臺是和業(yè)務(wù)緊密結(jié)合的。
審核平臺的核心其實就是分類問題(把輸入的圖片分為合規(guī)、不合規(guī)),外部輸入是圖片,輸出是圖片是否合規(guī)、違規(guī)類型、準(zhǔn)確率等信息,而審核策略的制定、驗證則是為了支撐圖像分類算法在內(nèi)容審核這個場景下work,說到底“支撐”就是配置、設(shè)置。
四、一點思考
1. 為什么需要AI平臺?
從用戶的角度看:用戶需要的是以盡可能低的成本(時間及費用)獲取所需的AI能力。AI平臺提供的開發(fā)工具、預(yù)置模型都可以減小用戶獲取AI能力的投入。
從AI平臺公司的角度看:AI平臺提供的是一套標(biāo)準(zhǔn)化的工具/流程,80%的需求可以由標(biāo)準(zhǔn)化的產(chǎn)品來滿足,而非每個需求都單獨定制解決方案。通過AI平臺這樣的標(biāo)準(zhǔn)化產(chǎn)品來提升ROI,從而實現(xiàn)盈利。
不論是從用戶角度,還是從提供AI平臺的公司角度,其實AI平臺的存在都是為了提升投入產(chǎn)出比。
但個人感覺,目前AI平臺公司對AI平臺的需求是要大于用戶的,這就造成了產(chǎn)品多用戶少的囧境。用戶對AI平臺的不認(rèn)可,一方面可能是對AI能力帶來的收益的不確定;另一方面可能是對AI平臺提高ROI的不確定(有可能使用了AI平臺但還是無法節(jié)約人力投入)。所以如何讓用戶發(fā)現(xiàn)AI能力的價值,進而發(fā)現(xiàn)AI平臺的價值還是個值得思考的問題。
2. 如何做到AI平臺的差異化?
市面上那么多AI平臺,如何做到讓用戶選擇你的產(chǎn)品呢?差異化。
怎么做到差異化呢?不同用戶對AI能力或應(yīng)用的需求側(cè)重各不相同,但是無外乎數(shù)據(jù)、算力、模型三要素。
1)數(shù)據(jù)入手的差異化
當(dāng)前很多行業(yè)還是存在缺乏數(shù)據(jù)積累的事實的,所以數(shù)據(jù)對于這部分公司來說就是最大的痛點。從數(shù)據(jù)角度入手的AI平臺,最直接的是可以主打提供行業(yè)數(shù)據(jù)。如果數(shù)據(jù)不可獲取,可以退一步和大數(shù)據(jù)平臺結(jié)合提供數(shù)據(jù)采集、清洗、標(biāo)注(自動、人工)等功能,解決用戶數(shù)據(jù)方面的痛點。
前邊提到的basicFinder,就是由標(biāo)注平臺逐步發(fā)展出來的AI平臺。
2)算力入手的差異化
不論是訓(xùn)練階段還是推理階段,AI模型對算力都是強依賴的,因此從算力入手的AI平臺也是發(fā)展最早的一種,一般都和云平臺緊密結(jié)合,最后的收益落腳點都是云資源。
隨著AI芯片發(fā)展,以嵌入式設(shè)備為載體的邊端智能也越來越多,所以算力入手也可以指嵌入式算力。華為算是以算力為核心的代表公司。
3)模型入手的差異化
雖然大多AI算法都有開源的版本,但開源模型往往是通用模型,沒有針對特定場景優(yōu)化,沒有一般沒法直接應(yīng)用。比如圖像識別在醫(yī)學(xué)領(lǐng)域和在自動駕駛領(lǐng)域可能用同樣的算法,但需要喂不同的數(shù)據(jù),進行不同的參數(shù)優(yōu)化,最后得到適用于不同場景的模型。比如face++就對人臉識別相關(guān)的各類模型都做了優(yōu)化。
一個熱門方向AI+行業(yè),就是在數(shù)據(jù)和模型角度都針對本行業(yè)進行差異化的設(shè)計。比如針對醫(yī)藥領(lǐng)域的醫(yī)渡云,針對稅務(wù)領(lǐng)域的慧算賬等等。
3. 如果要做AI平臺,怎么入手?
個人感覺現(xiàn)在做AI平臺是件很難的事情了,本身這類產(chǎn)品就已經(jīng)有點供大于求了,做差異化也需要結(jié)合已有的積累(無論是數(shù)據(jù)、算力還是模型),所以從頭做一個成功的AI平臺真的非常困難,留給AI平臺的機會可能只有+行業(yè)了。
大膽開麥:短期之內(nèi)做AI支撐平臺的難度遠(yuǎn)小于AI開發(fā)平臺,而成功率應(yīng)該是要高于AI開發(fā)平臺的。與其做一個大而全卻沒有明確目標(biāo)用戶的AI開發(fā)平臺,不如圍繞一個點做一個真正有人用的AI支撐平臺。
#專欄作家#
LCC,微信公眾號:sillybaby的互聯(lián)網(wǎng)求生指南,人人都是產(chǎn)品經(jīng)理專欄作家。2B+AI 產(chǎn)品經(jīng)理,相信科技向善,致力于用AI解決實際問題。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于 CC0 協(xié)議
邏輯很清晰,看完了很有啟發(fā)
文章講的挺清楚的,我主要看了思考的部分,給作者點個贊