華為大咖說 | 企業(yè)應(yīng)用AI大模型的“道、法、術(shù)”—— 法:場景篇

1 評論 2717 瀏覽 4 收藏 20 分鐘

人人都談AI大模型是未來趨勢,企業(yè)里也焦慮的不行,不搞AI怕掉隊(duì),搞了AI又難看到收益。問題出在哪兒呢?

從我們最近這幾年搞企業(yè)AI應(yīng)用的經(jīng)驗(yàn)來看,AI應(yīng)用要成功,首先要找到好場景,但說起來容易做起來難。于是我們就提出了“AI場景12問”,下面就是我對這套方法對詳細(xì)解析。

這是我的AI應(yīng)用系列第二篇,想談?wù)劇叭绾握覀€(gè)好場景”。場景找對了,那就成功一大半,這個(gè)道理放在AI大模型的應(yīng)用上,再合適不過。

核心觀點(diǎn):

本輪AI革命,在企業(yè)應(yīng)用還遠(yuǎn)未成熟,可奈何大家求AI心切,因此識別“好場景”至關(guān)重要

場景識別對了,大家投入才有回報(bào);場景識別不好,折騰一圈,一地雞毛

分享AI場景“12問”及其背后的思考邏輯

PS.觀點(diǎn)不保證絕對正確,歡迎留言討論,兼聽則明。

01 為什么AI大模型這么“挑活兒”?

當(dāng)我們站在企業(yè)內(nèi)部看AI大模型落地場景時(shí),很容易被兩種情緒裹挾:要么AI無所不能,要么AI啥也不是。

當(dāng)然,感謝業(yè)界的同行們一直不斷推出新產(chǎn)品,最近聽到的第二種聲音越來越少了,更多是急迫地希望做些什么。

坦率講,目前的企業(yè)AI大模型應(yīng)用場景,如果挨個(gè)拉出來盤ROI,有正收益的是少數(shù),特別是動(dòng)輒幾百上千張卡的場景,單純看眼下收益,都是很難講的。

但是,AI變革的浪潮已至,我們又必須要跟上,所以如何選擇一個(gè)好場景,就至關(guān)重要了。

這里我想分享“AI場景12問”和其中的思考邏輯。

02 如何識別好場景:AI場景“12問”

整體上,希望通過三個(gè)維度來評估:

D1:商業(yè)價(jià)值

D2:場景成熟度

D3:持續(xù)運(yùn)營

這三個(gè)方面,分別代表著是否值得做、是否能做、做了以后是否能持續(xù)演進(jìn)。

D1:商業(yè)價(jià)值

之前這個(gè)維度叫“業(yè)務(wù)價(jià)值”,為了更突出我們是商業(yè)組織,我特地改成了“商業(yè)價(jià)值”。

① 業(yè)務(wù)場景是否能清晰度量價(jià)值?

什么叫度量價(jià)值,無非是增收、降本、增效。能夠直接帶來收入增長或者成本降低,那是最好的,如果不能直接帶來收入,那效率提升也是不錯(cuò)的。

舉個(gè)最近的例子:

1.如果AI助手能直接跟客戶打電話,并且成單,那這就是“增收”,這是可遇不可求的場景;

2.如果AI助手可以替代我們的一些資源(包括人和物),那這就是“降本”,這種場景次之;

3.如果AI助手可以在作業(yè)過程中起到部分替代或輔助作用,使得我們的現(xiàn)有人或物做事時(shí),更快、質(zhì)量更好、效果更加,這就是“增效”,這種場景最次。

這里關(guān)于場景價(jià)值評估,我經(jīng)驗(yàn)也有限,總結(jié)了這么幾個(gè)小技巧,可供參考:

1.重點(diǎn)關(guān)注“增收”和“降本”類場景,盡可能將“提效”類場景轉(zhuǎn)換成這兩種場景,具體給出計(jì)算邏輯,一旦邏輯清晰,計(jì)算和評估非常簡單,價(jià)值顯而易見。

2.“提效”類場景數(shù)量最多,但魚龍混雜,是很需要花精力探討和分析的。說實(shí)在的,每個(gè)人都有“提效”的訴求,我也恨不能找個(gè)AI幫我碼字,這樣對于我來說可以輕松愉快一些,但是這對于公司來說意義有限,這就是最大的矛盾點(diǎn)。

3.如果真的要做“提效”類場景,避免使用百分比。我們太多場景喜歡用“提效xx%”,年年做,年年提,擠擠總會有,這個(gè)游戲很容易玩兒,但是壞處是在業(yè)務(wù)側(cè)很難形成真正的壓力和動(dòng)力,Nice to have,不做也無所謂,這樣的后果就是戰(zhàn)略資源被消耗掉了。如果要提,就把具體業(yè)務(wù)KPI的from和to拿出來,計(jì)算邏輯寫清楚。

4.“降本”的收益計(jì)算要從“投資”角度來看。這里我舉個(gè)“巡檢”的小例子,在沒有AI的時(shí)候,只能每天人工檢查x次,有了AI,可以每分鐘都檢查一次,這么一算,看似節(jié)約了不少成本。實(shí)際上,這個(gè)事兒就搞反了,應(yīng)該看業(yè)務(wù)上愿意投多少錢來增加人力做巡檢,AI節(jié)約的只是這些投資。

② 落地后收益評估,3年期ROI是否為正?

ROI評估這事兒非常重要,投資不看回報(bào),那是非營利性組織,咱們不能這么搞。

這一條存在,是為了加強(qiáng)第一條的存在感,同時(shí)也避免為了一個(gè)小場景過度的投入資源。

這里其實(shí)我們給AI類的投資留了個(gè)buffer,就是“3年期ROI”,核心是因?yàn)锳I大模型的應(yīng)用太新了,能夠上線即巔峰的場景又太少,大部分場景上線以后都不能直接形成價(jià)值,需要持續(xù)地喂養(yǎng)和優(yōu)化,因此我們希望資源和人力的投入可以在中期形成真正的業(yè)務(wù)價(jià)值。至于為啥是3年,說實(shí)話,這個(gè)數(shù)是我自己預(yù)估的,可能不同領(lǐng)域情況會有差異。

D2:場景成熟度

場景成熟度包括業(yè)務(wù)成熟度、數(shù)據(jù)成熟度、技術(shù)成熟度。這三個(gè)成熟度,是從華為AI團(tuán)隊(duì)借鑒來的,從數(shù)據(jù)、業(yè)務(wù)、技術(shù)三個(gè)角度來審視。具體細(xì)節(jié)內(nèi)容上,增加了一些自己的思考。?

D2.1?業(yè)務(wù)成熟度

③ 業(yè)務(wù)場景有明確的業(yè)務(wù)Owner(對投資和結(jié)果負(fù)責(zé))

Owner很重要,這個(gè)事兒可以倒著想,如果一個(gè)AI場景,沒有業(yè)務(wù)Owner,會導(dǎo)致什么問題:

1.沒有人投資,這是最直接的。雖然我們現(xiàn)在很多AI基建的投資都是IT空載,但是AI應(yīng)用的落地,終究是要業(yè)務(wù)投的,業(yè)務(wù)要感知到這個(gè)投資;

2.沒有人對結(jié)果負(fù)責(zé),這個(gè)也很重要。一般業(yè)務(wù)Owner是業(yè)務(wù)流程Owner,也是業(yè)務(wù)部門主官。他能夠?qū)Y(jié)果關(guān)切,一方面說明我們做的事兒對口,另一方面也是對業(yè)務(wù)團(tuán)隊(duì)的驅(qū)動(dòng)力(AI場景落地能不能成,我越來越覺得跟IT有關(guān)系,但是很有限)。

④ 業(yè)務(wù)場景有明確的流程規(guī)則(業(yè)務(wù)說得清)

這個(gè)不過多贅述,是不是說得清這事兒,其實(shí)就是業(yè)務(wù)是不是成熟,還是很容易辨別的。一個(gè)還在不斷調(diào)整、不斷變化的業(yè)務(wù),過早地搞AI,甚至數(shù)字化,對雙方都是一種煎熬。

⑤ 業(yè)務(wù)場景有明確的用戶觸點(diǎn)(業(yè)務(wù)已數(shù)字化)

智能化的基礎(chǔ)是數(shù)字化,業(yè)務(wù)數(shù)字化的程度,決定了AI能不能落地。這輪AI大模型的應(yīng)用,和傳統(tǒng)的IT應(yīng)用最大的差異,就是AI大模型需要數(shù)據(jù)喂養(yǎng)。沒有數(shù)字化,何來數(shù)據(jù)呢。(這里提到的數(shù)據(jù),是全場景、全流程、全方位的知識數(shù)據(jù),主打的就是“全”,越完整越好)

再一個(gè),沒有數(shù)字化,就意味著我們的AI落地以后,沒有現(xiàn)成的觸點(diǎn)接入,就意味著沒有現(xiàn)成的流量繼承,就意味著AI運(yùn)營的成本會大大增加。

從另一個(gè)角度看,如果一個(gè)業(yè)務(wù)場景還沒有數(shù)字化,或者數(shù)字化程度不高,以我的經(jīng)驗(yàn)來看,一定是有隱情的,還是不碰的好,要碰也是要先把數(shù)字化補(bǔ)上再說。

D2.2 數(shù)據(jù)成熟度

先提一嘴,這里提到的數(shù)據(jù),包含知識數(shù)據(jù),且暫時(shí)以知識數(shù)據(jù)為主。另外,這兩條,是從AI訓(xùn)練的兩個(gè)階段來看對數(shù)據(jù)的訴求,一個(gè)是冷啟動(dòng),一個(gè)是持續(xù)運(yùn)營。

⑥ 業(yè)務(wù)數(shù)據(jù)是否足夠支撐0~1冷啟動(dòng)(范圍清晰、完整、易獲得)

足夠支撐冷啟動(dòng),就意味著能夠達(dá)到上線標(biāo)準(zhǔn)。目前我們以AI答準(zhǔn)率60%為基線,判定一個(gè)場景是否能夠上線。當(dāng)然,也不排除有一些非常通用的場景,不需要額外數(shù)據(jù),基模型能力就能夠支撐,不過,這種“天使”場景可遇不可求,不在后續(xù)討論范圍內(nèi)。

具體落地時(shí),還考慮要到業(yè)務(wù)是否能夠清晰地說清楚需要哪些數(shù)據(jù)、是不是方便拿到這些數(shù)據(jù)。目前大部分知識類場景都是通過RAG(檢索增強(qiáng)生成(RAG)是指對大型語言模型輸出進(jìn)行優(yōu)化,使其能夠在生成響應(yīng)之前引用訓(xùn)練數(shù)據(jù)來源之外的權(quán)威知識庫)來實(shí)現(xiàn),R的本質(zhì)就是搜索,搜索就要有個(gè)知識清單,這個(gè)清單包括哪些知識,要業(yè)務(wù)輸出,然后IT來評估可行性。比如,我遇到有場景需要CSDN的技術(shù)博客,這類就很難獲取。

⑦ 業(yè)務(wù)數(shù)據(jù)是否隨作業(yè)持續(xù)產(chǎn)生、更新和反饋

一個(gè)AI場景冷啟動(dòng)結(jié)束后,就到了持續(xù)運(yùn)營階段。這個(gè)階段由于企業(yè)場景的用戶基數(shù)極其有限,沒辦法獲得海量的用戶側(cè)反饋(OpenAI的MAU有1億,我們可能大部分場景不會超過1千),這就使得我們將不遺余力地挖掘和利用作業(yè)過程中的每一個(gè)反饋和留痕數(shù)據(jù),確保最大化地從這些有限的數(shù)據(jù)中汲取價(jià)值。

這塊扯遠(yuǎn)一點(diǎn),我們后來探討出一種玩法,叫“作業(yè)即標(biāo)注”也就是說,每一次作業(yè)動(dòng)作的過程中,都預(yù)埋了標(biāo)注和反饋過程。這當(dāng)然需要巧妙的設(shè)計(jì),甚至略微改動(dòng)原有IT的交互邏輯,更甚至通過犧牲一點(diǎn)點(diǎn)用戶體驗(yàn)為代價(jià)。

D2.3?技術(shù)成熟度

⑧ 現(xiàn)有技術(shù)能力是否能夠支撐場景實(shí)現(xiàn)(技術(shù)可行、風(fēng)險(xiǎn)可控)

前面整這么多,總體上都是在做業(yè)務(wù)場景的評估和分析,也就是業(yè)務(wù)側(cè)的梳理和分析為主。基于前面評估OK的前提下,技術(shù)同學(xué)要開始工作了。

這里有個(gè)巨大的“陷阱”,或者是認(rèn)知上的反差:AI大模型為什么POC(POC:Proof of Concept,為觀點(diǎn)提供證據(jù))這么簡單,做好卻這么難?

在傳統(tǒng)IT開發(fā)的場景上,技術(shù)可行性是容易評估的,一般技術(shù)架構(gòu)或者SE同學(xué)都能夠勝任;但是針對AI大模型相關(guān)場景,很多時(shí)候是要評測的,也就是要試一下,做個(gè)POC。

不過,AI大模型的POC反倒是我見過最容易的,就是搞幾句提示詞拿基模型試一下。這輪AI創(chuàng)新的非常重要一環(huán),就是引入了自然語言指令,使得人人都能操作AI大模型。

然而,企業(yè)垂域場景,大概率第一次試結(jié)果是不太好的(大概就是瞎貓碰見死耗子的概率,我印象非常深刻,不論是文本還是多模態(tài),沒有超過10%的)。

于是下一步就是要AI技術(shù)專家或者AI SE來判斷下,這個(gè)場景是否可以改進(jìn)。改進(jìn)就分兩塊,要么是“等”,要么是“調(diào)”。

等,就是等AI基模型能力提升。

調(diào),就是要看,這個(gè)場景是不是能做微調(diào):針對典型任務(wù)(高頻、規(guī)范、標(biāo)準(zhǔn)),準(zhǔn)備幾百上千條數(shù)據(jù)調(diào)一下是合適的,但是針對尚未從業(yè)務(wù)上收斂、抽象的任務(wù),是沒法調(diào)的,也就是用少量數(shù)據(jù)沒法教會大模型干活。

另外還有一個(gè),就是“風(fēng)險(xiǎn)可控”,當(dāng)然這背后雖然可以建立一套AI安全的玩兒法,但是無論如何AI大模型的“幻覺”是一種不可消解的風(fēng)險(xiǎn),只能做風(fēng)險(xiǎn)規(guī)避和一定程度的接納。如果某個(gè)場景不能容忍任何不確定性,那就確實(shí)還不適合,至少當(dāng)下不行。

⑨公司內(nèi)是否有成功經(jīng)驗(yàn),可以復(fù)用/借鑒

這里我特地強(qiáng)調(diào),是公司內(nèi)部有成功經(jīng)驗(yàn),有三個(gè)意圖:

1.正視自己的技術(shù)能力差距,無論是基模型還是模型應(yīng)用。比如我們看到GPT4可以干啥、甚至微軟office的copilot可以干啥,對于我們的參考意義有限。把有限的資源押注在這樣一些不確定性上,是很有風(fēng)險(xiǎn)的,卡點(diǎn)會非常多。

2.公司內(nèi)部的同學(xué)已經(jīng)做成,已經(jīng)拿出來分享的場景,反而是我們喜而樂見的,這意味著“觸手可及”,拿來抄個(gè)作業(yè)很順手,哪怕不能抄,交流交流學(xué)習(xí)討論下也是不錯(cuò)的。

3.我一直認(rèn)為我們是AI技術(shù)應(yīng)用團(tuán)隊(duì),要以業(yè)務(wù)成功為唯一目標(biāo),把突破創(chuàng)新讓給更專業(yè)的人,做好AI應(yīng)用過程的學(xué)習(xí)、提煉、總結(jié),是我們的“道”。不求高精尖,只求能落地,越簡單、低成本、易復(fù)制,就說明把AI應(yīng)用玩兒明白了。

D3:持續(xù)運(yùn)營

這一章節(jié)是我們最后加的,并不是不重要,而是在早期易被忽視,很難充分意識到其重要性。

“持續(xù)運(yùn)營”放在這里,是為了突出“生”和“養(yǎng)”同等重要,甚至“養(yǎng)好”比“生好”在項(xiàng)目成功、業(yè)務(wù)成功方面更重要,也是希望跟業(yè)務(wù)主管強(qiáng)調(diào)這方面的重要性。

上圖是一個(gè)AI助手的持續(xù)運(yùn)營示例,可供參考,核心是業(yè)務(wù)和IT的聯(lián)合,且以業(yè)務(wù)側(cè)為主(在業(yè)務(wù)運(yùn)營、知識運(yùn)營之外,新增了AI訓(xùn)練師角色)。

⑩ 有清晰的業(yè)務(wù)運(yùn)營目標(biāo)

一個(gè)AI場景,除了業(yè)務(wù)價(jià)值的指標(biāo)之外,還需要很多過程指標(biāo),需要觀測其分子分母、周邊因素、關(guān)鍵依賴(比如知識)、副作用等等,業(yè)務(wù)運(yùn)營是需要設(shè)計(jì)的。

?業(yè)務(wù)目標(biāo)有運(yùn)營數(shù)據(jù)支撐(過程可度量)

原則上一個(gè)相對成熟的業(yè)務(wù),會有一套現(xiàn)成的業(yè)務(wù)運(yùn)營體系,我們要做的是從其中摘到AI應(yīng)用強(qiáng)相關(guān)的部分,再加入IT側(cè)的過程指標(biāo),如AI應(yīng)用情況(比如性能、并發(fā)、UV/PV、資源消耗)、反饋情況(比如答準(zhǔn)率、搜準(zhǔn)率)、NSS等等。

?業(yè)務(wù)有持續(xù)運(yùn)營的組織、資源、機(jī)制和能力

運(yùn)營要有流程和組織支撐,才能有生命力。我司的管理哲學(xué)就是把公司制度建筑在流程上,所以沒有固定的模式在支撐,運(yùn)營工作會變成“腳踩西瓜皮”,干到哪兒算哪兒,甚至有一搭沒一搭地搞,哪怕搞看板、搞分析、搞預(yù)警,都沒個(gè)啥用,最后生成一堆任務(wù)也沒人執(zhí)行。

當(dāng)然,這一切背后,其實(shí)只有一個(gè),就是要業(yè)務(wù)主管非常清楚地意識到,這里需要投入,而且需要持續(xù)投入。

以上這十二個(gè)問題,并不是我個(gè)人的經(jīng)驗(yàn),是華為的集體智慧。

最后,我還想說,目前業(yè)界關(guān)于AI應(yīng)用有兩種認(rèn)知:

1.一種是“AI+”:真正的AI應(yīng)用是沒有AI就無法運(yùn)行的。畢竟大家總用“汽車”和“馬車”來類比AI和傳統(tǒng)IT,給馬車裝個(gè)內(nèi)燃機(jī)可能不是我們想做的。現(xiàn)在的很多創(chuàng)新類的AI產(chǎn)品,包括chatgpt就屬于這種。

2.一種是“+AI”:就是在很多場景上,增加AI屬性,一點(diǎn)點(diǎn)翻盤。這個(gè)觀點(diǎn)一樣有支撐,就像移動(dòng)互聯(lián)網(wǎng)來了之后,PC網(wǎng)站還在,線下門店也還在,但是互相支撐后,效果更好了?,F(xiàn)在的copilot式操作,就是這么個(gè)玩法。

這里的核心,是你拿AI當(dāng)什么。如果你認(rèn)為這是生產(chǎn)力工具,那一定是all in,全換,過去不值得留戀。如果你認(rèn)為這是基礎(chǔ)設(shè)施,那一定是適用的先來,適配一個(gè)切換一個(gè)。

我自己內(nèi)心是認(rèn)可生產(chǎn)力工具的說法的,但是現(xiàn)實(shí)情況是企業(yè)要運(yùn)轉(zhuǎn),運(yùn)轉(zhuǎn)邏輯是寫好的,現(xiàn)在掀桌子就都沒得吃。

所以,我一直有個(gè)觀點(diǎn),當(dāng)下的AI大模型場景應(yīng)用,是面向未來的一種蓄力和能力儲備,從量變到質(zhì)變的過程。比如我們從去年單獨(dú)看客服AI,到現(xiàn)在可以看客戶服務(wù)全流程,逐漸把售前、售中、售后都拉齊以后,一個(gè)AI+的雛形就有了,這個(gè)過程可能需要3~5年甚至更久,但非常值得。

作者:鄭巖(華為云AI變革首席專家)

本文由人人都是產(chǎn)品經(jīng)理作者【鄭巖】,微信公眾號:【時(shí)習(xí)知】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 說的很有道理,但感覺是車轱轆話。這篇文章把AI換成互聯(lián)網(wǎng),在十年前也說得通;把AI換成ERP,在二十年前也說得通??瓷先ナ钦fAI,實(shí)際上放在新興技術(shù)或者科技上都可以帶入,希望能看到更有深度關(guān)于AI的說明

    來自廣東 回復(fù)