金融和大模型的“兩層皮”問題
隨著大模型浪潮的普及,企業(yè)不斷研發(fā)AI大模型,但在這個過程中,高科技到產(chǎn)業(yè)落地的會有一些困惑,金融領(lǐng)域主要困惑是“兩層皮”,意味著大模型在實(shí)際應(yīng)用中還是存在賣家秀和買家秀的差距。本文將講清楚究竟是哪些問題拉開了金融和大模型之間的gap。
幾年前,我采訪一位產(chǎn)業(yè)專家,他提到了一個高科技到產(chǎn)業(yè)落地的主要困惑:兩層皮。
一些特別牛的技術(shù)成果在論文上發(fā)表了,這是一層皮。企業(yè)的技術(shù)人員,將這些成果產(chǎn)品化、商品化的時候,可能出于工程化的原因,會做一些簡化,這是另一層皮。
兩層皮之間,是有g(shù)ap的,就像賣家秀和買家秀一樣,并不是融合且一致的。
而往往是那些有技術(shù)人才、研發(fā)能力、轉(zhuǎn)化意愿的企業(yè),會先碰到“兩層皮”的問題,產(chǎn)生對技術(shù)有效性、ROI回報率不明確的疑慮。
在沖入大模型熱潮的各路人馬中,金融機(jī)構(gòu)可能是率先遭遇“兩層皮”挑戰(zhàn)的。
我們知道,金融產(chǎn)業(yè)一貫是新技術(shù)的早期采用者,在AI方面的嘗試很早就開始了,可以說是產(chǎn)業(yè)AI化的“優(yōu)等生”,更是有著良好的信息化、數(shù)字化基礎(chǔ)。金融機(jī)構(gòu)的前中后臺各個場景中,都有被大模型降本增效的空間。因此,金融也被認(rèn)為是大模型落地的首選場景。
作為大模型落地的先行者,金融領(lǐng)域如果解決不了“兩層皮”的問題,意味著大模型在實(shí)際應(yīng)用中還是存在賣家秀和買家秀的差距。
本文希望說清楚,究竟是哪些問題拉開了金融和大模型之間的gap?
問題一:以誰為主?
既然是做大模型,當(dāng)然是由OpenAI/BAT這樣的科技企業(yè)和技術(shù)公司為主導(dǎo)了,而這也是金融機(jī)構(gòu)不想看到的事。
有個金融領(lǐng)域的專家告訴我們,這波大模型的熱度起來之后,金融機(jī)構(gòu)都特別焦慮,有一種FOMO(Fear of Missing Out害怕錯過)情緒。
因?yàn)樯弦徊夹g(shù)浪潮,智能手機(jī)和移動互聯(lián)網(wǎng)崛起,導(dǎo)致傳統(tǒng)銀行、券商的很多業(yè)務(wù),被互聯(lián)網(wǎng)金融公司分走了。在業(yè)內(nèi)人看來,這種“史詩級的悲劇”絕不能重演。
在技術(shù)焦慮的驅(qū)動下,金融機(jī)構(gòu)非常積極想跟上大模型的風(fēng)口,幾乎不需要科技廠商做太多市場教育,整個行業(yè)在接納大模型這件事上表現(xiàn)極其良好。
同時,金融機(jī)構(gòu)也非常重視將金融大模型的“核心籌碼”牢牢掌握自己手里,強(qiáng)調(diào)“以我為主”。有銀行業(yè)人士提出:只有適應(yīng)銀行的大模型,才是真正可以深度應(yīng)用到場景里、業(yè)務(wù)流程中的大模型。具體怎么做呢?
一類是硬籌碼
對金融機(jī)構(gòu)來說,數(shù)據(jù)安全隱私合規(guī),是沒有妥協(xié)的硬指標(biāo),有非常嚴(yán)格的要求。這也就導(dǎo)致,大模型落地金融更加需要本地化的搭建和私有化部署、運(yùn)行。
本地部署的要求,對大模型廠商來說有利有弊。有利的地方是,相比其他行業(yè)直接調(diào)用API接口的MaaS模式,本地部署的客單價高、利潤大,商業(yè)價值更高。不利的地方在于,私有部署需要在云化方案、數(shù)據(jù)處理、存儲、模型訓(xùn)練、提示工程、運(yùn)維服務(wù)等多方面,形成一套完整的解決方案,競爭焦點(diǎn)不僅是基座模型本身,這就增加了技術(shù)服務(wù)商的成本和難度。
另一類是軟籌碼
金融大模型要表現(xiàn)良好,需要專有數(shù)據(jù)的精調(diào)、領(lǐng)域知識的引入、基于場景的反饋,而銀行業(yè)本身的數(shù)字化基礎(chǔ)非常好,數(shù)據(jù)積累深厚,這便成了掌握在手中的軟籌碼。
摩根斯坦利公司在研發(fā)生成式AI產(chǎn)品中,就結(jié)合超過10萬份財(cái)務(wù)報告、內(nèi)部資料和金融文獻(xiàn)等,對OpenAI的基礎(chǔ)模型進(jìn)行微調(diào)。據(jù)透露,我國農(nóng)業(yè)銀行業(yè)也沉淀了2.6TB的高質(zhì)量訓(xùn)練數(shù)據(jù),用于大模型的訓(xùn)練。此外,基礎(chǔ)大模型雖然通識能力很強(qiáng),但“專業(yè)課”能力不足,缺少金融專業(yè)知識,加上金融場景業(yè)務(wù)復(fù)雜,初出茅廬的大模型,要形成高質(zhì)量的服務(wù)能力,成為優(yōu)秀的“AI副駕駛”,并不容易。
這就要求,大模型廠商和技術(shù)公司,改變“技術(shù)為中心”“我是來賦能/顛覆你的”的慣有思路,增強(qiáng)服務(wù)意識,與金融客戶合作,以金融客戶為主。
大模型落地金融絕不是,也不能是又一次“技術(shù)顛覆行業(yè)”。無論是通用大模型廠商還是ISV服務(wù)商集成商,都要在“客戶為主”這條baseline(基線)上跳舞。
問題二:融合為什么難?
以金融機(jī)構(gòu)為主,那科技公司豈不是成了“大模型施工隊(duì)”,只能收點(diǎn)辛苦費(fèi),發(fā)揮不了技術(shù)創(chuàng)新性了?
大no特no。
一來,金融AI不是新事物
金融機(jī)構(gòu),并不是大家想的那樣,面對AI一竅不通。事實(shí)上,在所有行業(yè)里,金融領(lǐng)域的“含AI量”絕對是排名前列的。幾年前我采訪國內(nèi)某985高校人工智能學(xué)院的院長,對方直言,AI方向的學(xué)生畢業(yè)后不去BAT、不去創(chuàng)業(yè)公司,去的是招商銀行這類金融機(jī)構(gòu)下面的信息中心/技術(shù)中心,搞金融的人工智能。
所以,金融AI的趨勢其實(shí)早在幾年前,就已經(jīng)大幅開展了,這也是為什么今年大模型熱度剛起,國內(nèi)工行、平安、農(nóng)行、招商銀行、中信銀行等一大波銀行,能很快組建了自己的GPT大模型專項(xiàng)研究團(tuán)隊(duì)。銀行能及時行動,靠的就是幾年來投入AI的積累。所以,以金融機(jī)構(gòu)為主,也做得好金融大模型。
二來,大模型是個新事物
大模型究竟比這些“傳統(tǒng)AI”強(qiáng)在哪里,能干什么?這是一個完全空白的新問題。
理論上講,大模型可以貫穿銀行全產(chǎn)業(yè)鏈的各個環(huán)節(jié),每條業(yè)務(wù)線、每個智能都能找到LLM的應(yīng)用場景。但現(xiàn)實(shí)中,全環(huán)節(jié)全面上馬大模型,怎么跟業(yè)務(wù)結(jié)合都不清楚,意味著會有大量探索是失敗的、浪費(fèi)的。
要加速探索、減少成本、降低風(fēng)險就必須金融機(jī)構(gòu)和科技公司一起,讓金融專家、算法科學(xué)家、工程師、測試員等坐在一起,一點(diǎn)一點(diǎn)地共同探索,深入洞察場景,對需求“去偽存真”。
有金融機(jī)構(gòu)的負(fù)責(zé)人直言,今天金融業(yè)能夠獲取的智能化應(yīng)用非常豐富,翻開AI企業(yè)的金融產(chǎn)品推介手冊,可以看到上百個細(xì)分能力,但如何選取最合適的整合到自家機(jī)構(gòu)的業(yè)務(wù)中,這個過程中會有大量的試錯。
目前來看,業(yè)內(nèi)基本已經(jīng)達(dá)成共識,金融大模型,必須優(yōu)選場景。有幾個關(guān)鍵詞:
1.高頻次。在一些重點(diǎn)場景、重點(diǎn)應(yīng)用上,盡快讓大模型可以上崗解決問題,降低應(yīng)用的門檻。比如智能客服、智能投顧等原本的勞動密集型崗位,可以很快帶來顯著的降本增效成果。
2.高價值。對于一些有社會價值、商業(yè)價值的領(lǐng)域,率先開始探索。比如普惠金融,就是目前從政府到民間都非??粗械慕鹑诜?wù),需要精準(zhǔn)的數(shù)據(jù)洞察、更低成本、高可及性的服務(wù)能力,去綜合降低中小微企業(yè)/商家的金融成本。其中,大模型的多模態(tài)表達(dá)能力、強(qiáng)大的理解分析能力都可以發(fā)揮很好的作用。
3.易部署。不少金融從業(yè)者,聽到大模型的第一反應(yīng)是,這事兒小模型能干嗎?大模型對硬件基礎(chǔ)設(shè)施的算力、穩(wěn)定性等都提出了更高的要求,金融機(jī)構(gòu)又在加速推進(jìn)國產(chǎn)化硬件,各個業(yè)務(wù)線都部署大模型,帶來的性能壓力、成本壓力、部署壓力都是非常大的。所以,大模型壓縮優(yōu)化后或者同樣效果的小模型,可以落地的業(yè)務(wù)場景,比如大模型生成銀行理財(cái)產(chǎn)品推薦建議,大模型作為券商機(jī)構(gòu)的研究助理,對這些已經(jīng)在應(yīng)用的傳統(tǒng)AI,用大模型進(jìn)行升級,不會增加過高的算力成本和工程量,是更易落地的漸進(jìn)式場景。
正因?yàn)榇竽P褪且粚悠ぃ瑢?shí)際應(yīng)用是另一層皮,兩層皮怎么融合,在哪些場景優(yōu)先融合,是一條無人走過的路。金融機(jī)構(gòu)和科技企業(yè),都不能獨(dú)行,唯有緊密配合,才能尋找到金融場景與大模型之間的最佳融合之路。
問題三:鐐銬怎么這么多?
是不是找到場景,重點(diǎn)攻克,然后規(guī)?;瘡?fù)制,金融大模型就能突飛猛進(jìn)了?
我們說金融機(jī)構(gòu)“人多、錢多、技術(shù)多”,只是相對其他行業(yè)而言?,F(xiàn)實(shí)中,金融機(jī)構(gòu)也不可能拿出無限的預(yù)算、投入無限的人力、開放無限的場景,供大模型隨意大顯身手。而且,金融領(lǐng)域還存在大量的中小銀行、券商,能負(fù)擔(dān)的技術(shù)創(chuàng)新成本也是有限的。
一位銀行從業(yè)者提到AIGC就說:競爭是加劇的,人員是有限的,人才是缺乏的,費(fèi)用是緊張的。
可以說,帶著鐐銬跳舞,正是金融和大模型“兩層皮”“賣家秀和買家秀”的關(guān)鍵原因。
比如算力的問題。國產(chǎn)化替代進(jìn)程中,金融大模型要打破訓(xùn)練昂貴、算力成本高的桎梏,對模型廠商的硬件基礎(chǔ)、自研能力、生態(tài)兼容能力、軟件協(xié)同優(yōu)化,提出了綜合的考驗(yàn)。
目前,頭部云廠商都下大力氣在自研硬件上,比如百度的昆侖、阿里的倚天、華為的昇騰,以及配套的軟件、生態(tài),沒有這些很難真正拿下金融大模型。
還有技術(shù)本身的限制。坦率來說,大模型技術(shù)本身還存在不少問題,尤其是在金融領(lǐng)域落地,必須解決幻覺問題,胡說八道對嚴(yán)謹(jǐn)?shù)慕鹑跇I(yè)務(wù)是不可接受的。模型黑箱性會導(dǎo)致AI智能決策不可信、不敢信,無法真正用于金融投顧、市場分析決策。
另外,金融機(jī)構(gòu)也會衡量ROI投入產(chǎn)出比。但因?yàn)榻鹑趫鼍爸校呀?jīng)沉淀了大量的傳統(tǒng)AI,比如智能客服,大家可能都接過機(jī)器人打來的產(chǎn)品推銷電話、賬單催收電話。
所以引入大模型后,究竟能給客戶帶來多少收益,回報產(chǎn)出比ROI怎么評估,哪些是大模型帶來的提升,這些目前還沒有一個明確的衡量標(biāo)準(zhǔn)。
無法量化大模型給業(yè)務(wù)帶來的貢獻(xiàn),顯然會導(dǎo)致大模型廠商的無序競爭,或者比拼客戶關(guān)系,這也成為金融大模型效果不彰的一個隱憂。
消除產(chǎn)業(yè)和大模型之間的gap,將會是接下來,大模型賽道的標(biāo)準(zhǔn)動作。
這個過程中,最早遇到“兩層皮”問題的金融大模型,或許會提供大量有益的參考和實(shí)踐,而金融機(jī)構(gòu)也會成為更早挖掘到金礦的第一批大模型淘金者。
作者:藏狐
來源公眾號:腦極體(ID:unity007),從技術(shù)協(xié)同到產(chǎn)業(yè)革命,從智能密鑰到已知盡頭。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @腦極體 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
用哪里都行,千萬別用在股市上,坑死