銀行如何構(gòu)建大語(yǔ)言模型產(chǎn)品
自從ChatGPT發(fā)布之后,大模型對(duì)知識(shí)整理、歸納、推理、總結(jié)方面強(qiáng)大的能力引起了大家的關(guān)注。而銀行領(lǐng)域的專業(yè)性和特殊性,更要求自己構(gòu)建LLM產(chǎn)品。本文針對(duì)銀行使用大模型的場(chǎng)景、方式進(jìn)行了詳細(xì)的分析,并給出了銀行做大模型的實(shí)踐樣例,供大家參考。
目前大語(yǔ)言模型(Large language mode,LLM),以下簡(jiǎn)稱LLM,非?;鸨?,各種基于LLM的產(chǎn)品如雨后春筍般出現(xiàn)。以O(shè)penAI推出的GPT4為代表的LLM產(chǎn)品,為大家展示了LLM在對(duì)知識(shí)整理、歸納、推理、總結(jié)方面強(qiáng)大的能力。
LLM借助于思維鏈(Chain Of Thought,CoT)技術(shù),可以使LLM生成推理路徑,將復(fù)雜問(wèn)題拆解為多個(gè)簡(jiǎn)單步驟分別處理,從而模擬人類思考的過(guò)程。
OpenAI近期推出的Sora產(chǎn)品,同樣令人震撼,給出一些提示詞,Sora便可以根據(jù)文本生成一段生動(dòng)的視頻,效果不亞于專業(yè)的視頻工作室耗費(fèi)幾天做出來(lái)的視頻。
例如通過(guò)提示詞: 一段廣角視頻,一輛拉力車穿過(guò)紅杉林,出現(xiàn)在樹(shù)后,在急轉(zhuǎn)彎時(shí)向空中噴灑泥土,電影膠片拍攝于35毫米景深 。Sora會(huì)生成一段高清的10秒左右的視頻,非常逼真。大家有興趣可以使用Sora體驗(yàn)一下。
由此可見(jiàn)LLM在人機(jī)對(duì)話、知識(shí)推理、歸納總結(jié)、圖片和視頻生成上功能確實(shí)非常強(qiáng)大,只要我們給定的提示詞足夠恰當(dāng),LLM便能給出我們想要的結(jié)果。
很多垂直領(lǐng)域,已經(jīng)出現(xiàn)了許多LLM產(chǎn)品。本文收集整理了一些,大家有興趣的可以重點(diǎn)深入了解。一些關(guān)于金融領(lǐng)域的LLM產(chǎn)品主要基于金融知識(shí)與問(wèn)答,金融機(jī)構(gòu)可以作為增值服務(wù)提供給客戶,是一個(gè)非常不錯(cuò)的應(yīng)用場(chǎng)景。
一、銀行使用大模型的場(chǎng)景
對(duì)于銀行而言,LLM產(chǎn)品的應(yīng)用場(chǎng)景有很多。任何工具的使用,其主要目標(biāo)是提升客戶服務(wù)質(zhì)量,節(jié)省企業(yè)運(yùn)營(yíng)成本,增加企業(yè)收益以及提升企業(yè)社會(huì)效益。概括下來(lái),就是降本增效。
我們知道,銀行的主營(yíng)業(yè)務(wù)主要是存款業(yè)務(wù)、貸款業(yè)務(wù)、外匯與國(guó)際業(yè)務(wù),支付和結(jié)算、投資理財(cái)、托管、電子銀行以及銀行卡業(yè)務(wù)等。
除此之外,還有清算、繳費(fèi)、代理發(fā)行金融債券、票據(jù)貼現(xiàn)、代收代付等業(yè)務(wù)。很多銀行也推出了銀行業(yè)務(wù)相關(guān)的信息平臺(tái)服務(wù),例如招商銀行的CBS(Cross-bank Solution for Cash Management,跨銀行現(xiàn)金管理平臺(tái))。
如果從銀行服務(wù)的視角來(lái)看,針對(duì)個(gè)人業(yè)務(wù)和企業(yè)業(yè)務(wù)的服務(wù)劃分,可以進(jìn)行如下劃分。
個(gè)人業(yè)務(wù):信用卡、私人銀行、個(gè)人貸款、儲(chǔ)蓄業(yè)務(wù)、居家生活、投資理財(cái)、跨境金融、個(gè)人手機(jī)與網(wǎng)上銀行等。
企業(yè)業(yè)務(wù):國(guó)內(nèi)業(yè)務(wù)、跨境金融、投資銀行、資產(chǎn)托管、同業(yè)金融、企業(yè)財(cái)富管理、融資租賃、企業(yè)手機(jī)與網(wǎng)上銀行等。
銀行利潤(rùn)的主要來(lái)源是存貸利差。因此,如何能最大限度減少獲客成本,識(shí)別優(yōu)質(zhì)貸款客戶,提升放貸質(zhì)量,減少銀行壞賬帶來(lái)的損失,是大模型產(chǎn)品具有應(yīng)用價(jià)值的場(chǎng)景之一,通過(guò)對(duì)歷史客戶數(shù)據(jù)進(jìn)行分析,給出相對(duì)恰當(dāng)?shù)氖谛沤Y(jié)果,快速審批,全方位風(fēng)險(xiǎn)管理。
對(duì)于銀行客戶服務(wù)水平,也是提升客戶滿意度非常關(guān)鍵的指標(biāo),利用大模型真實(shí)地與客戶進(jìn)行對(duì)話,并且非常精準(zhǔn)地解答用戶提出的問(wèn)題,可以極大降低銀行的客服人工成本。目前市面上已經(jīng)有類型的產(chǎn)品,機(jī)器對(duì)話的仿真程度已經(jīng)同真人對(duì)話效果相差無(wú)幾。
大模型也可以為銀行的管理者快速提供需要的信息,對(duì)經(jīng)營(yíng)數(shù)據(jù)進(jìn)行分析,理解并快速繪制圖表。相比于通過(guò)人工以周報(bào)的形式向銀行管理層呈現(xiàn)數(shù)據(jù)圖表,往往需要大量人工操作數(shù)據(jù)分析平臺(tái)進(jìn)行數(shù)據(jù)整理,大模型可以快速動(dòng)態(tài)提供數(shù)據(jù),為管理層提供決策依據(jù),進(jìn)而提升銀行的管理效率與管理水平。
對(duì)于新產(chǎn)品創(chuàng)新,大模型可以通過(guò)其超強(qiáng)的計(jì)算能力與數(shù)據(jù)分析,能夠快速進(jìn)行金融計(jì)算與建模,根據(jù)當(dāng)前銀行的歷史產(chǎn)品銷售情況,并結(jié)合客戶畫(huà)像,結(jié)合利率計(jì)算、風(fēng)險(xiǎn)評(píng)估。給出最優(yōu)的產(chǎn)品方案。
二、銀行構(gòu)建大模型的方式
根據(jù)我們對(duì)銀行使用大在模型場(chǎng)景的梳理后發(fā)現(xiàn),在大模型還沒(méi)有出現(xiàn)之前,其實(shí)銀行的業(yè)務(wù)已經(jīng)存在,并且也已經(jīng)通過(guò)數(shù)智化的方式對(duì)這些業(yè)務(wù)進(jìn)行賦能。
例如基于大數(shù)據(jù)對(duì)信貸用戶的智能評(píng)分與授信,根據(jù)用戶的使用習(xí)慣和畫(huà)像進(jìn)行個(gè)性化信息或是產(chǎn)品的推薦,客戶服務(wù)呼叫中心使用的NLP(Natural Language Processing,自然語(yǔ)言處理)、STT(Speech To Text,語(yǔ)言轉(zhuǎn)文本)以及TTS(Text To Speech,文本轉(zhuǎn)語(yǔ)言)。
大模型的出現(xiàn),可以簡(jiǎn)單理解為是原有銀行人工智能應(yīng)用的升級(jí),使計(jì)算機(jī)變得更聰明,產(chǎn)品效果更絲滑,用戶體驗(yàn)更完善。
由于篇幅有限,本文主要以客戶服務(wù)NLP為場(chǎng)景,來(lái)講解銀行構(gòu)建大模型的方式。實(shí)現(xiàn)為銀行的每位客戶建立7×24小時(shí)隨身專屬顧問(wèn),降低銀行人工客服與專屬顧問(wèn)成本,提升銀行智能客戶服務(wù)水平,增加客戶粘性,提升用戶滿意度與忠誠(chéng)度。
以消費(fèi)貸款為例,很多用戶收到銀行的營(yíng)銷信息時(shí),會(huì)遇到這樣的問(wèn)題,短信提醒告知用戶有獲得了一筆授信額度,利率非常優(yōu)惠,但當(dāng)用戶實(shí)際操作時(shí),卻被告知沒(méi)有額度,或是利率非常高,這樣給用戶的體驗(yàn)非常差,失去用戶信任,當(dāng)下次用戶再收到這樣的營(yíng)銷信息時(shí),便很難被吸引,最終導(dǎo)致用戶流失。
構(gòu)建銀行客服場(chǎng)景的NLP大模型產(chǎn)品,可以通過(guò)以下方式進(jìn)行。
1. Embedding 初始化
Embedding基本的理念是用一個(gè)低維的向量表示一個(gè)物體,這個(gè)向量可以是一個(gè)詞,一個(gè)商品,或是一個(gè)執(zhí)行的任務(wù)等。對(duì)于銀行智能客服,用戶輸入的一般是一段文本,如果使用大模型,Embedding的過(guò)程,也是Token化的過(guò)程。
Token是大模型中常見(jiàn)的交互與表示方式,也是一種計(jì)費(fèi)方式。例如在GPT-4模型中,每1000個(gè)token的費(fèi)用為0.03美元。
對(duì)于銀行客服產(chǎn)品的大模型而言,將內(nèi)容Token化也便于從客觀的視角評(píng)價(jià)產(chǎn)品價(jià)值。最后可以通過(guò)計(jì)算實(shí)際同用戶互動(dòng)的Token數(shù),來(lái)評(píng)估銀行客戶大模型的產(chǎn)品為銀行實(shí)際帶來(lái)的價(jià)值。
如何將內(nèi)容Token化,可以按字分隔,也可以按詞分隔。例如,用戶在向智能客服咨詢,“本期信用卡賬單應(yīng)還款是多少?”。
如果按字Token化,則為:“本|期| 信|用|卡|賬|單|應(yīng)|還|款|是|多|少|?”。
如果按詞Token化,則為:“本期 |信用卡|賬單|應(yīng)|還款|是|多少|?”。
我們知道,其實(shí)句子有上下文,通過(guò)上下文的關(guān)聯(lián),實(shí)現(xiàn)語(yǔ)義的表達(dá)。如果有足夠多的語(yǔ)料,也可以將句子作為Token。
2. Token 標(biāo)注
將內(nèi)容Token化之后,需要對(duì)Token進(jìn)一步進(jìn)行標(biāo)注。標(biāo)注的作用是為了增加計(jì)算機(jī)對(duì)于用戶語(yǔ)義甚至是情感的理解,提升機(jī)器回答用戶問(wèn)題的精準(zhǔn)度。
通過(guò)對(duì)用戶內(nèi)容Token標(biāo)注,我們可以對(duì)用戶內(nèi)容進(jìn)行實(shí)體抽取,用戶的情感分析,還可以根據(jù)標(biāo)注的內(nèi)容,同關(guān)系圖譜或知識(shí)圖譜進(jìn)行關(guān)聯(lián),發(fā)掘更多信息。
假設(shè)我們有一個(gè)標(biāo)簽集合,集合的內(nèi)容是 {scop,name,action,amount,type,…}。我們根據(jù)標(biāo)簽的集合,以及字典信息,對(duì)用戶提問(wèn)“本期信用卡賬單應(yīng)還款是多少”的文本內(nèi)容做如下標(biāo)注。
其中,B代表Begin,意味著標(biāo)注的開(kāi)始,E代表標(biāo)注的結(jié)束。如果一個(gè)詞比較長(zhǎng),中間有多個(gè)字,可以用多個(gè)大寫的I表示。橫線- 后面的內(nèi)容是對(duì)內(nèi)容的標(biāo)注。例如,信用卡,我們認(rèn)為是一個(gè)名稱,可以標(biāo)注為 【name】;還款是一個(gè)動(dòng)作,我們可以標(biāo)注為【action】。
對(duì)于傳統(tǒng)的銀行智能客服機(jī)器人,其實(shí)這一步完成之后,基本就可以搭建起一個(gè)簡(jiǎn)單的客服機(jī)器人,通過(guò)對(duì)內(nèi)容配置相應(yīng)的執(zhí)行任務(wù),結(jié)合相似度計(jì)算或是簡(jiǎn)單的機(jī)器學(xué)習(xí)就可以回答用戶問(wèn)題。
但是在大語(yǔ)言模型,我們還需要進(jìn)一步對(duì)內(nèi)容進(jìn)行訓(xùn)練,擴(kuò)展客服機(jī)器人的服務(wù)邊界,讓用戶感覺(jué)更像是同真人在溝通。同時(shí),在服務(wù)用戶的同時(shí),還可以像真人客服一樣“順便”為用戶推薦些產(chǎn)品。
3. Attention機(jī)制
Attention機(jī)制,出現(xiàn)在2017年的一篇論文《Attention is All You Need》中,在這篇論文中提出了Transformer的模型架構(gòu),并針對(duì)機(jī)器翻譯這種場(chǎng)景做了實(shí)驗(yàn),獲得比較好的效果。
早些時(shí)候使用Seq2Seq模型,即序列到序列模型,可用于文本翻譯,主要原理是:接收的輸入是一個(gè)(單詞、字母、圖像特征)序列,輸出是另外一個(gè)序列。
但是Seq2Seq模型有個(gè)不足之處是僅是根據(jù)序列進(jìn)行映射,不考慮上下文,語(yǔ)義,語(yǔ)法,模型效果不是很好。Transformer模型中提出了Self Attention的結(jié)構(gòu),取代了以往 NLP任務(wù)中的 RNN 網(wǎng)絡(luò)結(jié)構(gòu)。
用戶輸入在Encoder(編碼器)的文本數(shù)據(jù),首先會(huì)經(jīng)過(guò)Self Attention 層,Self Attention層處理詞的時(shí)候,不僅會(huì)使用這個(gè)詞本身的信息,也會(huì)使用句子中其他詞的信息。
Attention機(jī)制解決了【Encoder(編碼器)-Decoder(解碼器)】結(jié)構(gòu)存在的長(zhǎng)輸入序列問(wèn)題,其功能可以被描述為將查詢和一組鍵值對(duì)映射到輸出,其中查詢(Q)、鍵(K)、值(V)和輸出(O)都是向量,輸出可以通過(guò)對(duì)查詢的值加權(quán)來(lái)計(jì)算。
簡(jiǎn)單理解,就是先用問(wèn)題輸入Query,檢索Key- Value 的記錄,找到和問(wèn)題相似的記錄中的Key值,計(jì)算相關(guān)性的分?jǐn)?shù),然后對(duì)Value Embedding進(jìn)行加權(quán)求和,從而衍生出了Self Attention中的Q、K、V的表示。主要實(shí)現(xiàn)步驟如下圖所示:
4. 內(nèi)容安全
銀行的大模型產(chǎn)品,在產(chǎn)品形態(tài)上,并不等同于閑聊機(jī)器人。因?yàn)殚e聊機(jī)器人,為用戶提供的服務(wù)主要是解決用戶“無(wú)聊”的場(chǎng)景,而銀行客服機(jī)器人,在同用戶聊天互動(dòng)的同時(shí),要確?;卮鸾Y(jié)果的精準(zhǔn)。
必須給出嚴(yán)謹(jǐn)?shù)慕Y(jié)果,否則寧愿不回答。因此對(duì)于內(nèi)容的安全,需要格外關(guān)注。確保內(nèi)容安全,主要可以通過(guò)三個(gè)方面進(jìn)行內(nèi)容安全控制。
用戶輸入內(nèi)容進(jìn)行控制:屬于事前控制的一種方式,利用關(guān)鍵詞識(shí)別,以及語(yǔ)義識(shí)別,對(duì)用戶輸入的內(nèi)容進(jìn)行安全校驗(yàn),判斷是否存在內(nèi)容安全風(fēng)險(xiǎn)。如果存在風(fēng)險(xiǎn),則給出相應(yīng)的提示,用戶的內(nèi)容不會(huì)作為大模型語(yǔ)料庫(kù)的輸入信息。
大模型自身內(nèi)容處理:屬于事中控制的一種方式,用戶輸入的內(nèi)容已經(jīng)進(jìn)入銀行智能客服大模型的引擎當(dāng)中,大模型可以根據(jù)用戶輸入內(nèi)容是否屬于歷史模型構(gòu)建范圍內(nèi)的知識(shí)進(jìn)行判斷,如果無(wú)法處理,則明確返回用戶無(wú)法理解用戶內(nèi)容,需要后續(xù)學(xué)習(xí)改進(jìn)。
大模型輸出結(jié)果控制:屬于事后控制的一種方式,這時(shí)大模型已經(jīng)根據(jù)用戶的提問(wèn)內(nèi)容給出相應(yīng)的答案,即將輸出給用戶,但發(fā)現(xiàn)內(nèi)容存在安全風(fēng)險(xiǎn)。則需要對(duì)結(jié)果進(jìn)行過(guò)濾,或者重新觸發(fā)大模型的處理機(jī)制,告知大模型這個(gè)答案存在內(nèi)容安全風(fēng)險(xiǎn),需要重新生成新的結(jié)果。
總之,在銀行智能客服產(chǎn)品使用大模型時(shí),可以引入CGT(Controlable Text Generation,可控文本生成)來(lái)確保內(nèi)容質(zhì)量,降低內(nèi)容安全風(fēng)險(xiǎn)。
5. 效果評(píng)測(cè)
在作者之前出版的《產(chǎn)品經(jīng)理知識(shí)?!愤@本書(shū)中,我們給出了對(duì)于人工智能效果評(píng)價(jià)的機(jī)制。對(duì)于軟件工程通用的系統(tǒng)穩(wěn)定效果,可以通過(guò)壓力測(cè)試獲得相應(yīng)的評(píng)測(cè)結(jié)論。
對(duì)于銀行智能客服大模型的運(yùn)行效果,我們可以準(zhǔn)備測(cè)試數(shù)據(jù)集,來(lái)進(jìn)行驗(yàn)證,一般而言,測(cè)試數(shù)據(jù)集占整個(gè)數(shù)據(jù)集的20%相對(duì)最為合適。通過(guò)準(zhǔn)確率、精準(zhǔn)率與召回率進(jìn)行評(píng)價(jià)。
- 準(zhǔn)確率(Accuracy Ratio):預(yù)測(cè)【正確的結(jié)果】占【總樣本】的百分比。即:AR =(TP+TN)÷(TP+FN+FP+TN)
- 精準(zhǔn)率(Precision Ratio):也稱為查準(zhǔn)率,針對(duì)【預(yù)測(cè)結(jié)果】對(duì)所有被預(yù)測(cè)為正的樣本中實(shí)際為正的樣本的概率。即:PR = TP÷(TP+FP)
- 召回率(Recall Ratio):也稱為查全率,針對(duì)【原樣本】在實(shí)際為正的樣本中被預(yù)測(cè)為正樣本的概率。即:RR = TP ÷(TP+FN)
從公式中我們可以看出,精準(zhǔn)率和召回率的分子者為TP,但是分母不同,在實(shí)際操作中,想要更高的召回率,精準(zhǔn)率就會(huì)降低。
為了平衡精準(zhǔn)率與召回率的關(guān)系,我們使用F1分?jǐn)?shù)來(lái)作為指標(biāo)。即:
F1 = (2×精準(zhǔn)率×召回率)÷(精準(zhǔn)率+召回率)
三、銀行大模型產(chǎn)品實(shí)踐樣例
1. 總體架構(gòu)
我們可以通過(guò)一個(gè)簡(jiǎn)單的架構(gòu),實(shí)現(xiàn)銀行大模型產(chǎn)品的MVP(Minimum Viable Product,最小可行)版本。在銀行大模型產(chǎn)品MVP版本中,我們通過(guò)銀行小程序、銀行App或是網(wǎng)上銀行的服務(wù),為用戶提供智能文本對(duì)話服務(wù)。
小程序、App和Web作為承載銀行大模型智能客服的渠道,通過(guò)統(tǒng)一的應(yīng)用API(Application Programming Interface,應(yīng)用程序編程接口)完成功能接入,實(shí)現(xiàn)客服功能。
內(nèi)容安全模塊,作為接收用戶輸入內(nèi)容的第一道安全防線,將一些用戶輸入的敏感內(nèi)容或是與銀行客服無(wú)關(guān)的內(nèi)容進(jìn)行過(guò)濾;后續(xù)對(duì)大模型的內(nèi)容輸出進(jìn)行再次識(shí)別,防止不當(dāng)或是敏感內(nèi)容傳遞給客戶。
銀行客服引擎,是用戶與銀行客服產(chǎn)品的紐帶,負(fù)責(zé)識(shí)別客戶,連通用戶體系,根據(jù)用戶畫(huà)像,對(duì)用戶提問(wèn)進(jìn)行提煉,結(jié)合用戶歷史服務(wù)數(shù)據(jù),生成恰當(dāng)?shù)腜rompt給到大模型,甚至可以利用客服引擎歷史積累的數(shù)據(jù),作為大模型的學(xué)習(xí)樣本,對(duì)大模型進(jìn)行“蒸餾”以降低部署成本。
用戶體系承載著用戶基本信息,對(duì)用戶進(jìn)行身份認(rèn)證,根據(jù)用戶歷史的數(shù)據(jù),生成用戶畫(huà)像,基于用戶和賬戶體系,建立同銀行核心數(shù)據(jù)的交互。
任務(wù)執(zhí)行則是根據(jù)某些場(chǎng)景建立相應(yīng)的規(guī)則和策略,執(zhí)行相應(yīng)的任務(wù)。例如,用戶在智能客服對(duì)話框中輸入“本期信用卡賬單應(yīng)還款是多少?”,大模型識(shí)別為用戶意圖是查詢本期信用卡的賬單,則結(jié)構(gòu)化相應(yīng)的執(zhí)行參數(shù)給到任務(wù)執(zhí)行模塊,由任務(wù)執(zhí)行模塊到銀行核心中,執(zhí)行相應(yīng)信息的獲取,并將相關(guān)內(nèi)容返回給大模型,由大模型加工處理后,呈現(xiàn)給用戶。
2. 案例實(shí)踐
接下來(lái)我們著重對(duì)大模型的構(gòu)建作為產(chǎn)品實(shí)踐樣例。同樣以用戶同客服咨詢“本期信用卡賬單”內(nèi)容為例,我們的基本目標(biāo)是通過(guò)對(duì)用戶針對(duì)詢問(wèn)“本期信用卡賬單”不同的提問(wèn)內(nèi)容,通過(guò)大模型學(xué)習(xí),智能客服均可以識(shí)別用戶意圖,給出本期信用卡賬單金額的回答結(jié)果。
(1)構(gòu)建學(xué)習(xí)語(yǔ)料
我們根據(jù)用戶歷史的銀行客服問(wèn)答數(shù)據(jù)作為大模型的語(yǔ)料輸入,在本案例中,我們僅選取了三條數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)。
以下源代碼給出了如何將用戶輸入的內(nèi)容建立同索引的映射關(guān)系,并給出了輸出結(jié)果樣例。在實(shí)際操作中,語(yǔ)料庫(kù)的內(nèi)容非常龐大,打印語(yǔ)料庫(kù)的功能需要注釋掉。
由于本文實(shí)驗(yàn)數(shù)據(jù)非常少,我們選擇將語(yǔ)料的內(nèi)容進(jìn)行顯示輸出,便于直觀查看,也有利于后期的模型調(diào)試。
(2)模型訓(xùn)練
為了簡(jiǎn)化計(jì)算,我們根據(jù)收集的主料庫(kù)中隨機(jī)選取一條語(yǔ)料進(jìn)行模型訓(xùn)練。同樣我們將機(jī)器隨機(jī)挑選的語(yǔ)料,張量的形狀,也進(jìn)行了打印輸出,方便觀測(cè)運(yùn)行過(guò)程。
(3)定義編碼器和解碼器
由于本案例實(shí)踐使用的是非?;A(chǔ)的Seq2Seq模型,編碼器和解碼器也相對(duì)比較簡(jiǎn)單。包含了嵌入層和RNN(Recurrent Neural Network,循環(huán)神經(jīng)網(wǎng)絡(luò))層。
如果語(yǔ)料數(shù)據(jù)特別龐大,我們可以調(diào)整input_size和output_size參數(shù),以適應(yīng)不同的數(shù)據(jù)量。另外也可以調(diào)整RNN的相關(guān)參數(shù),增加模型復(fù)雜度和容易,不過(guò)這樣機(jī)器運(yùn)算的代價(jià)也會(huì)同步增加。
(4)整合編輯器和解碼器
大模型中包含了編輯器和解碼器,因此我們需要將兩者進(jìn)行整合,形成一個(gè)總模塊,便于處理用戶輸入的序列,并給出相應(yīng)的結(jié)果輸出。
(5)定義訓(xùn)練函數(shù)
在這個(gè)訓(xùn)練模型中,每一個(gè)Epoch都會(huì)隨機(jī)選擇一個(gè)語(yǔ)料進(jìn)行訓(xùn)練。本文中由于語(yǔ)料稀少,訓(xùn)練模型的訓(xùn)練輪次設(shè)置的也不是很多。
實(shí)際銀行部署過(guò)程中,銀行的AI服務(wù)器非常強(qiáng)大,可以結(jié)合海量數(shù)據(jù)進(jìn)行訓(xùn)練,從而提升結(jié)果的精準(zhǔn)度。
(6)結(jié)果輸出
由于語(yǔ)料數(shù)據(jù)非常少,因此模型的準(zhǔn)確度是并不是很高,在輸入一些類似的其他問(wèn)題,可能會(huì)導(dǎo)致回答不準(zhǔn)確。
我們的目標(biāo)是希望用戶在輸入信用卡賬單或是理解推薦之類的問(wèn)題時(shí),銀行智能客服的大模型能給出相應(yīng)的結(jié)果。
在本文實(shí)踐案例中,我們結(jié)合上文的“本期 信用卡 賬單 應(yīng) 還款 是 多少”,作為輸入,銀行客服大模型會(huì)給去【執(zhí)行賬單應(yīng)還款額查詢】策略,從而觸發(fā)相應(yīng)的任務(wù)機(jī)制,從銀行核心系統(tǒng)提取用戶本期信用卡賬單的還款金額數(shù)據(jù)。
當(dāng)用戶輸入是咨詢“有什么理財(cái)產(chǎn)品”相關(guān),則銀行智能客服會(huì)去【執(zhí)行理財(cái)產(chǎn)品推薦】,調(diào)用銀行產(chǎn)品推薦系統(tǒng),獲得相應(yīng)的理財(cái)產(chǎn)品推薦數(shù)據(jù)返回給用戶。
四、總結(jié)與展望
本文從當(dāng)下最流行的大模型應(yīng)用出發(fā),結(jié)合對(duì)銀行使用大模型場(chǎng)景的方式,給出了基礎(chǔ)的銀行構(gòu)建大模型的方式。通過(guò)最后銀行大模型產(chǎn)品實(shí)踐樣例的搭建,完成了銀行大語(yǔ)言模型產(chǎn)品MVP版本的構(gòu)建。
當(dāng)然,本文也有不足之處,由于大模型涉及的內(nèi)容非常多,受于篇幅所限,不能面面俱到。大模型的發(fā)展日新月異,本文的內(nèi)容僅基于已的理論的應(yīng)用,比較陳舊。
另外,在本文的實(shí)踐案例中,僅使用了基礎(chǔ)的Seq2Seq模型,沒(méi)有使用到Transformer,也沒(méi)有用到Attention機(jī)制,語(yǔ)料的規(guī)模也不夠,還不足以稱為“大模型”。后期我們會(huì)專門針對(duì)Transformer進(jìn)行詳細(xì)講解。
由于大模型目前涉及的場(chǎng)景非常多,各種開(kāi)源的大模型,各種垂直細(xì)分領(lǐng)域的大模型產(chǎn)品如雨后春筍般出現(xiàn)。很顯然,在銀行領(lǐng)域,大模型會(huì)成為銀行經(jīng)營(yíng)新的賦能工具。
大模型在圖表理解和金融計(jì)算方面能力非常強(qiáng)大,能夠解析和解釋各類金融圖表,包括識(shí)別圖表類型、理解數(shù)據(jù)含義、分析趨勢(shì)和模式;能夠進(jìn)行金融計(jì)算和建模,包括利率計(jì)算、投資組合優(yōu)化、風(fēng)險(xiǎn)評(píng)估等。
大模型可以對(duì)傳統(tǒng)銀行風(fēng)險(xiǎn)管理、反欺詐、個(gè)性化推薦、貸款審批、經(jīng)營(yíng)決策等現(xiàn)有的功能進(jìn)行重構(gòu),使這些傳統(tǒng)功能煥發(fā)新的生機(jī),降低銀行經(jīng)營(yíng)成本,提升銀行運(yùn)營(yíng)效率,將會(huì)帶來(lái)質(zhì)的飛躍,成為銀行新的發(fā)展動(dòng)能。
參考文獻(xiàn)
[1]王佳亮.產(chǎn)品經(jīng)理知識(shí)棧[M].出版地:人民郵電出版社,2023
[2]黃佳.GPT圖解 大模型是怎樣構(gòu)建的[M].出版地:人民郵電出版社,2024
[3]蝸牛海膽. (2021). NLP入門系列1:attention和transformer [EB/OL]. https://blog.csdn.net/ahdaizhixu/article/details/119749361
[4]潘小小. (2023). 【經(jīng)典精讀】萬(wàn)字長(zhǎng)文解讀Transformer模型和Attention機(jī)制:attention和transformer [EB/OL]. https://zhuanlan.zhihu.com/p/104393915
專欄作家
王佳亮,微信公眾號(hào):佳佳原創(chuàng)。人人都是產(chǎn)品經(jīng)理專欄作家,年度優(yōu)秀作者?!懂a(chǎn)品經(jīng)理知識(shí)?!纷髡?。中國(guó)計(jì)算機(jī)學(xué)會(huì)高級(jí)會(huì)員(CCF Senior Member)。專注于互聯(lián)網(wǎng)產(chǎn)品、金融產(chǎn)品、人工智能產(chǎn)品的設(shè)計(jì)理念分享。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!