調(diào)研|金融行業(yè)垂類大模型的應(yīng)用現(xiàn)狀

0 評論 4467 瀏覽 14 收藏 20 分鐘

作為這一變革的前沿,金融行業(yè)垂直領(lǐng)域的大模型應(yīng)用已經(jīng)開始在金融服務(wù)的多個方面展現(xiàn)出其巨大的潛力和價值。本文將深入探討金融行業(yè)垂類大模型的應(yīng)用現(xiàn)狀,分析其市場前景、分類、主要參與主體以及典型案例,并討論在實際落地過程中面臨的挑戰(zhàn)。

當前,國內(nèi)互聯(lián)網(wǎng)企業(yè)、傳統(tǒng)金融機構(gòu)及金融科技企業(yè)爭相競逐,“百模大戰(zhàn)”如火如荼,AI與金融的結(jié)合也日益深化。從通用大模型向金融產(chǎn)業(yè)大模型的轉(zhuǎn)變,逐步改變著傳統(tǒng)金融行業(yè)的運作模式和業(yè)務(wù)流程。國內(nèi)外金融大模型如軒轅、貔貅、支付寶的AntFinGML、騰訊云金融大模型等等逐步在推進使用中。

01 發(fā)展背景

1. 通用模型難以提供深度服務(wù)

隨著AI技術(shù)的不斷升級的,AIGC技術(shù)的實踐效用迎來了行業(yè)級大爆發(fā)。在內(nèi)部模型自身迭代和多技術(shù)協(xié)同的作用下,出現(xiàn)了集圖像識別、語義理解、視覺感知于一體的多模態(tài)體系。然而,由于行業(yè)深度信息的缺失,通用大模型在特定領(lǐng)域很難提供高價值、專業(yè)化的服務(wù)。

2. 行業(yè)需求與模型能力契合

金融行業(yè)屬于數(shù)據(jù)、信息密集型產(chǎn)業(yè),對于多渠道信息匯總與數(shù)據(jù)處理能力有較高要求;同時,行業(yè)要求從業(yè)人員專業(yè)知識儲備與經(jīng)驗,來完成對金融業(yè)務(wù)的判斷、咨詢服務(wù)、報告產(chǎn)出等工作。

而相對應(yīng)的,大模型恰好有很強復雜信息處理能力,以及基于原始數(shù)據(jù)和經(jīng)驗給出相應(yīng)解決方案方面的能力。

02 金融垂類大模型行業(yè)現(xiàn)狀

1. 市場前景

據(jù)智研瞻統(tǒng)計顯示,2019年中國金融大模型行業(yè)市場規(guī)模250.49億元,2024年Q1中國金融大模型行業(yè)市場規(guī)模90.82億元,同比增長7.10%。2019-2024Q1年中國金融大模型行業(yè)市場規(guī)模如下:

根據(jù)畢馬威中國發(fā)布的《2024中國金融科技企業(yè)首席洞察報告》的揭露,70%的受訪企業(yè)認為新質(zhì)生產(chǎn)力能提升金融科技企業(yè)自主創(chuàng)新能力,并帶來新機遇。同時,91%的受訪企業(yè)看好大模型金融應(yīng)用前景。

2.金融大模型分類

從服務(wù)細分領(lǐng)域、應(yīng)用場景、開源狀態(tài),對金融大模型進行分類:

3. 主要參與主體

在金融大模型的應(yīng)用方面,傳統(tǒng)金融機構(gòu)、金融科技公司和互聯(lián)網(wǎng)金融公司各有優(yōu)勢,故提供的服務(wù)也有所差異。

傳統(tǒng)金融機構(gòu)

其主要優(yōu)勢是:豐富的行業(yè)經(jīng)驗與專業(yè)知識,有助于將生成式AI應(yīng)用于復雜的金融決策和客戶服務(wù)中;成熟的合規(guī)框架,能夠確保AI應(yīng)用符合行業(yè)法規(guī)和標準。豐富的客戶數(shù)據(jù),為生成式AI提供了訓練和優(yōu)化的基礎(chǔ),支持個性化推薦和服務(wù)。強大的資金支持,可以投資于AI技術(shù)的研發(fā)和基礎(chǔ)設(shè)施建設(shè);強大的品牌信譽,使客戶對傳統(tǒng)金融機構(gòu)的信任度較高,增強了新服務(wù)的接受度。

金融科技公司

金融科技(FinTech)公司領(lǐng)域主要服務(wù)于企業(yè)客戶(B端),主要提供如在線支付處理、借貸平臺、財務(wù)管理軟件、企業(yè)保險解決方案、區(qū)塊鏈技術(shù)應(yīng)用和數(shù)據(jù)分析服務(wù)等,其核心職能是為金融機構(gòu)提供廣泛的技術(shù)支持和解決方案。

其主要優(yōu)勢是:

  • 良好的技術(shù)基礎(chǔ),許多金融科技公司在技術(shù)基礎(chǔ)設(shè)施上已具備一定優(yōu)勢,能夠快速集成和部署生成式AI模型,提升現(xiàn)有服務(wù);
  • 專業(yè)化解決方案,結(jié)合生成式AI,利用各種低代碼模版,來快速提供定制化的支付、融資和風險管理解決方案;
  • 更高效的集成能力,它們通常具備強大的API接口,在結(jié)合大模型方面,可快速便捷與企業(yè)現(xiàn)有系統(tǒng)快速集成,實現(xiàn)無縫對接。

互聯(lián)網(wǎng)金融公司

互聯(lián)網(wǎng)金融公司指針對面向零售投資者(C端)市場提供的金融服務(wù),如智能投資顧問、市場情況預測、個性化財務(wù)規(guī)劃、個人投資組合風險評估、金融知識教育培訓等。

其主要優(yōu)勢是:

  • 快速響應(yīng)市場需求,通過生成式AI實時分析數(shù)據(jù),快速推出符合用戶需求的新產(chǎn)品和服務(wù)。
  • 重視用戶體驗,較重視用戶界面和交互設(shè)計上,結(jié)合大語言模型,能夠提供更流暢的用戶體驗,簡化用戶注冊、投資和咨詢的過程。
  • 高度的個性化服務(wù),結(jié)合用戶行為數(shù)據(jù)和生成式AI,能夠提供高度個性化的投資建議和財務(wù)規(guī)劃。
  • 更廣泛的數(shù)據(jù)整合,相對于傳統(tǒng)金融機構(gòu),能整合來自多種渠道的數(shù)據(jù),提供全面的用戶畫像,支持更精準的服務(wù)。

03 金融大模型典型案例

1. 基本技術(shù)架構(gòu)

垂直類大模型是基于通用大模型進行二次的開發(fā)。先檢索相關(guān)的知識,然后基于召回的知識進行回答,也就是基于檢索增強的生成。一般要經(jīng)過三個步驟:

(1)ContinuePreTraining:給模型注入領(lǐng)域知識,即用金融領(lǐng)域內(nèi)的語料進行繼續(xù)的預訓練。一般為了保持模型的通用能力,還需要注入混雜的通用數(shù)據(jù)。(2)SFT:通過SFT可以激發(fā)大模型理解領(lǐng)域內(nèi)各種問題并進行回答的能力(3)RLHF:通過RLHF可以讓大模型的回答對齊人們的偏好,比如行文的風格。

2. 國外典型案例

國外金融市場更開放、發(fā)達,業(yè)務(wù)量和用戶數(shù)較多,且金融服務(wù)要求更高。在NLP出現(xiàn)初期,很多公司就前仆后繼地開發(fā)大模型或者開發(fā)AIagent。

BloombergGPT——閉源模型

BloombergGPT是彭博社于2023年推出的金融垂直領(lǐng)域大語言模型,是一個有500億參數(shù)、基于BLOOM模型的LLM,該團隊采取通用模型和特定領(lǐng)域模型混合分析的方式,直接從0訓練一個的金融領(lǐng)域大模型。其主要優(yōu)勢有以下幾點:

① 數(shù)據(jù)來源可靠。由于彭博社在幾十年的金融業(yè)務(wù)中積累了大量的金融數(shù)據(jù)和文件,擁有先天的數(shù)據(jù)優(yōu)勢,數(shù)據(jù)來源可靠。

② 金融數(shù)據(jù)集來源豐富,token數(shù)量大。其在金融領(lǐng)域數(shù)據(jù)集共包含了3630億個token,占總數(shù)據(jù)集token量的54.2%,具體由以下幾個部分構(gòu)成:

③ 模型應(yīng)用表現(xiàn)好。團隊分享了模型的三個定性示例:1)生成Bloomberg查詢語言,BloombergGPT可以被用來通過將自然語言查詢轉(zhuǎn)換為有效的BQL,使BQL更易于訪問。2)生成新聞標題。由于它在許多新聞文章上進行了訓練,可以幫助生成新聞標題。3)金融問答。由于金融領(lǐng)域訓練數(shù)據(jù),智能問答覆蓋面廣

FinGPT——開源模型

FinGPT是AI4Finance基金會發(fā)起的一個專注于金融領(lǐng)域的大型語言模型,它致力于通過構(gòu)建開放源碼的金融大語言模型來推動金融科技(Fintech)的發(fā)展和創(chuàng)新。

① 基座模型:開源LLaMA或者ChatGLM,

② 數(shù)據(jù)集:新聞網(wǎng)站、社交媒體、公司公告、趨勢(google或者baidu等搜索引擎)、其他公開數(shù)據(jù)集

③ 訓練方法:LoRA和RLSP(根據(jù)股票價格的強化學習)

④ 模型框架

數(shù)據(jù)源層:通過整合新聞網(wǎng)站、社交媒體平臺、財務(wù)報表、市場趨勢等數(shù)據(jù),確保全面的市場覆蓋。

數(shù)據(jù)工程層:專注于NLP數(shù)據(jù)的實時處理,以應(yīng)對金融數(shù)據(jù)固有的高時間敏感性和低信噪比的挑戰(zhàn)。

LLMs層:整合各種微調(diào)方法,優(yōu)先考慮輕量級自適應(yīng),以保持模型的更新和相關(guān)性。

應(yīng)用層:提供金融任務(wù)的實踐教程和演示應(yīng)用程序,包括機器人咨詢服務(wù)、量化交易和低代碼開發(fā)。

⑤ 優(yōu)勢

國外首個金融行業(yè)垂直類開源大語言模型。主要給金融研究人員和從業(yè)者提供可訪問和透明的資源,來開發(fā)自己的的FinLLM或潛在的應(yīng)用程序。解決金融數(shù)據(jù)獲取難、處理難的問題,旨在開源領(lǐng)域?qū)崿F(xiàn)互聯(lián)網(wǎng)規(guī)模的金融數(shù)據(jù)民主化。

基于GPT的各種金融模型和AIagent

(1)BondGPT:2023年6月全球金融科技領(lǐng)導者Broadridge的子公司LTX,通過GPT-4打造了BondGPT,該模型主要用于債券市場,幫助客戶回答各種與債券相關(guān)的問題。幫助金融機構(gòu)、對沖基金等簡化債券投資流程并提供投資組合建議。比如輸入問題:我有100萬美元資金,想投資5年,有哪些高收益的債券選擇?BondGPT會回答符合需求的公司名字、利率、價格、發(fā)布日期、到期日期、債券評級等信息。

(2)PortfolioPilot:由SEC注冊投資顧問機構(gòu)——GlobalPredictions于2022年11月推出,為投資者提供全球投資組合管理、投資顧問、AI助理等服務(wù),是美國的智能投顧平臺。目前PortfolioPilot已積累逾3萬名用戶,為約200億美元資產(chǎn)提供AI大模型+智能投顧服務(wù)。

其核心模塊:追蹤模塊能借助大模型技術(shù),為用戶呈現(xiàn)投資組合管理的可視化工具,包括大類資產(chǎn)配置結(jié)構(gòu)、資產(chǎn)相關(guān)性矩陣等;提升模塊能基于AI大模型所生成的全球經(jīng)濟洞察觀點,對用戶投資組合進行評分分析,找出用戶投資組合薄弱之處并提供個性化的改善建議;探索模塊主要包括新聞、研究、預測三大功能,匯總關(guān)鍵新聞幫助投資者及時了解行業(yè)信息。

3. 國內(nèi)典型案例

國內(nèi)金融市場發(fā)展較晚,且開放性不足,另外NLP發(fā)展速度也稍落后于國外。但由于國內(nèi)市場需求大,金融機構(gòu)數(shù)量多,2023年間金融垂類大模型蓬勃發(fā)展。

軒轅-開源

軒轅是度小滿的大模型團隊,在2023年基于BLOOM-176B架構(gòu),針對中文通用領(lǐng)域和金融領(lǐng)域進行針對性預訓練和微調(diào)的千億級對話大模型。目前,已實現(xiàn)開源的全參數(shù)模型矩陣達17個。在此基礎(chǔ)上,今年9月份度小滿在始智AIwisemodel社區(qū)重磅開源發(fā)布第三代大模型「軒轅3.0」,包括對話模型和預訓練模型?!杠庌@3.0」在金融場景中的任務(wù)評測中表現(xiàn)突出,并且在金融事件解讀、金融業(yè)務(wù)分析、投研應(yīng)用能力和風險管理等測量維度上超越GPT4o。

其數(shù)據(jù)集采用度小滿實際業(yè)務(wù)場景積累的金融數(shù)據(jù),對金融相關(guān)問題的理解比通用大模型更有優(yōu)勢。因此在模型評估方面,在金融場景中的任務(wù)評測中,軒轅全面超越了市場上的主流開源大模型,贏得了150次回答中63.33%的勝率,充分凸顯了其在金融領(lǐng)域的顯著優(yōu)勢。在通用能力評測中,軒轅有10.2%的任務(wù)表現(xiàn)超越ChatGPT3.5,61.22%的任務(wù)表現(xiàn)與之持平,涉及數(shù)學計算、場景寫作、邏輯推理、文本摘要等13個主要維度。2023年在中文任務(wù)評測C-Eval和CMMLU榜單中名列開源首位。

HithinkGPTvs妙想金融

作為國內(nèi)toC金融公司的佼佼者,同花順和東方財富公司在金融大模型方面的競爭也不相上下,在2024年1月,相繼推出HithinkGPT和妙想金融大模型。目前同花順問財已經(jīng)開始啟用,妙想app還處于內(nèi)測階段。下面從技術(shù)方面和用戶體驗方面進行簡單對比:

1-技術(shù)方面:從技術(shù)架構(gòu)、token數(shù)、落地方式等角度,比較兩個模型。

2-用戶體驗方面:由于妙想內(nèi)測審核暫未通過,故只初步體驗了HithinkGPT問財,后續(xù)看機會再更新兩者的對比。

優(yōu)勢:

  • 市場覆蓋廣:涉及多個金融市場,如A股、港股、美股、基金、債券等等
  • 功能豐富:支持查詢、分析、對比、解讀、建議多等等,包含在選股票、診股票、看行情、看新聞等股民常用功能方面表現(xiàn)較好。
  • 回答內(nèi)容豐富:通過動態(tài)折線圖、動態(tài)雙柱圖、K線圖等圖表增強可視化能力,還有多種投資數(shù)據(jù)。

不足:

  • 整體界面:HithinkGPT是基于問財上直接套用,對比傳統(tǒng)引擎,用戶體驗還未跟上
  • 分析較淺顯:分析的深度還不太夠,無法取代專業(yè)投顧。
  • 偏向于技術(shù)分析:在回答個股的問題時,兩個模型均注重于估值、技術(shù)、資金流向,對基本面內(nèi)容的回答較少。
  • 回答準確率偏低:針對用戶的提問,偶爾出現(xiàn)答非所問的情況,聯(lián)系上下文的能力不強。有些問題的邏輯框架不順暢。

總體來說,目前問財已經(jīng)進入商業(yè)化收費階段,雖然在投顧方面有了一定的幫助,但是吸引用戶去購買更深層次服務(wù)的吸引力不夠,還需更加努力。特別是在競爭對手也逐步進入商業(yè)化階段的背景下,要積極重視提高模型準確率、內(nèi)容豐富度和用戶體驗等方面。

04 金融模型落地挑戰(zhàn)

  1. AI模型的幻覺問題。由于數(shù)據(jù)質(zhì)量問題、訓練方式問題、缺乏外部知識校驗等原因,可能導致大模型易生成與事實不符的內(nèi)容,在金融這樣對精度要求較高的領(lǐng)域,這種錯誤可能帶來嚴重后果。
  2. 成本問題。金融大模型需要進行大量數(shù)據(jù)的訓練和長時間的實驗,因此開發(fā)大模型需要長期戰(zhàn)略發(fā)展規(guī)劃,需要投入高性能設(shè)備、龐大的算力資源(CPU、GPU)、電力資源、長期的無回報資金以及專業(yè)的技術(shù)人員支持等,這使得該技術(shù)在開發(fā)階段就存在很高的準入門檻。
  3. 安全合規(guī)要求高,數(shù)據(jù)泄漏、數(shù)據(jù)隱私問題。金融行業(yè)有很多數(shù)據(jù)的安全管理規(guī)范、技術(shù)標準,但在大模型時代,他們在模型訓練、推理中到底起到了什么作用,哪些數(shù)據(jù)要進行脫敏化處理,需要結(jié)合大模型的應(yīng)用場景和用戶需求形成行業(yè)最佳實踐。如何在保證安全的同時利用數(shù)據(jù)訓練模型,是行業(yè)要面對的挑戰(zhàn),數(shù)據(jù)泄露的風險比行業(yè)深度信息缺失還要嚴重。

相關(guān)資源來源

  1. BloombergGPT:ALargeLanguageModelforFinance——ShijieWu1,?,Ozan˙Irsoy1,?,StevenLu1,?,VadimDabravolski1,MarkDredze1,3,SebastianGehrmann1,PrabhanjanKambadur1,DavidRosenberg2,GideonMann1
  2. FinGPT:Open-SourceFinancialLargeLanguageModels——HongyangYang,Xiao-YangLiu,ChristinaDanWang
  3. XuanYuan2.0:ALargeChineseFinancialChatModelwithHundredsofBillionsParameters——XuanyuZhang,QingYangandDongliangXu
  4. 《2024年中國金融大模型產(chǎn)業(yè)發(fā)展洞察報告》——艾瑞咨詢
  5. 《2024中國金融科技企業(yè)首席洞察報告》——畢馬威
  6. 智研瞻產(chǎn)業(yè)研究院報告

作者:seven777,公眾號:商業(yè)知行俠

本文由 @seven777 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!