如何用好數(shù)據(jù)——金融機(jī)構(gòu)在移動(dòng)互聯(lián)網(wǎng)時(shí)代就存在的難題,在AI時(shí)代同樣存在
▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼
文 | 周公子
編| 周星星
近期,一份來(lái)自銀行的千億級(jí)別大模型采購(gòu)結(jié)果公布,引發(fā)不少科技公司關(guān)注。與此同時(shí),也有不少銀行密集發(fā)布了“大模型”相關(guān)的需求調(diào)研、項(xiàng)目采購(gòu)信息,有部分中標(biāo)信息已經(jīng)公示。小周整理了部分公開(kāi)的招投標(biāo)文件發(fā)現(xiàn),目前已有明確“落地”需求的多為大型商業(yè)銀行,并且需求多與模型訓(xùn)練、語(yǔ)言模型、數(shù)據(jù)處理相關(guān)。
一方面,這些公告固然是金融大模型正式“走出紙面規(guī)劃”,開(kāi)始落地到行業(yè)應(yīng)用的信號(hào);
另一方面,綜合公告的情況亦可窺見(jiàn),目前金融行業(yè)大模型談“效果”依然為時(shí)尚早,這些需求后面真正的“難題”被看見(jiàn),也許只是開(kāi)始。
這種現(xiàn)狀,或許恰好印證了此前恒生電子(600570)對(duì)數(shù)百家金融機(jī)構(gòu)的走訪調(diào)研結(jié)果:AI大模型在金融領(lǐng)域的應(yīng)用只有8%在立項(xiàng)階段,17%在測(cè)試階段,超過(guò)70%的金融機(jī)構(gòu)還處于調(diào)研階段,在實(shí)際落地應(yīng)用過(guò)程中的是極少數(shù)。
Part 1
多家銀行公布大模型招投標(biāo)項(xiàng)目
除了大家熟知的“大廠”們,銀行供應(yīng)商“預(yù)選”之列也讓業(yè)內(nèi)看到,“外腦”還有更豐富的選擇。
今年10月,招商銀行(600036)披露了“招商銀行預(yù)訓(xùn)練基礎(chǔ)大語(yǔ)言模型(千億級(jí))采購(gòu)項(xiàng)目”結(jié)果,中選供應(yīng)商為“上海稀宇科技有限公司”。
據(jù)悉,這家中標(biāo)招行大模型項(xiàng)目的上海公司,也就是MiniMax,國(guó)內(nèi)最早入場(chǎng)大模型創(chuàng)業(yè)的公司之一,創(chuàng)始團(tuán)隊(duì)出身中科院系,創(chuàng)始人是前商湯科技副總裁、通用智能技術(shù)負(fù)責(zé)人閆俊杰。MiniMax成立于2021年,比剛殺入AI大模型市場(chǎng)的另一家明星公司百川智能,還要早成立2年。今年,MiniMax還拿到了來(lái)自騰訊的2.5億美元投資。而和MiniMax一起參與招行招標(biāo)的還有清華大學(xué)系的智譜AI和all in大模型的百度。
招商銀行之外,工商銀行、建設(shè)銀行、郵儲(chǔ)銀行、華夏銀行(600015)等也在最近公布了他們?cè)诖竽P头矫娴恼型稑?biāo)項(xiàng)目或結(jié)果。
其中,華夏銀行的招標(biāo)項(xiàng)目也與大語(yǔ)言模型應(yīng)用相關(guān),具體項(xiàng)目名稱(chēng)為“華夏銀行大語(yǔ)言模型應(yīng)用(智能算例部分)”,主要為系統(tǒng)硬件設(shè)備采購(gòu)。
此外,中信銀行(601998)信用卡也于今年11月7日發(fā)布了“中信銀行信用卡中心大模型訓(xùn)練GPU服務(wù)器需求調(diào)研公告”,雖只是前期項(xiàng)目需求調(diào)研,不作為入圍或招標(biāo)入選依據(jù),但亦可窺見(jiàn)其對(duì)大模型相關(guān)服務(wù)的潛在需求。
據(jù)現(xiàn)有公開(kāi)資料不完全統(tǒng)計(jì),目前銀行大模型相關(guān)招標(biāo)項(xiàng)目并不多,且集中于大中銀行。
來(lái)源:周觀新金融根據(jù)銀行官網(wǎng)公開(kāi)資料整理
可見(jiàn),落到實(shí)際應(yīng)用當(dāng)中,不少銀行依然考慮引入“外腦”,借助科技公司的力量完善自身大模型建設(shè)和應(yīng)用。
Part 2
銀行現(xiàn)階段重點(diǎn)需求較為集中
而結(jié)合招投標(biāo)、業(yè)界討論及財(cái)報(bào)等公開(kāi)資料來(lái)看,銀行等金融機(jī)構(gòu)關(guān)注的大模型落地應(yīng)用需求較為集中。目前,業(yè)內(nèi)的共識(shí)性關(guān)注的,可降本提效,亦可廣泛應(yīng)用場(chǎng)景的場(chǎng)景主要包括客戶服務(wù)、智能研投、風(fēng)險(xiǎn)控制、欺詐檢測(cè)、運(yùn)營(yíng)管理等。
從各家銀行更為詳細(xì)的半年報(bào)亦可窺見(jiàn),大模型和人工智能被給予厚望,場(chǎng)景也離不開(kāi)上述幾種。
例如,招商銀行的半年報(bào)就提到,要提升大模型的建設(shè)能力,打造面向智能化時(shí)代的應(yīng)用平臺(tái):
加快新技術(shù)應(yīng)用推廣,提升GPT類(lèi)自然語(yǔ)言處理大模型的建設(shè)能力,并重點(diǎn)發(fā)掘其在全流程財(cái)富管理中的應(yīng)用,投產(chǎn)FinGPT創(chuàng)意中心,加快大模型應(yīng)用模式探索。推進(jìn)智慧財(cái)富引擎、智慧營(yíng)銷(xiāo)引擎、智慧運(yùn)營(yíng)引擎、智慧風(fēng)控引擎、智慧客服引擎五大引擎建設(shè),打造智能化時(shí)代的智慧應(yīng)用平臺(tái)。
招商銀行之外,平安、興業(yè)、農(nóng)行、交行、工商銀行等,無(wú)一不在半年報(bào)中提到了大模型的戰(zhàn)略展望,以及零星的布局進(jìn)展。
例如,工商銀行提到,“完成人工智能AI大模型能力建設(shè)應(yīng)用規(guī)劃,在國(guó)內(nèi)同業(yè)率先實(shí)現(xiàn)百億級(jí)基礎(chǔ)大模型在知識(shí)運(yùn)營(yíng)市場(chǎng)、金融市場(chǎng)投研助手等多個(gè)場(chǎng)景應(yīng)用!
比如智能客服,只能機(jī)械回復(fù)“設(shè)定指令”的情況依然比較普遍,對(duì)進(jìn)一步靈魂響應(yīng)客戶訴求、服務(wù)響應(yīng)等,依然遠(yuǎn)遠(yuǎn)不夠。用消費(fèi)者視角來(lái)概況就是,目前多數(shù)銀行的智能客服,從“人工智障”真正進(jìn)化到“人工智能”,依然有比較大的進(jìn)步空間。
而基于大模型的智能客服,普遍被認(rèn)為有更好的語(yǔ)音、語(yǔ)義理解能力,甚至是圖文生成能力,是提升多種自動(dòng)化服務(wù)客戶體驗(yàn)感的關(guān)鍵。
Part 3
核心難點(diǎn):用好數(shù)據(jù)
技術(shù)之外,安全和數(shù)據(jù)才是短時(shí)間內(nèi)金融大模型落地最難邁過(guò)去的坎。
由于對(duì)安全、合規(guī)要求較高的特殊性,金融機(jī)構(gòu)通常不會(huì)在第三方基礎(chǔ)大模型上構(gòu)建專(zhuān)業(yè)大模型,而是采用數(shù)據(jù)私有化、模型私有化、本地私有云方式構(gòu)建大模型。
最直觀的對(duì)比是,ChatGPT是開(kāi)放環(huán)境里用開(kāi)放數(shù)據(jù),除技術(shù)之外也坐擁大量公開(kāi)數(shù)據(jù),雙管齊下才能“大力出奇跡”,快速搭建護(hù)城河。而金融機(jī)構(gòu)是在自己家的安全保密環(huán)境里用自家數(shù)據(jù)訓(xùn)練自家的AI大模型,這種方式雖然安全,但問(wèn)題是成本高、技術(shù)門(mén)檻高,不是誰(shuí)都有錢(qián)有實(shí)力能干。
換句話說(shuō),金融大模型落地到應(yīng)用時(shí),出于安全性、行業(yè)競(jìng)爭(zhēng)性等因素考慮,其可用數(shù)據(jù)更多來(lái)源于自身,如何用好“窄而垂直”的數(shù)據(jù)會(huì)是一大挑戰(zhàn)。
一個(gè)正面例子是彭博的Bloom?bergGPT,同樣是金融賽道的選手,它突圍的關(guān)鍵因素之一,就是用好數(shù)據(jù)。
2023年3月底,彭博發(fā)布了500億參數(shù)、基于開(kāi)源大模型Bloom研發(fā)的金融大語(yǔ)言模型Bloom?bergGPT,這是全球首個(gè)金融大模型,隨后也引發(fā)了全球市場(chǎng)對(duì)金融垂直領(lǐng)域大模型的關(guān)注。
在Bloom大模型的基礎(chǔ)上,Bloom?bergGPT在其積累超過(guò)多年的金融行業(yè)專(zhuān)有數(shù)據(jù)基礎(chǔ)上再進(jìn)行精調(diào)訓(xùn)練——3630億Tokens金融數(shù)據(jù)集、3450億Tokens公共數(shù)據(jù)集上進(jìn)行了訓(xùn)練。
正是因?yàn)橛羞@樣的高質(zhì)量的行業(yè)專(zhuān)屬數(shù)據(jù)集和數(shù)據(jù)基礎(chǔ),在金融領(lǐng)域自然語(yǔ)言處理(NLP)任務(wù)上,Bloom?bergGPT的表現(xiàn)明顯優(yōu)于其他類(lèi)似規(guī)模的開(kāi)放模型,在一般NLP基準(zhǔn)上的表現(xiàn)也達(dá)到甚至超過(guò)同行的平均水平。
正因?yàn)槿绱,上半年業(yè)界普遍認(rèn)為 “大模型+垂直行業(yè)數(shù)據(jù)”模式預(yù)會(huì)成為 AI 落 地 垂 直 行 業(yè) 的 典 型 范 式。而進(jìn)入下半年之后,行業(yè)大模型的演進(jìn)路線也確實(shí)是如此。
彭博的金融大模型基于BLOOM的開(kāi)源模型結(jié)合金融專(zhuān)業(yè)數(shù)據(jù)進(jìn)行精調(diào)訓(xùn)練
“我們要解決數(shù)據(jù)的問(wèn)題! 劉曙峰在談及金融大模型應(yīng)用時(shí)也特別提及,要解決現(xiàn)有的數(shù)據(jù)、私有的數(shù)據(jù)、公有的數(shù)據(jù),以及數(shù)據(jù)如何不斷的產(chǎn)生、獲取和形成數(shù)據(jù)飛輪的閉環(huán)。
所以,金融大模型應(yīng)用,核心難點(diǎn)遠(yuǎn)不僅是技術(shù)能力問(wèn)題。
數(shù)據(jù)非常關(guān)鍵,更關(guān)鍵的是,如何“合規(guī)”、“安全”地用好數(shù)據(jù)。
相比制造、交通等行業(yè),金融領(lǐng)域的數(shù)字化更早、更深,數(shù)據(jù)本來(lái)應(yīng)該是優(yōu)勢(shì)所在,但由于監(jiān)管、安全等緣故,數(shù)據(jù)的價(jià)值挖掘并沒(méi)有被充分利用——金融機(jī)構(gòu)曾經(jīng)在移動(dòng)互聯(lián)網(wǎng)時(shí)代就存在過(guò)的問(wèn)題,如今面對(duì)來(lái)勢(shì)洶洶的AI時(shí)代,亦同樣存在。
未來(lái),金融大模型的應(yīng)用能否沖破這個(gè)局限,且拭目以待。
—THE END—
原創(chuàng)文章,未經(jīng)授權(quán),請(qǐng)勿轉(zhuǎn)載。
投資有風(fēng)險(xiǎn),入市須謹(jǐn)慎,以上觀點(diǎn)分享不構(gòu)成投資建議。
本文首發(fā)于微信公眾號(hào):周觀新金融。文章內(nèi)容屬作者個(gè)人觀點(diǎn),不代表和訊網(wǎng)立場(chǎng)。投資者據(jù)此操作,風(fēng)險(xiǎn)請(qǐng)自擔(dān)。
最新評(píng)論