微眾銀行楊強:針對中小微企業(yè)信貸評審數(shù)據(jù)稀缺等問題,聯(lián)邦學習機制可提升模型的有效性

2022-11-14 15:50:47 21世紀經(jīng)濟報道  胡天姣

  近年來,聯(lián)邦學習(Federated Learning)與安全多方計算、區(qū)塊鏈、可信執(zhí)行環(huán)境(TEE)成為隱私計算的技術(shù)路徑。

  金融是聯(lián)邦學習主要探索應用領(lǐng)域。聯(lián)邦學習提供金融風控、金融營銷、評分卡等業(yè)務場景的多方數(shù)據(jù)源聯(lián)合建模服務。隨著行業(yè)應用的深化,可用性、效率等多維度被納入整體技術(shù)框架,“可信聯(lián)邦學習”新范式應運而生。

  “需要在‘安全與效率’權(quán)衡中推演出一個恒定定律。”微眾銀行首席人工智能官楊強在近日采訪中對記者表示,根據(jù)論文《聯(lián)邦學習中隱私與模型性能沒有免費午餐定理》,通過隱私與模型性能的“No-free-lunch”安全-收益恒定定律,可實現(xiàn)可信聯(lián)邦學習中安全、效用、效率三者的協(xié)調(diào)。

  楊強認為,“法律法規(guī)與技術(shù)有機且無縫的結(jié)合”是未來金融行業(yè)需要注意的關(guān)鍵。此外,如何設計巧妙的算法,使聯(lián)邦學習能夠應付可能的安全隱患是未來大規(guī)模運用至金融場景的重要挑戰(zhàn)。

  數(shù)據(jù)“安全-效用-效率”權(quán)衡間的保護機制

  中國與美國正在引領(lǐng)全球聯(lián)邦學習發(fā)展。據(jù)統(tǒng)計,在聯(lián)邦學習領(lǐng)域,全球高被引論文領(lǐng)先的機構(gòu)依次是谷歌、卡內(nèi)基·梅隆大學、北京郵電大學及微眾銀行。

  聯(lián)邦學習是一種分布式機器學習技術(shù),以實現(xiàn)“數(shù)據(jù)可用不可見”、“數(shù)據(jù)不動模型動”的應用新范式。

  楊強表示,根據(jù)設定的四個維度(威脅的源頭、威脅性質(zhì)、隱私窺探的有意/無意及保護措施的嚴格程度),微眾銀行現(xiàn)正與各機構(gòu)合作,推動基于“No-free-lunch”定律的新標準建設。

  作為一種新范式,“可信聯(lián)邦學習”增強了傳統(tǒng)的聯(lián)邦學習,使得在保證原始數(shù)據(jù)的隱私安全和模型的可證安全外,還保證學習過程的高效率和模型的可用性,模型決策機制的可解釋性,模型的可溯源和審計監(jiān)管。

  “需要設計一種保護機制,在‘安全與效率’權(quán)衡中推演出一個恒定定律!睏顝娭赋觯鶕(jù)《聯(lián)邦學習中隱私與模型性能沒有免費午餐定理》,通過隱私與模型性能的“No-free-lunch”安全-收益恒定定律,可實現(xiàn)可信聯(lián)邦學習的安全、效用、效率三者的協(xié)調(diào),在保證數(shù)據(jù)隱私保護的同時,也最大化模型效用和學習效率。

  “在中小微企業(yè)信貸場景中,針對中小微企業(yè)信貸評審數(shù)據(jù)稀缺、不全面、歷史信息沉淀不足等問題!睏顝娬f,通過聯(lián)邦學習機制,可在確保數(shù)據(jù)提供方數(shù)據(jù)安全以及隱私保護的情況下,為銀行融匯企業(yè)經(jīng)營數(shù)據(jù)、稅務數(shù)據(jù)等多源信息,豐富建模特征體系,共同提升模型的有效性。

  此外,通過將風險前置,從風險源頭切入,隱私計算還可幫助金融機構(gòu)過濾信貸黑名單客戶。

  楊強表示,所有金融場景的應用均有其共性(如風控、銷售、服務),也有其特殊性(如偏重線上或線下,營銷還是反欺詐),對此,可以設計不同的聯(lián)邦學習引擎,最大化安全與效率的平衡。

  巧妙打造“數(shù)據(jù)安全鎖”

  央行《金融科技發(fā)展規(guī)劃(2022-2025年)》明確提出,加強金融科技倫理建設,深化數(shù)字技術(shù)金融應用,健全安全與效率并重的科技成果應用體制機制。

  《金融領(lǐng)域科技倫理指引》也要求,金融機構(gòu)充分獲取用戶授權(quán),以最小必要原則采集數(shù)據(jù),使用數(shù)據(jù)秉持“專事專用”原則,嚴格采取防護措施,依法合規(guī)共享數(shù)據(jù)。

  楊強稱,越來越多的金融行業(yè)在邁向數(shù)字化與智能化,二者聯(lián)合起來可被稱為“數(shù)智化”。數(shù)智化的一個重要驅(qū)動因素為數(shù)據(jù)要素流通是,即數(shù)據(jù)由一個地點流至另一個地點,這由此構(gòu)成了金融業(yè)另一個發(fā)展特征:數(shù)據(jù)的可交易化。

  在“流動”中才能更好地發(fā)掘應用數(shù)據(jù)的價值。楊強表示,在數(shù)據(jù)交易所內(nèi),所有數(shù)據(jù)均會被定價,且受到知識產(chǎn)權(quán)等認證。

  “上述特點構(gòu)成了未來金融生態(tài)的重要特征。他強調(diào),通過提升數(shù)據(jù)的安全與可交易性,聯(lián)邦學習將持續(xù)對金融業(yè)態(tài)的發(fā)展發(fā)揮關(guān)鍵作用。

  針對目前聯(lián)邦學習中同態(tài)加密、差分隱私等隱私保護方法可能帶來計算和通信開銷大、模型性能大幅下降的弊端,論文《FedCG: 聯(lián)邦條件對抗生成網(wǎng)絡》提出在橫向聯(lián)邦學習中將生成對抗網(wǎng)絡與分割學習相結(jié)合,有效保護了參與方的數(shù)據(jù)隱私,同時保障了各參與方模型性能的競爭力。該論文提出了名為FedIPR的首個聯(lián)邦學習模型版權(quán)驗證框架。

  “如何使技術(shù)與法律法規(guī)有機未來”是未來金融行業(yè)需要注意的關(guān)鍵。楊強指出,現(xiàn)有的數(shù)據(jù)安全法與相關(guān)規(guī)制一部分得以經(jīng)由技術(shù)實現(xiàn),另一部分卻需要來自法律、法規(guī)的保障!岸叩挠袡C、無縫結(jié)合是微眾銀行目前正在進行的嘗試!彼a充,以增強整體決策過程的可解釋性與透明度,同時更具可監(jiān)管、可問詢及可追蹤性。

  聯(lián)邦學習也可被視為促使AI更有效落地的一項技術(shù)!八茿I發(fā)展的下一站,也同樣是大數(shù)據(jù)發(fā)展的下一站!睏顝娬f,其安全可信的數(shù)據(jù)保護措施下連接數(shù)據(jù)孤島的模式,將不斷推動全球AI技術(shù)的創(chuàng)新與飛躍。隨著聯(lián)邦學習在更大范圍和更多行業(yè)場景中的滲透及應用,促進企業(yè)級數(shù)據(jù)合作。

  他稱,No-Free-lunch是一個亟待突破的瓶頸。數(shù)年前,計算機行業(yè)有過如多方安全計算等類似探索,但此類探索所產(chǎn)生的數(shù)據(jù)“安全鎖”很難被打開,難以激發(fā)大規(guī)模的數(shù)據(jù)運用!霸O計出巧妙算法,使聯(lián)邦學習能應對可能的安全隱患是其未來大規(guī)模運用至金融場景的關(guān)鍵。”

(責任編輯:王曉雨 )
看全文
寫評論已有條評論跟帖用戶自律公約
提 交還可輸入500

最新評論

查看剩下100條評論

熱門閱讀

    和訊特稿

      推薦閱讀