0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

IEEE電氣電子工程師 ? 來源:未知 ? 作者:莊福振 ? 2022-07-08 15:30 ? 次閱讀

IEEE x ATEC

IEEE x ATEC科技思享會(huì)是由專業(yè)技術(shù)學(xué)會(huì)IEEE與前沿科技探索社區(qū)ATEC聯(lián)合主辦的技術(shù)沙龍。邀請(qǐng)行業(yè)專家學(xué)者分享前沿探索和技術(shù)實(shí)踐,助力數(shù)字化發(fā)展。

在社會(huì)數(shù)字化進(jìn)程中,隨著網(wǎng)絡(luò)化、智能化服務(wù)的不斷深入,伴隨服務(wù)衍生出的各類風(fēng)險(xiǎn)不容忽視。本期分享會(huì)的主題是《網(wǎng)絡(luò)欺詐的風(fēng)險(xiǎn)與對(duì)抗》。五位嘉賓將從不同的技術(shù)領(lǐng)域和觀察視角,圍繞網(wǎng)絡(luò)欺詐場(chǎng)景下的風(fēng)險(xiǎn)及對(duì)抗技術(shù)展開分享。

以下是莊福振研究員的演講,《NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用》。

《NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用》

很高興能來參加IEEE x ATEC科技思享會(huì)。我今天分享的題目是《NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用》。我今天的演講內(nèi)容主要分成三個(gè)部分:背景,研究工作,我們的一點(diǎn)總結(jié)。

眾所周知,在過去十幾年中,第三方在線支付市場(chǎng)發(fā)展迅速。同時(shí),與在線交易相關(guān)的犯罪活動(dòng)也大大增加,并且這種交易欺詐行為嚴(yán)重威脅了在線支付行業(yè)。2016年,互聯(lián)網(wǎng)犯罪投訴中心就收到了近380萬投訴,導(dǎo)致超過13億的財(cái)務(wù)損失。在線交易欺詐中,最常見的是賬戶被盜以及卡被盜。賬戶被盜指的是未經(jīng)授權(quán)的賬戶操作或欺詐者在控制了某人的付款賬戶后進(jìn)行的交易,通常由于憑證泄露造成的??ū槐I表示某人卡的相關(guān)信息,例如卡號(hào)、賬單信息等已被欺詐者獲取并用于未經(jīng)授權(quán)的一些收費(fèi)。

下面我分享一下我們和螞蟻集團(tuán)聯(lián)合做的一些研究工作。主要有三個(gè)工作,一個(gè)是基于神經(jīng)層級(jí)分解機(jī)的用戶事件序列分析(SIGIR 2020),第二個(gè)是基于雙重重要性感知分解機(jī)的欺詐檢測(cè) (AAAI 2021),第三個(gè)是我們?cè)诳山忉尫矫嫣岢龅睦脤蛹?jí)可解釋網(wǎng)絡(luò)建模用戶行為序列的跨領(lǐng)域欺詐檢測(cè) (WWW 2020)。

一、基于神經(jīng)層級(jí)分解機(jī)的用戶事件序列分析

首先是基于神經(jīng)層級(jí)分解機(jī)的用戶事件序列分析。在支付業(yè)務(wù)中,每個(gè)人都從注冊(cè)系統(tǒng)、登錄系統(tǒng),再到把自己選擇的商品放入購物車,最后做交易或者付款。根據(jù)用戶的賬戶動(dòng)態(tài),我們可以判定下次付款到底是不是一個(gè)欺詐行為。用戶的賬戶動(dòng)態(tài)有豐富的數(shù)據(jù)序列信息可供利用。單純只關(guān)注特征組合的工作或者單純關(guān)注序列信息的工作,都只能從單獨(dú)的角度去建模用戶事件序列行為,每個(gè)事件僅通過簡(jiǎn)單的嵌入、拼接或者全連接,而難以獲得更好的事件表示。我們希望設(shè)立一個(gè)層次化的模型同時(shí)結(jié)合這兩方面進(jìn)行建模,從而對(duì)欺詐檢測(cè)進(jìn)行分析。

2bf49f3c-fdd1-11ec-ba43-dac502259ad0.jpg

右圖有兩個(gè)案例,一個(gè)是我們?cè)诙拱晟峡戳穗娪埃ㄈ鐖D1),同樣也是一個(gè)用戶行為序列,這里面最大的一個(gè)貢獻(xiàn)是怎么去做這個(gè)事件的表示。我們剛才看到,每個(gè)事件實(shí)際上都包含了很多的特征。

2c0f16c8-fdd1-11ec-ba43-dac502259ad0.jpg

如圖2所示,一個(gè)事件的特征包含X1到Xn這么多個(gè)特征。我們?cè)谟脩舻氖录蛄欣铮╡1到eT的T個(gè)事件,每個(gè)事件在場(chǎng)景里面有56個(gè)特征,包括50個(gè)類別型特征和6個(gè)數(shù)字型特征。事件內(nèi)部的特征之間的組合實(shí)際上更具判別性地來判定、預(yù)測(cè)欺詐檢驗(yàn)。例如在1分鐘之內(nèi)進(jìn)行的跨國(guó)交易,我們就很容易判斷這是一筆盜卡行為。我們希望用FM模型去建模這種特征組合關(guān)系。FM是一種在嵌入空間中自動(dòng)進(jìn)行二階特征組合的模型??匆幌拢▓D2)事件的表示:vi跟vj是兩個(gè)特征的向量化的空間的表示,它是兩兩特征之間的一個(gè)組合,Xi跟Xj實(shí)際上是一個(gè)權(quán)重的表示。最后我們會(huì)得到一個(gè)事件的表示,從特征的交互得到一個(gè)特征的事件表示。

2c26cb7e-fdd1-11ec-ba43-dac502259ad0.jpg

當(dāng)這個(gè)事件表示完后,我們希望得到一個(gè)比較好的序列表示,即我們對(duì)這個(gè)序列進(jìn)行提取一個(gè)比較好的特征表示。每個(gè)用戶序列實(shí)際上包含多個(gè)事件,兩個(gè)事件組合發(fā)生,對(duì)欺詐行為檢測(cè)更具有判別性。同樣的,我們也希望去考慮事件之間的序列的影響。比如說我們先做A事件再做B事件,可能會(huì)導(dǎo)致欺詐的可能性變大。我們希望我們的模型能夠去建模這種序列的影響。從剛才的角度出發(fā),事件組合的建模,我們用S來表示,同樣也是因子分解機(jī)去做的。不同事件兩兩組合,qi和qj也是它的一個(gè)權(quán)重。對(duì)于序列影響,我們從兩方面去考慮,一是從事件自身的重要性去考慮,它有一個(gè)自注意力機(jī)制來表示就是Sself;還有一個(gè)是我們用RNN網(wǎng)絡(luò)來去建模事件的歷史序列行為信息,也就是雙向的LSTM去建模。最后,我們可得出這個(gè)序列是由三部分組成:事件的組合;事件的自注意力機(jī)制;事件本身具有的一個(gè)特征。把三者組合在一起得到整體的序列表示。

2c53d1a0-fdd1-11ec-ba43-dac502259ad0.jpg

右邊這張圖是我們提出的一個(gè)框架,也叫做神經(jīng)層級(jí)分解機(jī)。從底部開始,是有事件的特征。我們對(duì)哪個(gè)事件特征進(jìn)行編碼后,就可以去做這個(gè)事件的表示,學(xué)習(xí)做這個(gè)序列的提取。提取后,我們可以看到模型做一個(gè)多層感知機(jī)的輸出。我們同樣可以在這個(gè)Feature上面去做一個(gè)線性的分類。最終我們把這兩部分當(dāng)成一個(gè)Sigmoid的一個(gè)參數(shù),得到0到1之間的輸出,我們最終的一個(gè)優(yōu)化函數(shù)其實(shí)是一個(gè)交叉熵的損失函數(shù),N是對(duì)所有有標(biāo)記的數(shù)據(jù)進(jìn)行學(xué)習(xí)。這是我們的模型的一個(gè)框架。

2c6b37be-fdd1-11ec-ba43-dac502259ad0.jpg

在這個(gè)實(shí)驗(yàn)中,我們利用工業(yè)界里面的一個(gè)真實(shí)的數(shù)據(jù)集。例如LAZADA這樣一個(gè)東南亞的電商平臺(tái),我們從這個(gè)平臺(tái)上面拿到了三個(gè)國(guó)家的數(shù)據(jù)集。這個(gè)數(shù)據(jù)集正例是欺詐行為,負(fù)例是正常的交易行為,可以看到正常交易行為和異常的欺詐行為,相差非常大、類別非常不平衡。我們的公開數(shù)據(jù)集上、電影上的數(shù)據(jù)集也做了一個(gè)實(shí)驗(yàn)。在基準(zhǔn)的算法比較上,我們采用了比較先進(jìn)的一些算法,比如W&D(Wide & deep)寬度和深度,還有NFM、DeepFM、xDeepFM,以及M3利用混合模型同時(shí)學(xué)習(xí)序列的長(zhǎng)短期依賴的模型。

2c7b4762-fdd1-11ec-ba43-dac502259ad0.jpg

我們的評(píng)價(jià)指標(biāo)是采用真實(shí)工業(yè)場(chǎng)景里面比較關(guān)注的低用戶打擾率時(shí)的召回率,即我們?cè)诮o出結(jié)果時(shí),我們希望對(duì)前面頭部的百分之多少的用戶打電話告訴他們這可能是一個(gè)欺詐行為。例如打1000個(gè)電話,這1000個(gè)應(yīng)該都是有欺詐行為,即這個(gè)比例應(yīng)該是越高越好的,因此我們采用的評(píng)價(jià)指標(biāo)更關(guān)注于ROC曲線的頭部(FPR<=1%) 。這里面有一個(gè)消融的

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3066

    瀏覽量

    48580
  • STM
    STM
    +關(guān)注

    關(guān)注

    1

    文章

    555

    瀏覽量

    42318

原文標(biāo)題:【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

文章出處:【微信號(hào):IEEE_China,微信公眾號(hào):IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI大模型自然語言處理的應(yīng)用

    海量的文本數(shù)據(jù),能夠生成結(jié)構(gòu)化、連貫的文本段落。 新聞寫作、創(chuàng)意內(nèi)容生成等場(chǎng)景,AI大模型展現(xiàn)出了卓越的效果。例如,GPT系列模型可以生
    的頭像 發(fā)表于 10-23 14:38 ?127次閱讀

    浪潮信息:元腦企智EPAI助力金融模型快速落地

    近日,2024金融科技應(yīng)用創(chuàng)新發(fā)展大會(huì)暨農(nóng)村金融機(jī)構(gòu)信息化發(fā)展創(chuàng)新座談會(huì)在上海舉辦。浪潮信息推出元腦企智EPAI企業(yè)大模型開發(fā)平臺(tái),面向金融業(yè)務(wù)場(chǎng)景
    的頭像 發(fā)表于 09-20 16:07 ?243次閱讀
    浪潮信息:元腦企智EPAI助力<b class='flag-5'>金融</b>大<b class='flag-5'>模型</b>快速落地

    探討IP查詢技術(shù)金融行業(yè)的深度應(yīng)用

    隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,金融行業(yè)對(duì)信息技術(shù)的依賴程度日益加深。其中,IP查詢技術(shù)作為網(wǎng)絡(luò)安全與風(fēng)控的重要工具,金融行業(yè)的應(yīng)用日益廣泛且
    的頭像 發(fā)表于 09-07 10:08 ?177次閱讀

    深度學(xué)習(xí)模型有哪些應(yīng)用場(chǎng)景

    深度學(xué)習(xí)模型作為人工智能領(lǐng)域的重要分支,已經(jīng)多個(gè)應(yīng)用場(chǎng)景展現(xiàn)出其巨大的潛力和價(jià)值。這些應(yīng)用不僅改變了我們的日常生活,還推動(dòng)了科技進(jìn)步和產(chǎn)業(yè)升級(jí)。以下將詳細(xì)探討深度學(xué)習(xí)
    的頭像 發(fā)表于 07-16 18:25 ?1132次閱讀

    AI模型MCU的應(yīng)用

    機(jī)遇。將AI模型集成到MCU,不僅提升了設(shè)備的智能化水平,還使得設(shè)備能夠執(zhí)行更復(fù)雜的任務(wù),實(shí)現(xiàn)自主決策和實(shí)時(shí)響應(yīng)。本文將從AI模型MCU
    的頭像 發(fā)表于 07-12 10:24 ?695次閱讀

    華為如何助力金融模型開出價(jià)值之花

    2024,我們正見證金融模型走向成熟
    的頭像 發(fā)表于 07-09 13:59 ?2513次閱讀

    “技術(shù)故障”背刺巴菲特,金融模型到底靠不靠譜?

    英特爾? 至強(qiáng)? CPU Max系列處理器硬件能力、軟件優(yōu)化、生態(tài)適配、總擁有成本優(yōu)勢(shì)等方面都與金融場(chǎng)景非常契合,不失為業(yè)界大模型落地的一種新思路。
    的頭像 發(fā)表于 06-28 23:05 ?170次閱讀
    “技術(shù)故障”背刺巴菲特,<b class='flag-5'>金融</b>大<b class='flag-5'>模型</b>到底靠不靠譜?

    EVASH Ultra EEPROM 無線麥克風(fēng)方案的應(yīng)用

    EVASH Ultra EEPROM 無線麥克風(fēng)方案的應(yīng)用
    的頭像 發(fā)表于 06-23 17:16 ?551次閱讀

    金融模型,要聽見遠(yuǎn)方的風(fēng)

    模型落地第一站,可以從遠(yuǎn)向近走
    的頭像 發(fā)表于 05-11 09:50 ?1200次閱讀
    <b class='flag-5'>金融</b>大<b class='flag-5'>模型</b>,要聽見遠(yuǎn)方的<b class='flag-5'>風(fēng)</b>

    【大語言模型:原理與工程實(shí)踐】大語言模型的評(píng)測(cè)

    和優(yōu)化至關(guān)重要,它們能夠提供準(zhǔn)確的反饋,指導(dǎo)模型訓(xùn)練和調(diào)優(yōu)過程的改進(jìn)方向。 大語言模型對(duì)話能力評(píng)測(cè):對(duì)話能力評(píng)測(cè)是大語言模型性能評(píng)估的
    發(fā)表于 05-07 17:12

    商湯科技聯(lián)合海通證券發(fā)布多模態(tài)全棧式大模型

    商湯科技近日隆重推出了其最新研發(fā)的“日日新SenseNova 5.0”大模型體系,并與海通證券攜手,共同發(fā)布了業(yè)內(nèi)首個(gè)專為金融行業(yè)量身打造的多模態(tài)全棧式大模型。此次強(qiáng)強(qiáng)聯(lián)合旨在加速大模型
    的頭像 發(fā)表于 05-07 14:15 ?415次閱讀

    商湯科技與海通證券攜手發(fā)布金融行業(yè)首個(gè)多模態(tài)全棧式大模型

    商湯科技與海通證券聯(lián)合研發(fā)并發(fā)布了金融行業(yè)內(nèi)首個(gè)面向多業(yè)務(wù)場(chǎng)景的多模態(tài)全棧式大模型。雙方計(jì)劃將這一先進(jìn)技術(shù)應(yīng)用于智能問答、合規(guī)風(fēng)控、代碼輔助以及辦公助手等關(guān)鍵業(yè)務(wù)領(lǐng)域,以實(shí)現(xiàn)大
    的頭像 發(fā)表于 05-06 10:16 ?395次閱讀

    模型戰(zhàn)略評(píng)估系統(tǒng)的應(yīng)用有哪些

    智慧華盛恒輝大模型,顧名思義,是指參數(shù)規(guī)模超過千萬的機(jī)器學(xué)習(xí)模型。這些模型主要應(yīng)用于自然語言處理、計(jì)算機(jī)視覺、語音識(shí)別等領(lǐng)域,場(chǎng)景下的表
    的頭像 發(fā)表于 04-24 13:48 ?225次閱讀

    九聯(lián)科技高性能模組賦能金融支付場(chǎng)景

    近日,九聯(lián)科技針對(duì)金融支付應(yīng)用場(chǎng)景,成功推出了一款高性能模組。該模組憑借先進(jìn)的通信技術(shù),多種網(wǎng)絡(luò)環(huán)境下均展現(xiàn)出了卓越的適應(yīng)性,為支付音箱設(shè)備帶來了前所未有的性能提升,進(jìn)一步推動(dòng)了金融
    的頭像 發(fā)表于 03-13 10:19 ?513次閱讀

    華為云盤古大模型通過金融模型標(biāo)準(zhǔn)符合性驗(yàn)證

    近日,中國(guó)信通院組織的可信AI大模型標(biāo)準(zhǔn)符合性驗(yàn)證,華為云的盤古大模型表現(xiàn)出色,成功通過了金融模型
    的頭像 發(fā)表于 03-05 10:12 ?543次閱讀