0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

互聯(lián)網(wǎng)反欺詐問(wèn)題提出的必要性及重要性、通用技術(shù)手段及應(yīng)用場(chǎng)景

芯盾時(shí)代 ? 來(lái)源:芯盾時(shí)代 ? 作者:芯盾時(shí)代 ? 2020-09-25 14:35 ? 次閱讀

AI加持下的互聯(lián)網(wǎng)反欺詐
本文將從問(wèn)題提出的必要性及重要性、通用技術(shù)手段及應(yīng)用場(chǎng)景角度,對(duì)專家經(jīng)驗(yàn)規(guī)則自學(xué)習(xí)機(jī)制,風(fēng)評(píng)模型可解釋性問(wèn)題作系統(tǒng)全面的介紹,歡迎大家討論交流。

01

專家經(jīng)驗(yàn)規(guī)則自學(xué)習(xí)機(jī)制

在大數(shù)據(jù)時(shí)代背景下,金融犯罪和金融欺詐的新手段層出不窮,日漸趨于科技化、專業(yè)化、規(guī)?;哺哂须[蔽性,由過(guò)去的單兵作戰(zhàn)演變成有規(guī)模、有組織的團(tuán)伙欺詐,嚴(yán)重制約了傳統(tǒng)的專家知識(shí)庫(kù)、專家經(jīng)驗(yàn)規(guī)則持續(xù)有效地發(fā)揮作用,亟需解決兩方面問(wèn)題:

基于數(shù)據(jù)算法驅(qū)動(dòng),自動(dòng)化調(diào)整的場(chǎng)景規(guī)則集中的閾值和權(quán)重,以保障規(guī)則持續(xù)有效性;

從不同維度發(fā)掘時(shí)效性強(qiáng)的新風(fēng)控規(guī)則,以持續(xù)豐富完善反欺詐規(guī)則集。

規(guī)則閾值、權(quán)重

規(guī)則閾值、權(quán)重學(xué)習(xí)涉及特征離散化、特征選擇、特征降維、權(quán)重參數(shù)回歸等流程。

信息熵:用來(lái)評(píng)估樣本集合的純度的一個(gè)參數(shù),是系統(tǒng)的不確定性、隨機(jī)性度量指標(biāo)。

卡方分箱原理:特征離散化算法,根據(jù)樣本數(shù)據(jù)推斷總體的分布與期望分布是否有顯著性差異, 或者推斷兩個(gè)分類變量是否相關(guān)或者獨(dú)立。

最小熵分箱:特征離散化算法,最小熵分箱是典型的自頂向下分箱方法。最小熵分箱將待分箱特征的所有取值都放到一個(gè)箱體里,然后依據(jù)最小熵原則進(jìn)行箱體分裂。

基尼(gini)系數(shù):特征離散化算法,總體內(nèi)部包含越混亂,基尼系數(shù)越大;內(nèi)部純度越高,基尼系數(shù)越小。

特征選擇:特征選擇在于選取對(duì)訓(xùn)練數(shù)據(jù)具有分類能力的特征,提升模型整體預(yù)測(cè)能力,常用到技術(shù)包括lasso回歸、Feature Importance、特征共線性驗(yàn)證等。

Lasso回歸:使用少量觀測(cè)值就能夠完全恢復(fù)出非零的系數(shù)。其中不同的是,樣本的數(shù)量需要“足夠大”,否則L1模型的表現(xiàn)會(huì)充滿隨機(jī)性。

新風(fēng)控規(guī)則

新欺詐規(guī)則挖掘,根據(jù)規(guī)則中所處理的值類型分為兩類:

如果規(guī)則考慮的關(guān)聯(lián)是項(xiàng)的存在與不存在,則它是布爾關(guān)聯(lián)規(guī)則;

如果規(guī)則描述的是量化的項(xiàng)或?qū)傩灾g的關(guān)聯(lián),則它是量化關(guān)聯(lián)規(guī)則。

本質(zhì)是頻繁項(xiàng)集挖掘,常用到算法包括Apriori、FpGrowth。

Apriori算法利用頻繁集的兩個(gè)特性,過(guò)濾了很多無(wú)關(guān)的集合,效率提高不少,但是Apriori算法是一個(gè)候選消除算法,每一次消除都需要掃描一次所有數(shù)據(jù)記錄,造成整個(gè)算法在面臨大數(shù)據(jù)集時(shí)顯得無(wú)能為力。

FpGrowth算法通過(guò)構(gòu)造一個(gè)樹(shù)結(jié)構(gòu)來(lái)壓縮數(shù)據(jù)記錄,使得挖掘頻繁項(xiàng)集只需要掃描兩次數(shù)據(jù)記錄,而且該算法不需要生成候選集合,所以效率會(huì)比較高。

02

風(fēng)評(píng)模型可解釋性問(wèn)題

人工智能算法模型正在對(duì)金融行業(yè)產(chǎn)生重大影響,前提是要了解AI算法的優(yōu)勢(shì)和局限性,以及適合在金融領(lǐng)域發(fā)揮作用的場(chǎng)景。當(dāng)我們?cè)诮鹑跇I(yè)務(wù)中使用AI算法,期望通過(guò)可度量的方法對(duì)模型結(jié)果進(jìn)行分析、解釋,以期對(duì)算法進(jìn)行優(yōu)化,對(duì)業(yè)務(wù)進(jìn)行方向性的指導(dǎo),確保模型與要解決的業(yè)務(wù)問(wèn)題保持一致,即模型解釋性分析問(wèn)題。模型的解釋性分析可幫助模型開(kāi)發(fā)人員及業(yè)務(wù)運(yùn)營(yíng)人員了解并解釋模型中包含和未包含的特征因素,及特征如何影響模型結(jié)果。

廣義上,模型的解釋性分析目的是全局定義特征對(duì)模型的影響,同時(shí)定義單個(gè)特征對(duì)模型的個(gè)性化影響;更好的理解模型行為,更好的進(jìn)行相應(yīng)的業(yè)務(wù)決策;通常對(duì)機(jī)器學(xué)習(xí)模型分為“白盒”模型和“黑盒”模型:

“白盒”模型

“白盒”模型如線性、Logistic回歸模型,預(yù)測(cè)能力較弱,但是簡(jiǎn)單易理解。線性關(guān)系如信貸欺詐與人口統(tǒng)計(jì)學(xué)特征、經(jīng)濟(jì)收入等的相關(guān)性。決策樹(shù)模型(RandomForest vs XGBoost vs LightGBM)是目前業(yè)內(nèi)公認(rèn)可解釋性較好的非線性機(jī)器學(xué)習(xí)算法,模型每作出一個(gè)決策都會(huì)通過(guò)一個(gè)決策序列來(lái)向我們展示模型的決策依據(jù),決策樹(shù)模型自帶的基于信息理論的篩選變量標(biāo)準(zhǔn)也有助于幫助我們理解在模型決策產(chǎn)生的過(guò)程中哪些變量起到了顯著的作用;白盒模型特征明確,邏輯簡(jiǎn)單,本身具備可解釋性。

針對(duì)“白盒”模型,我們可以從數(shù)據(jù)分布圖、特征重要度、Embedding可視化、獨(dú)立特征分析(PDP)、全局性分析(SHAP)、局部特征信息(LIME)、特征相關(guān)性(相關(guān)系數(shù))等維度提供分析技術(shù)。

特征重要度:從兩個(gè)角度分析“特征收益重要性”和“特征分裂重要性”;特征收益重要性指特征分類的平均訓(xùn)練損失的減少量,意味著相應(yīng)的特征對(duì)模型的相對(duì)貢獻(xiàn)值;特征分裂重要性是指訓(xùn)練樣本決策分裂的次數(shù),兩者從不同維度度量不同特征在模型訓(xùn)練中的重要性。

獨(dú)立特征分析:我們通過(guò)特征重要度得知某個(gè)特征對(duì)模型的影響度,以及用SHAP來(lái)評(píng)估全局特征重要性;但如何評(píng)估某個(gè)單獨(dú)的特征,嘗試通過(guò)PDP來(lái)評(píng)估獨(dú)立特征,展示單個(gè)特征對(duì)于模型預(yù)測(cè)的邊際效益,單個(gè)特征是如何影響預(yù)測(cè)的,通過(guò)繪制特征和預(yù)測(cè)目標(biāo)之間的一維關(guān)系圖或二維關(guān)系圖來(lái)了解特征與目標(biāo)之間的關(guān)系。多個(gè)特征的復(fù)雜性,通過(guò)單個(gè)特征分析,進(jìn)一步驗(yàn)證單個(gè)特征對(duì)模型的影響度。

“黑盒”模型

“黑盒”模型使用復(fù)雜的機(jī)器學(xué)習(xí)算法(深度網(wǎng)絡(luò)學(xué)習(xí))訓(xùn)練數(shù)據(jù),輸入特征經(jīng)過(guò)組合變換,維度變換等特征工程步驟,需要分析及調(diào)整數(shù)據(jù)與模型,確保模型結(jié)果與要解決的問(wèn)題保持一致;然而這些模型的內(nèi)部機(jī)制難以理解,也無(wú)法估計(jì)每個(gè)特征對(duì)模型預(yù)測(cè)結(jié)果的重要性以解釋模型結(jié)果與輸入的特征屬性潛在的關(guān)聯(lián)關(guān)系,更無(wú)法直接理解不同特征之間如何相互工作(數(shù)據(jù)的相關(guān)性不等價(jià)于因果關(guān)系)。

針對(duì)“黑盒”模型,我們可以從深度網(wǎng)絡(luò)結(jié)構(gòu)分析,風(fēng)評(píng)結(jié)果命中團(tuán)伙關(guān)聯(lián)圖譜角度去解釋模型有效性。

關(guān)聯(lián)圖譜提供豐富的圖構(gòu)建、圖查詢、圖分析、圖嵌入、圖挖掘技術(shù),通過(guò)社區(qū)檢測(cè)、關(guān)鍵節(jié)點(diǎn)分析、關(guān)聯(lián)分析、異常網(wǎng)絡(luò)結(jié)構(gòu)發(fā)現(xiàn)等場(chǎng)景化算法和模型,提供風(fēng)控和營(yíng)銷等場(chǎng)景化輔助決策服務(wù)。如信用卡養(yǎng)卡套現(xiàn)識(shí)別,養(yǎng)卡套現(xiàn)團(tuán)伙往往都與黑商戶溝通,正常養(yǎng)卡階段,消費(fèi)的商戶相對(duì)固定,而通過(guò)遍歷關(guān)聯(lián)圖譜的方式,能夠基于上述行為特征建立欺詐關(guān)聯(lián)圖譜,識(shí)別養(yǎng)卡套現(xiàn)團(tuán)伙。

風(fēng)控場(chǎng)景對(duì)于數(shù)據(jù)、模型、特征的可解釋性,穩(wěn)定性要求是重點(diǎn),可解釋性和穩(wěn)定性仍然需要結(jié)合業(yè)務(wù)和專家經(jīng)驗(yàn)進(jìn)行判斷。
責(zé)任編輯:xj

原文標(biāo)題:AI加持下的互聯(lián)網(wǎng)反欺詐 | 反欺詐AI全域治理三部曲(中)

文章出處:【微信公眾號(hào):芯盾時(shí)代】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 互聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    54

    文章

    11041

    瀏覽量

    102450
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29411

    瀏覽量

    267707

原文標(biāo)題:AI加持下的互聯(lián)網(wǎng)反欺詐 | 反欺詐AI全域治理三部曲(中)

文章出處:【微信號(hào):trusfort,微信公眾號(hào):芯盾時(shí)代】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    源測(cè)量單元設(shè)備的技術(shù)原理和應(yīng)用場(chǎng)景

    ,SMU的功能和應(yīng)用領(lǐng)域也在不斷擴(kuò)展,其在電子測(cè)試中的重要性不言而喻。綜上所述,SMU設(shè)備憑借其獨(dú)特的技術(shù)原理和廣泛的應(yīng)用場(chǎng)景,在現(xiàn)代電子測(cè)試中發(fā)揮著不可或缺的作用。對(duì)于工程師來(lái)說(shuō),深入了解和靈活應(yīng)用SMU將是提升電路板測(cè)試效果
    發(fā)表于 10-22 11:10

    工業(yè)工程軟件在企業(yè)導(dǎo)入中的重要性必要性

    在全球化競(jìng)爭(zhēng)加劇、市場(chǎng)需求瞬息萬(wàn)變的今天,企業(yè)為了保持競(jìng)爭(zhēng)力,需要不斷優(yōu)化生產(chǎn)流程、提高生產(chǎn)效率、降低成本并保障產(chǎn)品質(zhì)量。而工業(yè)工程軟件作為一種強(qiáng)大的工具,其在企業(yè)導(dǎo)入中的重要性必要性日益凸顯
    的頭像 發(fā)表于 10-18 11:09 ?106次閱讀

    超聲波測(cè)厚儀的技術(shù)原理和應(yīng)用場(chǎng)景

    測(cè)厚儀還可應(yīng)用于陶瓷加工、玻璃制造、管道防腐等領(lǐng)域,其廣泛的應(yīng)用范圍體現(xiàn)了其在工業(yè)生產(chǎn)、質(zhì)量控制和安全檢測(cè)等方面的重要性。綜上所述,超聲波測(cè)厚儀以其獨(dú)特的技術(shù)原理和廣泛的應(yīng)用場(chǎng)景,成為了工業(yè)檢測(cè)領(lǐng)域中不可或缺的
    發(fā)表于 09-27 15:06

    NFC協(xié)議分析儀的技術(shù)原理和應(yīng)用場(chǎng)景

    的安全,并提出相應(yīng)的防護(hù)措施和改進(jìn)建議。 綜上所述,NFC協(xié)議分析儀在移動(dòng)支付、門(mén)禁系統(tǒng)、智能標(biāo)簽識(shí)別、物聯(lián)網(wǎng)設(shè)備控制以及安全分析等領(lǐng)域都有廣泛的應(yīng)用場(chǎng)景。它能夠幫助用戶快速準(zhǔn)確地分
    發(fā)表于 09-25 14:45

    無(wú)人機(jī)主動(dòng)防御系統(tǒng)的必要性重要性

    的安全性問(wèn)題也日益凸顯,無(wú)人機(jī)的非法入侵、惡意攻擊等行為給人們的生活和國(guó)家安全帶來(lái)了嚴(yán)重威脅。因此,研究無(wú)人機(jī)主動(dòng)防御系統(tǒng)的必要性重要性具有十分重要的現(xiàn)實(shí)意義。 二、無(wú)人機(jī)的安全隱患 非法入侵 無(wú)人機(jī)的非法入
    的頭像 發(fā)表于 07-08 09:45 ?451次閱讀

    求助,ADC接地的重要性?

    ADC接地的重要性
    發(fā)表于 06-04 07:56

    論RISC-V的MCU中UART接口的重要性

    的適用重要性。在某些應(yīng)用場(chǎng)景中,只需要異步通信能力的UART接口就能滿足需求,從而簡(jiǎn)化了系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn)。 綜上所述,RISC-V的MCU中UART接口的重要性在于其廣泛的適用
    發(fā)表于 05-27 15:52

    能源互聯(lián)網(wǎng)平臺(tái)的功能和應(yīng)用場(chǎng)景

    能源革命,為建筑樓宇、工業(yè)企業(yè)、建筑社區(qū)、工業(yè)園區(qū)、城市區(qū)域等五大應(yīng)用場(chǎng)景,包括綜合能源、智慧電力、智慧燃?xì)?、智慧熱力、空調(diào)冷熱、工藝?yán)錈岬?0多個(gè)項(xiàng)目類型提供可靠的物聯(lián)網(wǎng)支持。 通過(guò)數(shù)之能推出的能源互聯(lián)網(wǎng)云平
    的頭像 發(fā)表于 03-18 17:27 ?398次閱讀

    集成芯片的重要性必要性

    集成芯片在現(xiàn)代科技和工業(yè)中占據(jù)著至關(guān)重要的地位,其重要性必要性主要體現(xiàn)在以下幾個(gè)方面。
    的頭像 發(fā)表于 03-18 15:17 ?881次閱讀

    NanoEdge AI的技術(shù)原理、應(yīng)用場(chǎng)景及優(yōu)勢(shì)

    能耗并提高數(shù)據(jù)安全。本文將對(duì) NanoEdge AI 的技術(shù)原理、應(yīng)用場(chǎng)景以及優(yōu)勢(shì)進(jìn)行綜述。 1、技術(shù)原理 NanoEdge AI 的核心技術(shù)
    發(fā)表于 03-12 08:09

    PLC網(wǎng)關(guān)的重要性

    PLC網(wǎng)關(guān)的重要性 可編程邏輯控制器(PLC)作為現(xiàn)代工業(yè)自動(dòng)化領(lǐng)域的核心設(shè)備,廣泛應(yīng)用于各種自動(dòng)化控制系統(tǒng)。隨著工業(yè)物聯(lián)網(wǎng)(IIoT)技術(shù)的發(fā)展,PLC網(wǎng)關(guān)成為了連接傳統(tǒng)PLC系統(tǒng)和現(xiàn)代工業(yè)物
    的頭像 發(fā)表于 01-30 15:50 ?504次閱讀
    PLC網(wǎng)關(guān)的<b class='flag-5'>重要性</b>

    工業(yè)互聯(lián)網(wǎng)解決方案與應(yīng)用場(chǎng)景

    ,工業(yè)互聯(lián)網(wǎng)的應(yīng)用也面臨著諸多挑戰(zhàn),數(shù)之能提供高效可靠的工業(yè)互聯(lián)網(wǎng)解決方案,幫助企業(yè)更好的面對(duì)工業(yè)互聯(lián)網(wǎng)應(yīng)用及其挑戰(zhàn)。 1、智能制造 智能制造是工業(yè)互聯(lián)網(wǎng)應(yīng)用的
    的頭像 發(fā)表于 01-26 11:00 ?568次閱讀

    工業(yè)互聯(lián)網(wǎng)實(shí)訓(xùn)是什么?工業(yè)互聯(lián)網(wǎng)實(shí)訓(xùn)包括哪些?

    工業(yè)互聯(lián)網(wǎng)實(shí)訓(xùn)是一種針對(duì)工業(yè)互聯(lián)網(wǎng)領(lǐng)域的培訓(xùn)課程,旨在幫助學(xué)員掌握工業(yè)互聯(lián)網(wǎng)的基本概念、技術(shù)、應(yīng)用和發(fā)展趨勢(shì)。通過(guò)實(shí)訓(xùn),學(xué)員可以了解工業(yè)互聯(lián)網(wǎng)
    的頭像 發(fā)表于 01-17 17:00 ?852次閱讀

    何謂正確去耦?有何必要性

    電子發(fā)燒友網(wǎng)站提供《何謂正確去耦?有何必要性?.pdf》資料免費(fèi)下載
    發(fā)表于 11-30 09:25 ?0次下載
    何謂正確去耦?有何<b class='flag-5'>必要性</b>?

    化工園區(qū)人員定位的重要性有哪些?

    重要性不言而喻。這不僅是安全管理的必要手段,也是對(duì)突發(fā)事件的應(yīng)急措施。下面給大家介紹化工園區(qū)人員定位的重要性。 化工園區(qū)人員定位是保障安全生產(chǎn)的
    的頭像 發(fā)表于 11-16 16:03 ?539次閱讀