天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于時序不均衡數(shù)據(jù)的在線交易欺詐檢測研究

發(fā)布時間:2020-06-19 01:13
【摘要】:由于近幾年計算機處理能力的提升和數(shù)據(jù)科學(xué)的進步,推動了互聯(lián)網(wǎng)的快速發(fā)展,以第三方支付服務(wù)為代表的在線交易模式已成為人們主流的消費方式之一,每時每刻來自互聯(lián)網(wǎng)各個角落的人們通過這種基于網(wǎng)絡(luò)的在線交易平臺進行著成千上萬的交易。而隨著在線交易支付訂單規(guī)模擴大和總交易金額的大幅度提升,各種類型的在線交易欺詐行為也越來越普遍。在線交易風(fēng)險管理一直以來是業(yè)界十分關(guān)注的問題,而作為風(fēng)險管理的重要組成部分,研究在線交易風(fēng)險識別具有十分重要的現(xiàn)實意義。在線交易欺詐行為有發(fā)生頻次低、造成危害大等特征,一般的反欺詐手段難以進行有效的識別并加以防范,隨著機器學(xué)習(xí)與數(shù)據(jù)挖掘相關(guān)技術(shù)趨于成熟,將其應(yīng)用于在線交易風(fēng)險識別已成為近幾年相關(guān)領(lǐng)域的研究趨勢。在有關(guān)在線交易風(fēng)險識別的研究中,其主要的難點有兩個方面:首先是欺詐行為只占所有交易行為的很小一部分,數(shù)據(jù)類別分布存在高度的不均衡性,其不均衡比例甚至可達萬分之一,而且部分欺詐類樣本與正常樣本的特征信息存在高度的相似性,使得普通的分類方法難以有效識別這類欺詐行為,因此需要利用不均衡數(shù)據(jù)分類的方法來對其進行有效的識別檢測。其次,欺詐行為是具有時效性的,由于欺詐平臺或者是欺詐團伙為了應(yīng)對反欺詐措施會不斷更改其作案方式,因此造成分類器無法適應(yīng)新的特征規(guī)則,進而導(dǎo)致其無法對欺詐行為進行有效識別,即概念漂移現(xiàn)象。針對在線交易欺詐檢測中的類別不均衡分布以及數(shù)據(jù)流概念漂移兩個主要問題,本文在結(jié)合前人研究成果的基礎(chǔ)上,提出了基于XGBoost和SMOTE技術(shù)的改進算法M-XGB-SMOTE,其核心思想是結(jié)合XGBoost算法較強的二分類能力和SMOTE泛化能力強的優(yōu)點,以AUROC評估分數(shù)為指標從多輪重采樣訓(xùn)練分類器中篩選分類器,并基于上述分類器構(gòu)建集成分類結(jié)果的預(yù)測模型,以期提升模型預(yù)測的綜合性能。在以上算法構(gòu)建的基礎(chǔ)上,提出了基于歷史樣本抽樣遞減規(guī)律的算法MS-XGB-SMOTE,以期利用歷史樣本隨時間推移重要性遞減的規(guī)律減少模型受到數(shù)據(jù)流概念漂移帶來的負面影響。在基于交易風(fēng)險識別數(shù)據(jù)集的實驗環(huán)節(jié)中,與傳統(tǒng)的分類算法比較中可以看出,M-XGB-SMOTE的AUC綜合指標顯著高于其他算法的結(jié)果;在與傳統(tǒng)不均衡數(shù)據(jù)流分類算法的比較中可以看出,MS-XGBSMOTE算法的綜合預(yù)測能力有明顯提升。
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP181;F724.6;F832.2
【圖文】:

技術(shù)路線圖,技術(shù)路線,論文,不均衡


8圖 1-1 論文技術(shù)路線1.4 論文結(jié)構(gòu)本文主要由六章組成,本章主要介紹了在線交易欺詐檢測的研究背景,以及相關(guān)領(lǐng)域的國內(nèi)外研究現(xiàn)狀,包括不均衡數(shù)據(jù)分類,數(shù)據(jù)流分類以及欺詐檢測問題,并介紹了本文的主要研究內(nèi)容及工作。第二章首先針對不均衡數(shù)據(jù)分類的相關(guān)理論進行詳細的介紹,包括不均衡數(shù)據(jù)分類主要的研究方法,數(shù)據(jù)挖掘中傳統(tǒng)分類器的基礎(chǔ)理論。其次介紹了在線數(shù)據(jù)流的基本概念和特性,在此基礎(chǔ)上結(jié)合不均衡數(shù)據(jù)分類問題,介紹了不均衡數(shù)據(jù)流分類問題中的主要解決方法,最后介紹了面向不均衡數(shù)據(jù)分類的評價標準。第三章首先介紹了本文研究使用數(shù)據(jù)集的背景以及原始信息,其次根據(jù)數(shù)據(jù)預(yù)處理的流程對數(shù)據(jù)進行了清洗,最后基于樹模型分類器評估數(shù)據(jù)集所有特征的

集成學(xué)習(xí),模型結(jié)構(gòu)


電子科技大學(xué)碩士學(xué)位論文2.3.4 集成學(xué)習(xí)技術(shù)集成學(xué)習(xí)技術(shù),也被很多學(xué)者稱之為多分類器系統(tǒng),是一類常見的機器學(xué)習(xí)算法。其主要思想是在一定的規(guī)則下創(chuàng)建多個子分類器(一般為弱分類器),并根據(jù)某種規(guī)則對這些子分類器進行組合構(gòu)建,最終整合得到一個基于弱分類器集成的強分類器。除了直接將集成學(xué)習(xí)技術(shù)應(yīng)用不均衡數(shù)據(jù)分類問題,將重采樣技術(shù)或是代價敏感學(xué)習(xí)法與集成學(xué)習(xí)算法相結(jié)合,也是一種解決不均衡數(shù)據(jù)分類問題的主要方法[47]。集成學(xué)習(xí)的常用算法主要為:Boosting、Bagging 以及在 Bagging 思想上的擴展算法隨機森林,以下是相關(guān)的原理介紹:

【參考文獻】

相關(guān)期刊論文 前7條

1 陳斌;蘇一丹;黃山;;基于KM-SMOTE和隨機森林的不平衡數(shù)據(jù)分類[J];計算機技術(shù)與發(fā)展;2015年09期

2 陶新民;郝思媛;張冬雪;徐鵬;;不均衡數(shù)據(jù)分類算法的綜述[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2013年01期

3 陳建增;;第三方支付業(yè)務(wù)的反欺詐措施與技術(shù)探析[J];時代金融;2012年21期

4 于化龍;高尚;趙靖;秦斌;;基于過采樣技術(shù)和隨機森林的不平衡微陣列數(shù)據(jù)分類方法研究[J];計算機科學(xué);2012年05期

5 陶新民;劉福榮;童智靖;楊立標;;不均衡數(shù)據(jù)下基于SVM的故障檢測新算法[J];振動與沖擊;2010年12期

6 夏國恩;;客戶流失預(yù)測的現(xiàn)狀與發(fā)展研究[J];計算機應(yīng)用研究;2010年02期

7 王和勇;樊泓坤;姚正安;;SMOTE和Biased-SVM相結(jié)合的不平衡數(shù)據(jù)分類方法[J];計算機科學(xué);2008年05期

相關(guān)會議論文 前1條

1 曹璨;王鵬;黃海;陳宗海;;不均衡數(shù)據(jù)下的電信客戶流失方法研究綜述[A];第17屆中國系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)年會論文集(17th CCSSTA 2016)[C];2016年

相關(guān)博士學(xué)位論文 前1條

1 曹鵬;不均衡數(shù)據(jù)分類方法的研究[D];東北大學(xué);2014年

相關(guān)碩士學(xué)位論文 前2條

1 楊屹;基于稀有類分類的信用卡欺詐識別研究[D];北京工商大學(xué);2013年

2 董燕杰;不平衡數(shù)據(jù)集分類的Random-SMOTE方法研究[D];大連理工大學(xué);2009年



本文編號:2720095

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/2720095.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶be1d6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com