參數(shù)空間下的流式大數(shù)據(jù)在線異常檢測(cè)算法研究
發(fā)布時(shí)間:2021-12-19 02:09
近年來,社交網(wǎng)絡(luò)、基于位置的在線服務(wù)、移動(dòng)支付、交通監(jiān)控以及各種手機(jī)應(yīng)用中產(chǎn)生了海量的高速實(shí)時(shí)數(shù)據(jù)流,從這些高速數(shù)據(jù)流中快速高效地檢測(cè)出復(fù)雜異常狀況已被許多領(lǐng)域認(rèn)為是至關(guān)重要的。在很多復(fù)雜應(yīng)用環(huán)境下,由于不同需求,不同參數(shù)設(shè)定的異常狀況往往需要同時(shí)被實(shí)時(shí)監(jiān)控,這對(duì)快速的檢測(cè)查詢響應(yīng)帶來了較大挑戰(zhàn)。因此,本文針對(duì)移動(dòng)社交網(wǎng)絡(luò)中用戶異常簽到,以及參數(shù)空間下的流式多異常檢測(cè)問題,做出了如下工作:針對(duì)移動(dòng)社交網(wǎng)絡(luò)中用戶異常簽到位置檢測(cè)問題,提出了一類基于用戶移動(dòng)行為特征的異常簽到在線檢測(cè)方法。首先,在基于距離的異常模型基礎(chǔ)上,提出了基于歷史位置(H-Outlier)和基于好友圈(F-Outlier)兩種異常簽到模型;然后,針對(duì)H-Outlier,提出了一種優(yōu)化的檢測(cè)算法H-Opt,利用所提的簽到狀態(tài)模型與優(yōu)化的鄰居搜索機(jī)制降低檢測(cè)時(shí)間;針對(duì)F-Outlier,提出了一種基于觸發(fā)的優(yōu)化檢測(cè)算法F-Opt,將連續(xù)的在線異常檢測(cè)轉(zhuǎn)化成了基于觸發(fā)的異常檢測(cè)方式。最后,在真實(shí)的移動(dòng)社交網(wǎng)絡(luò)用戶簽到數(shù)據(jù)集上,驗(yàn)證了所提算法的有效性。實(shí)驗(yàn)結(jié)果顯示,F-Opt顯著降低了H-Opt的異常檢測(cè)錯(cuò)誤率;同時(shí),相比于...
【文章來源】:煙臺(tái)大學(xué)山東省
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究意義
1.2 研究思路與創(chuàng)新點(diǎn)
1.3 研究?jī)?nèi)容與組織結(jié)構(gòu)
2 異常檢測(cè)算法綜述
2.1 在靜態(tài)數(shù)據(jù)中基于距離的異常檢測(cè)
2.2 在數(shù)據(jù)流中基于距離的異常檢測(cè)
2.3 多查詢的異常檢測(cè)
3 移動(dòng)社交網(wǎng)絡(luò)異常簽到在線檢測(cè)算法
3.1 引言
3.2 問題定義
3.3 基于歷史位置的異常簽到檢測(cè)算法
3.3.1 優(yōu)化策略
3.3.2 H-Outlier在線檢測(cè)算法
3.3.3 基于好友圈的異常簽到檢測(cè)算法
3.4 實(shí)驗(yàn)與結(jié)果
3.4.1 實(shí)驗(yàn)數(shù)據(jù)與測(cè)試方法
3.4.2 有效性評(píng)估
3.4.3 效率評(píng)估
3.5 小結(jié)
4 參數(shù)空間下的流式大數(shù)據(jù)在線異常檢測(cè)框架
4.1 引言
4.2 問題定義
4.3 異常檢測(cè)框架
4.3.1 在參數(shù)空間R×K中的異常檢測(cè)
4.3.2 在參數(shù)空間R×K×W中的異常檢測(cè)
4.3.3 在參數(shù)空間R×K×S中的異常檢測(cè)
4.3.4 針對(duì)異常檢測(cè)的PSOD框架
4.4 實(shí)驗(yàn)數(shù)據(jù)與實(shí)驗(yàn)方法
4.4.1 不同參數(shù)空間的性能
4.4.2 不同參數(shù)規(guī)模的性能
4.5 小結(jié)
5 實(shí)際應(yīng)用分析討論
5.1 引言
5.2 信用卡欺詐檢測(cè)
5.3 出租車欺詐檢測(cè)
5.4 異常簽到檢測(cè)
6 總結(jié)與展望
參考文獻(xiàn)
致謝
攻讀碩士期間發(fā)表的論文
附錄一 表目錄
附錄二 圖目錄
【參考文獻(xiàn)】:
期刊論文
[1]《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016—2020年)》發(fā)布[J]. 阮健. 工程建設(shè)標(biāo)準(zhǔn)化. 2017(03)
[2]在線社交網(wǎng)絡(luò)中異常帳號(hào)檢測(cè)方法研究[J]. 張玉清,呂少卿,范丹. 計(jì)算機(jī)學(xué)報(bào). 2015(10)
[3]基于群體特征的社交僵尸網(wǎng)絡(luò)檢測(cè)方法[J]. 倪平,張玉清,聞?dòng)^行,劉奇旭,范丹. 中國(guó)科學(xué)院大學(xué)學(xué)報(bào). 2014(05)
[4]基于軌跡點(diǎn)局部異常度的異常點(diǎn)檢測(cè)算法[J]. 劉良旭,樂嘉錦,喬少杰,宋加濤. 計(jì)算機(jī)學(xué)報(bào). 2011(10)
[5]基于R-Tree的高效異常軌跡檢測(cè)算法[J]. 劉良旭,喬少杰,劉賓,樂嘉錦,唐常杰. 軟件學(xué)報(bào). 2009(09)
本文編號(hào):3543577
【文章來源】:煙臺(tái)大學(xué)山東省
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究意義
1.2 研究思路與創(chuàng)新點(diǎn)
1.3 研究?jī)?nèi)容與組織結(jié)構(gòu)
2 異常檢測(cè)算法綜述
2.1 在靜態(tài)數(shù)據(jù)中基于距離的異常檢測(cè)
2.2 在數(shù)據(jù)流中基于距離的異常檢測(cè)
2.3 多查詢的異常檢測(cè)
3 移動(dòng)社交網(wǎng)絡(luò)異常簽到在線檢測(cè)算法
3.1 引言
3.2 問題定義
3.3 基于歷史位置的異常簽到檢測(cè)算法
3.3.1 優(yōu)化策略
3.3.2 H-Outlier在線檢測(cè)算法
3.3.3 基于好友圈的異常簽到檢測(cè)算法
3.4 實(shí)驗(yàn)與結(jié)果
3.4.1 實(shí)驗(yàn)數(shù)據(jù)與測(cè)試方法
3.4.2 有效性評(píng)估
3.4.3 效率評(píng)估
3.5 小結(jié)
4 參數(shù)空間下的流式大數(shù)據(jù)在線異常檢測(cè)框架
4.1 引言
4.2 問題定義
4.3 異常檢測(cè)框架
4.3.1 在參數(shù)空間R×K中的異常檢測(cè)
4.3.2 在參數(shù)空間R×K×W中的異常檢測(cè)
4.3.3 在參數(shù)空間R×K×S中的異常檢測(cè)
4.3.4 針對(duì)異常檢測(cè)的PSOD框架
4.4 實(shí)驗(yàn)數(shù)據(jù)與實(shí)驗(yàn)方法
4.4.1 不同參數(shù)空間的性能
4.4.2 不同參數(shù)規(guī)模的性能
4.5 小結(jié)
5 實(shí)際應(yīng)用分析討論
5.1 引言
5.2 信用卡欺詐檢測(cè)
5.3 出租車欺詐檢測(cè)
5.4 異常簽到檢測(cè)
6 總結(jié)與展望
參考文獻(xiàn)
致謝
攻讀碩士期間發(fā)表的論文
附錄一 表目錄
附錄二 圖目錄
【參考文獻(xiàn)】:
期刊論文
[1]《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016—2020年)》發(fā)布[J]. 阮健. 工程建設(shè)標(biāo)準(zhǔn)化. 2017(03)
[2]在線社交網(wǎng)絡(luò)中異常帳號(hào)檢測(cè)方法研究[J]. 張玉清,呂少卿,范丹. 計(jì)算機(jī)學(xué)報(bào). 2015(10)
[3]基于群體特征的社交僵尸網(wǎng)絡(luò)檢測(cè)方法[J]. 倪平,張玉清,聞?dòng)^行,劉奇旭,范丹. 中國(guó)科學(xué)院大學(xué)學(xué)報(bào). 2014(05)
[4]基于軌跡點(diǎn)局部異常度的異常點(diǎn)檢測(cè)算法[J]. 劉良旭,樂嘉錦,喬少杰,宋加濤. 計(jì)算機(jī)學(xué)報(bào). 2011(10)
[5]基于R-Tree的高效異常軌跡檢測(cè)算法[J]. 劉良旭,喬少杰,劉賓,樂嘉錦,唐常杰. 軟件學(xué)報(bào). 2009(09)
本文編號(hào):3543577
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3543577.html
最近更新
教材專著