不平衡多變量可變長度的鼠標軌跡識別方法研究
發(fā)布時間:2022-12-06 04:53
隨著互聯(lián)網(wǎng)行為式驗證碼技術(shù)的發(fā)展,以拖動滑塊為代表的鼠標軌跡識別因其傳輸數(shù)據(jù)小、暴力破解難度大等特點,廣泛運用于多種人機驗證產(chǎn)品中。但是攻擊者可通過黑產(chǎn)工具產(chǎn)生類人軌跡批量操作以繞過檢測,并在對抗過程中不斷升級其偽造數(shù)據(jù)以持續(xù)繞過同樣升級的檢測技術(shù)。因此可利用機器學習算法建立有效的鼠標軌跡識別模型,以提高人機驗證中各種機器行為的檢出率。鼠標軌跡是用戶拖動滑塊時采樣獲得的水平方向x、垂直方向y和時間t三個維度的軌跡點集,不同于傳統(tǒng)時間序列,它具有多變量、可變長度、數(shù)據(jù)不平衡、標記樣本少等特點。由于這些特點,使得傳統(tǒng)的時間序列分類方法并不能直接應用于鼠標軌跡識別,當前有關鼠標軌跡識別方法也未能針對這些特點進行系統(tǒng)性解決;诖,本文對鼠標軌跡識別問題進行了深入研究,提出了一種結(jié)合特征組分層和半監(jiān)督學習的鼠標軌跡識別方法。主要研究內(nèi)容如下:1.針對鼠標軌跡多變量、可變長度的問題,采用基于特征的方法,從不同視角構(gòu)建基礎特征和輔助特征。具體地,從t-x維度提取特征作為基礎特征,用于描述人機軌跡差異性;從t-y維度提取特征作為輔助特征,用于輔助判斷,增加軌跡識別置信度。此外,為進行特征降維,提出了...
【文章頁數(shù)】:75 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
注釋表
第1章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文研究的主要內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關理論與技術(shù)
2.1 鼠標軌跡數(shù)據(jù)概述
2.2 數(shù)據(jù)不平衡問題
2.2.1 不平衡數(shù)據(jù)集
2.2.2 數(shù)據(jù)平衡方法
2.3 特征選擇概述
2.4 隨機森林算法
2.5 半監(jiān)督學習
2.5.1 半監(jiān)督學習概述
2.5.2 半監(jiān)督分類理論
2.6 本章小結(jié)
第3章 基于隨機森林的包裹式特征選擇算法
3.1 整體設計方案
3.2 特征設計
3.2.1 數(shù)據(jù)預處理
3.2.2 特征提取
3.3 基于不平衡數(shù)據(jù)的隨機森林特征重要性度量
3.3.1 隨機森林特征重要性度量
3.3.2 改進隨機森林特征重要性度量
3.4 基于隨機森林的包裹式特征選擇算法
3.4.1 特征選擇方法現(xiàn)存問題分析
3.4.2 基于隨機森林的特征選擇算法
3.5 本章小結(jié)
第4章 結(jié)合特征組分層和半監(jiān)督學習的鼠標軌跡識別算法
4.1 算法的提出
4.2 算法原理
4.2.1 單視角隨機森林分類器的訓練和預測過程
4.2.2 單視角隨機森林分類器的迭代過程
4.2.3 多視角隨機森林分類器的分類識別過程
4.3 算法描述
4.4 算法有效性分析
4.5 本章小結(jié)
第5章 算法驗證與結(jié)果分析
5.1 實驗環(huán)境與評價指標
5.2 結(jié)果與分析
5.2.1 特征選擇算法實驗結(jié)果及分析
5.2.2 鼠標軌跡識別算法實驗結(jié)果及分析
5.3 本章小結(jié)
第6章 總結(jié)與展望
6.1 工作總結(jié)
6.2 研究展望
參考文獻
致謝
攻讀碩士學位期間從事的科研工作及取得的成果
【參考文獻】:
期刊論文
[1]融合并行投票決策樹和半監(jiān)督學習的鼠標軌跡識別方法[J]. 孟廣婷,王紅,劉海燕. 小型微型計算機系統(tǒng). 2018(09)
[2]基于梯度提升決策樹的鼠標軌跡識別方法與研究[J]. 張志騰,劉琳嵐. 信息通信. 2018(09)
[3]基于樸素貝葉斯的鼠標軌跡識別方法[J]. 謝苗,劉琳嵐. 信息通信. 2018(09)
[4]基于梯度提升模型的行為式驗證碼人機識別[J]. 歐陽志友,孫孝魁. 信息網(wǎng)絡安全. 2017(09)
[5]基于隨機森林的特征選擇算法[J]. 姚登舉,楊靜,詹曉娟. 吉林大學學報(工學版). 2014(01)
博士論文
[1]基于半監(jiān)督學習的不平衡數(shù)據(jù)分類算法與應用[D]. 李鳳岐.大連理工大學 2014
碩士論文
[1]基于支持向量機的滑動式驗證碼人機識別研究[D]. 陳林萍.長沙理工大學 2018
[2]滑塊驗證碼人機識別系統(tǒng)特征選擇及應用研究[D]. 王二磊.長沙理工大學 2017
[3]時間序列遙感數(shù)據(jù)植被分類中的特征選擇方法研究[D]. 候智庭.云南師范大學 2017
[4]基于Relief算法的siRNA特征選擇研究[D]. 舒崇河.吉林大學 2017
[5]半監(jiān)督隨機森林分類算法及其并行化研究[D]. 馬超.重慶大學 2017
[6]基于梯度提升樹的行為式驗證碼人機識別的研究[D]. 蘇濤.華中師范大學 2016
[7]基于時間序列相似性的股價趨勢預測研究[D]. 孫建樂.重慶交通大學 2014
本文編號:3711099
【文章頁數(shù)】:75 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
注釋表
第1章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文研究的主要內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關理論與技術(shù)
2.1 鼠標軌跡數(shù)據(jù)概述
2.2 數(shù)據(jù)不平衡問題
2.2.1 不平衡數(shù)據(jù)集
2.2.2 數(shù)據(jù)平衡方法
2.3 特征選擇概述
2.4 隨機森林算法
2.5 半監(jiān)督學習
2.5.1 半監(jiān)督學習概述
2.5.2 半監(jiān)督分類理論
2.6 本章小結(jié)
第3章 基于隨機森林的包裹式特征選擇算法
3.1 整體設計方案
3.2 特征設計
3.2.1 數(shù)據(jù)預處理
3.2.2 特征提取
3.3 基于不平衡數(shù)據(jù)的隨機森林特征重要性度量
3.3.1 隨機森林特征重要性度量
3.3.2 改進隨機森林特征重要性度量
3.4 基于隨機森林的包裹式特征選擇算法
3.4.1 特征選擇方法現(xiàn)存問題分析
3.4.2 基于隨機森林的特征選擇算法
3.5 本章小結(jié)
第4章 結(jié)合特征組分層和半監(jiān)督學習的鼠標軌跡識別算法
4.1 算法的提出
4.2 算法原理
4.2.1 單視角隨機森林分類器的訓練和預測過程
4.2.2 單視角隨機森林分類器的迭代過程
4.2.3 多視角隨機森林分類器的分類識別過程
4.3 算法描述
4.4 算法有效性分析
4.5 本章小結(jié)
第5章 算法驗證與結(jié)果分析
5.1 實驗環(huán)境與評價指標
5.2 結(jié)果與分析
5.2.1 特征選擇算法實驗結(jié)果及分析
5.2.2 鼠標軌跡識別算法實驗結(jié)果及分析
5.3 本章小結(jié)
第6章 總結(jié)與展望
6.1 工作總結(jié)
6.2 研究展望
參考文獻
致謝
攻讀碩士學位期間從事的科研工作及取得的成果
【參考文獻】:
期刊論文
[1]融合并行投票決策樹和半監(jiān)督學習的鼠標軌跡識別方法[J]. 孟廣婷,王紅,劉海燕. 小型微型計算機系統(tǒng). 2018(09)
[2]基于梯度提升決策樹的鼠標軌跡識別方法與研究[J]. 張志騰,劉琳嵐. 信息通信. 2018(09)
[3]基于樸素貝葉斯的鼠標軌跡識別方法[J]. 謝苗,劉琳嵐. 信息通信. 2018(09)
[4]基于梯度提升模型的行為式驗證碼人機識別[J]. 歐陽志友,孫孝魁. 信息網(wǎng)絡安全. 2017(09)
[5]基于隨機森林的特征選擇算法[J]. 姚登舉,楊靜,詹曉娟. 吉林大學學報(工學版). 2014(01)
博士論文
[1]基于半監(jiān)督學習的不平衡數(shù)據(jù)分類算法與應用[D]. 李鳳岐.大連理工大學 2014
碩士論文
[1]基于支持向量機的滑動式驗證碼人機識別研究[D]. 陳林萍.長沙理工大學 2018
[2]滑塊驗證碼人機識別系統(tǒng)特征選擇及應用研究[D]. 王二磊.長沙理工大學 2017
[3]時間序列遙感數(shù)據(jù)植被分類中的特征選擇方法研究[D]. 候智庭.云南師范大學 2017
[4]基于Relief算法的siRNA特征選擇研究[D]. 舒崇河.吉林大學 2017
[5]半監(jiān)督隨機森林分類算法及其并行化研究[D]. 馬超.重慶大學 2017
[6]基于梯度提升樹的行為式驗證碼人機識別的研究[D]. 蘇濤.華中師范大學 2016
[7]基于時間序列相似性的股價趨勢預測研究[D]. 孫建樂.重慶交通大學 2014
本文編號:3711099
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3711099.html
教材專著