基于改進iForest的學(xué)生異常行為檢測及分析系統(tǒng)研究
發(fā)布時間:2021-11-27 02:07
隨著社會的高速發(fā)展,人們的生活節(jié)奏也日益加快,而高速的生活節(jié)奏極易引發(fā)一系列生理或心理上的問題。相比于有一定工作經(jīng)驗和生活閱歷的成年人而言,剛剛脫離親朋保護的大學(xué)生更容易產(chǎn)生問題,甚至出現(xiàn)退學(xué)乃至輕生等不可挽回的行為。隨著信息技術(shù)的推廣和應(yīng)用,以數(shù)據(jù)驅(qū)動為核心的異常檢測技術(shù)在學(xué)生心理健康教育領(lǐng)域也取得了一系列出色的成果。因此如何利用異常檢測技術(shù)來處理和分析校園中的學(xué)生數(shù)據(jù)以輔助高校進行管理是一個值得研究的問題。針對這個問題,本文提出一種以數(shù)據(jù)驅(qū)動的基于異常檢測技術(shù)的學(xué)生異常行為檢測及分析系統(tǒng),主要工作包括:(1)提出一種改進的孤立森林(Isolate Forest,iForest)和K-Means相結(jié)合的算法。改進的iForest算法主要針對傳統(tǒng)iForest算法中存在的分支過多和得分不一致的情況,更改了分支構(gòu)建過程。該方法首先使用改進的iForest算法對數(shù)據(jù)集篩選出一組異常候選,然后使用K-Means從異常候選中得出異常分類結(jié)果。(2)設(shè)計了一種基于無監(jiān)督異常檢測算法的學(xué)生異常行為檢測及分析系統(tǒng),該系統(tǒng)不僅具備學(xué)生心理測評的功能,還能夠基于改進的iForest算法對學(xué)生的異常行為進...
【文章來源】:南京信息工程大學(xué)江蘇省
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【部分圖文】:
ROC曲線示例圖
南京信息工程大學(xué)碩士學(xué)位論文都可以用 AUC 來衡量分類器的效果。不同點用了 Precision,因此 PR 曲線的兩個指標(biāo)都聚焦心正例,所以在此情況下 PR 曲線被廣泛認為優(yōu)代表 TPR,縱軸代表 Precision,如圖 2.3 為 PR 曲其對應(yīng)的分類器的分類性能也就越好。PR 曲線來量化度量分類器的分類效果,其取值范圍是[應(yīng)的分類器的分類性能也就越好。本文的實驗綜合評估各個模型的異常檢測評估性能。
常檢測為孤立樹的一個節(jié)點,它要么是沒有子節(jié)的內(nèi)部節(jié)點。每一步分割,都包含特征q數(shù)據(jù)分到rT 。1{ , , }n x x,特征的維度為d 。為了構(gòu)建割值p,遞歸地分割數(shù)據(jù)集 X ,直到滿(2)節(jié)點上只有一個樣本;(3)節(jié)點上的樣分步驟期間,新的候選點遍歷所有樹木,所示,每一個分支切口始終與坐標(biāo)軸平行用任何數(shù)據(jù)點的區(qū)域卻收到更多的分支
【參考文獻】:
期刊論文
[1]面向智慧校園的學(xué)生異常行為檢測[J]. 任孟其,宋汝鑫,王萌,邵子豪,趙國生. 哈爾濱師范大學(xué)自然科學(xué)學(xué)報. 2017(03)
[2]一種基于關(guān)聯(lián)信息熵度量的特征選擇方法[J]. 董紅斌,滕旭陽,楊雪. 計算機研究與發(fā)展. 2016(08)
[3]基于輪廓系數(shù)的聚類有效性分析[J]. 朱連江,馬炳先,趙學(xué)泉. 計算機應(yīng)用. 2010(S2)
碩士論文
[1]數(shù)據(jù)挖掘在高職學(xué)生心理健康管理系統(tǒng)中的應(yīng)用研究[D]. 陳婉.鄭州大學(xué) 2017
[2]基于k-means聚類算法的大學(xué)生心理管理系統(tǒng)研究[D]. 吳婷.湖北工業(yè)大學(xué) 2017
[3]基于機器學(xué)習(xí)和大數(shù)據(jù)技術(shù)的高校學(xué)生行為分析[D]. 鄧晗.北京郵電大學(xué) 2017
[4]基于SVM的滿意特征選擇及其在企業(yè)信用評估中的應(yīng)用[D]. 凌健.廈門大學(xué) 2007
[5]數(shù)據(jù)挖掘在大學(xué)生心理問題中的應(yīng)用研究[D]. 任麗君.華東師范大學(xué) 2006
本文編號:3521381
【文章來源】:南京信息工程大學(xué)江蘇省
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【部分圖文】:
ROC曲線示例圖
南京信息工程大學(xué)碩士學(xué)位論文都可以用 AUC 來衡量分類器的效果。不同點用了 Precision,因此 PR 曲線的兩個指標(biāo)都聚焦心正例,所以在此情況下 PR 曲線被廣泛認為優(yōu)代表 TPR,縱軸代表 Precision,如圖 2.3 為 PR 曲其對應(yīng)的分類器的分類性能也就越好。PR 曲線來量化度量分類器的分類效果,其取值范圍是[應(yīng)的分類器的分類性能也就越好。本文的實驗綜合評估各個模型的異常檢測評估性能。
常檢測為孤立樹的一個節(jié)點,它要么是沒有子節(jié)的內(nèi)部節(jié)點。每一步分割,都包含特征q數(shù)據(jù)分到rT 。1{ , , }n x x,特征的維度為d 。為了構(gòu)建割值p,遞歸地分割數(shù)據(jù)集 X ,直到滿(2)節(jié)點上只有一個樣本;(3)節(jié)點上的樣分步驟期間,新的候選點遍歷所有樹木,所示,每一個分支切口始終與坐標(biāo)軸平行用任何數(shù)據(jù)點的區(qū)域卻收到更多的分支
【參考文獻】:
期刊論文
[1]面向智慧校園的學(xué)生異常行為檢測[J]. 任孟其,宋汝鑫,王萌,邵子豪,趙國生. 哈爾濱師范大學(xué)自然科學(xué)學(xué)報. 2017(03)
[2]一種基于關(guān)聯(lián)信息熵度量的特征選擇方法[J]. 董紅斌,滕旭陽,楊雪. 計算機研究與發(fā)展. 2016(08)
[3]基于輪廓系數(shù)的聚類有效性分析[J]. 朱連江,馬炳先,趙學(xué)泉. 計算機應(yīng)用. 2010(S2)
碩士論文
[1]數(shù)據(jù)挖掘在高職學(xué)生心理健康管理系統(tǒng)中的應(yīng)用研究[D]. 陳婉.鄭州大學(xué) 2017
[2]基于k-means聚類算法的大學(xué)生心理管理系統(tǒng)研究[D]. 吳婷.湖北工業(yè)大學(xué) 2017
[3]基于機器學(xué)習(xí)和大數(shù)據(jù)技術(shù)的高校學(xué)生行為分析[D]. 鄧晗.北京郵電大學(xué) 2017
[4]基于SVM的滿意特征選擇及其在企業(yè)信用評估中的應(yīng)用[D]. 凌健.廈門大學(xué) 2007
[5]數(shù)據(jù)挖掘在大學(xué)生心理問題中的應(yīng)用研究[D]. 任麗君.華東師范大學(xué) 2006
本文編號:3521381
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3521381.html
最近更新
教材專著