天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于隨機森林的異常點檢測算法研究

發(fā)布時間:2021-06-17 03:22
  數(shù)據(jù)挖掘旨在發(fā)現(xiàn)數(shù)據(jù)中隱含知識或發(fā)現(xiàn)數(shù)據(jù)的未知模式,從數(shù)據(jù)集中找出異常點也是數(shù)據(jù)挖掘領域中的重要任務。異常點檢測作為數(shù)據(jù)挖掘的一種重要方法,在實際應用中發(fā)揮著重要作用,廣泛運用于金融反欺詐、設備故障檢測、網(wǎng)絡入侵、和醫(yī)療影像分析中。異常點檢測挖掘方法對提高工業(yè)生產(chǎn)效率、服務社會生活具有重要意義。現(xiàn)階段基于集成模型的異常點檢測是一個熱點研究課題,而隨機森林方法具有優(yōu)良的分類決策性能。本文以識別出異常點為目標,對隨機森林模型進行改進,提出基于隨機森林模型的異常點檢測算法,具體工作包括以下3個方面:1、提出一種基于模糊樹節(jié)點的隨機森林進行異常點檢測。首先在構(gòu)建隨機森林的分類決策樹過程中,把模糊方法引入到二叉決策樹的節(jié)點中,在節(jié)點中設計關于類別劃分的模糊區(qū)域,在模糊區(qū)域上設計正常與異常隸屬度函數(shù)。當某樣本經(jīng)過決策樹節(jié)點中的模糊區(qū)域時,進行樣本的正常與異常隸屬度計算;若該樣本的異常隸屬度大于正常隸屬度,則該樣本被判別為異常類;否則,該樣本進入決策樹的下層樹節(jié)點,若無下層節(jié)點則被判別為正常類。該樣本的最終類別由隨機森林算法中的投票步驟決定。實驗表明,該算法具有較好的異常點檢測性能。2、提出一種基于... 

【文章來源】:福建師范大學福建省

【文章頁數(shù)】:72 頁

【學位級別】:碩士

【部分圖文】:

基于隨機森林的異常點檢測算法研究


圖2-1兩層決策樹節(jié)點示意圖

隸屬度函數(shù),隸屬度,異常點


第二章基于模糊樹節(jié)點的隨機森林與異常點檢測-13-孩子節(jié)點。對某個樣本做異常點檢測時,在樹節(jié)點中比較其正常隸屬度與異常隸屬度的大小,若異常隸屬度大于正常隸屬度,則表示樣本落入異常區(qū)域,認為是異常點。正常類隸屬度函數(shù):()()1,211,11,21xaxbxaHAxaxbbxc(2-4)異常類隸屬度函數(shù):()()11,10,1,1xaxbxaeFAxaxbbxce(2-5)隸屬度函數(shù)中,引入?yún)?shù)對臨界點做微調(diào)整。例如,值域[10,20]是正常類數(shù)據(jù)范圍,對其構(gòu)建模糊區(qū)域,取1,得到隸屬度函數(shù)如圖2-2。圖2-2隸屬度函數(shù)Fig.2-2Membershipfunction

指標,異常點,評價標準,森林


第二章基于模糊樹節(jié)點的隨機森林與異常點檢測-19-實驗對于每個數(shù)據(jù)集,使用不同比例的異常點進行測試,采用F1指標作為評價標準。圖2-3比較了各個算法在四個數(shù)據(jù)集上的綜合性能。IrisSeedsWineDermatology圖2-3F1指標對比Fig.2-3F1indicatorcomparison由圖2-3可見,在Iris和Seeds兩個數(shù)據(jù)集上,新方法的綜合性能F1略低于


本文編號:3234361

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3234361.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7e444***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com