天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于演化算法的高效用項集挖掘算法研究

發(fā)布時間:2021-09-11 21:45
  高效用項集挖掘(Mining High Utility Itemsets,簡稱HUIM)是數(shù)據(jù)挖掘(Data Mining,簡稱DM)和知識發(fā)現(xiàn)(Knowledge Discovery in Database,簡稱KDD)領(lǐng)域的重要課題。當(dāng)數(shù)據(jù)集較大或者不同項的數(shù)量較多時,高效用項集挖掘就是一個NP問題。演化算法是經(jīng)常被用來解決NP問題的方法之一。最近,一些基于演化算法挖掘高效用項集的算法被提出,比如HUPEumu-GARM、HUIM-PSO等。這些算法在時間方面比傳統(tǒng)算法高效,但是需要多次遍歷數(shù)據(jù)集;此外只能挖掘到較少的高效用項集。為了解決以上問題,現(xiàn)提出以下幾個算法:1)提出了基于人工蜂群算法的高效用項集挖掘算法HUIM-ABC。運用人工蜂群算法(Artificial Bee Colony,簡稱ABC)挖掘高效用項集,運用位圖表示數(shù)據(jù)集;二進制向量表示蜜源、三種蜜蜂和項集;運用PBVC和DNSG策略加快算法運行,PBVC用于檢測項集是否合理,DNSG動態(tài)調(diào)整不合理項集。2)提出了基于生物啟發(fā)計算的高效用項集挖掘框架Bio-HUIF。該算法將數(shù)據(jù)集表示成位圖;個體用二進制向量來表示,... 

【文章來源】:北方工業(yè)大學(xué)北京市

【文章頁數(shù)】:75 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于演化算法的高效用項集挖掘算法研究



粒子,變異概率


P2?0?1?1?1?0?0?1?1?0?1?1?0?0?1?C2??圖2-1單點交叉??P1?丨1丨0?1丨0丨1?1丨〇|?|l|〇|l|l|〇?llol?Cl?? ̄— ̄ ̄? ̄ ̄??P2?0?1?1?1?0?0?1?0?1?1?0?1?0?1?C2??圖2-2雙點交叉??最簡單的交叉操作就是在染色體上隨機選擇交叉點,然后互換染色體片段。??具體的交叉操作如圖2-1和圖2-2所示。??2.2.6變異操作??變異操作主要是為了保持上一代到下一代的多樣性。變異改變?nèi)旧w上的一??個或者多個基因位。簡單的形式就是人為設(shè)定變異操作的變異概率。一般而言,??變異概率設(shè)置都比較小。如果變異的概率設(shè)置的太高,這個搜索的過程有可能退??化為隨機搜索。自適應(yīng)的變異率[37]比固定的變異概率表現(xiàn)要好。??nmax?_?pmin?R?i??^?=(/r?一」^^_xr)x?(2-12)??AT?R??最大變異概率??nmin??&?:最小變異概率??%?:迭代次數(shù)??r:時間或者迭代次數(shù)??及:排名總數(shù)??在算法HUPE_-GARM中,變異概率是隨著迭代次數(shù)的增加而減小的,并??且子代的變異概率是與適應(yīng)度相關(guān)的。最初,較大的變異概率是為了更加充分的??搜索解空間。子代的變異率與它的排名有關(guān)。排名高的個體相較于排名低的個體??變異率低。適應(yīng)度最高的個體可以達(dá)到最優(yōu)解。最小變異概率是為了限制群體的??11??

執(zhí)行時間,算法,集中比,閾值設(shè)置


因為基于演化算法挖掘HUI并不能確保在一定的迭代次數(shù)內(nèi)挖掘到所有的??高效項集,我們就需要對比不同算法挖掘到的HUIs個數(shù)。Two-Phase算法從4??個數(shù)據(jù)集中可以挖掘到所有的HUIs。圖3-2展示對比試驗結(jié)果。??正如圖3-2所示,HUIM-ABC算法在4個數(shù)據(jù)集中比其他三個基于演化算??法都可以挖掘到更多的HUIs。平均來看,HUIM-ABC算法分別在Chess、??Mushroom、Accident_10°/〇和?Connect?數(shù)據(jù)集中可以挖掘到所有?HUIs?的?91.34%,??87.10%,96.65%和91.59%。當(dāng)閾值設(shè)置較高時,例如,Chess數(shù)據(jù)集相對閾值??30.5%

【參考文獻(xiàn)】:
期刊論文
[1]利用三角模糊數(shù)的語言變量項集減項算法[J]. 陳宇,王娜,王晉東.  清華大學(xué)學(xué)報(自然科學(xué)版). 2017(08)
[2]基于經(jīng)驗Rademacher復(fù)雜度的頻繁項集發(fā)現(xiàn)隨機抽樣方法[J]. 葉嘉,趙成貴,吳紅剛.  中國管理信息化. 2017(07)
[3]基于Nodeset的最大頻繁項集挖掘算法[J]. 林晨,顧君忠.  計算機工程. 2016(12)
[4]基于云計算的最大頻繁項集挖掘算法[J]. 孫鶴旭,孫澤賢,林濤.  中南民族大學(xué)學(xué)報(自然科學(xué)版). 2016(03)
[5]滑動窗口下數(shù)據(jù)流完全加權(quán)最大頻繁項集挖掘[J]. 王少鵬,聞英友,趙宏.  東北大學(xué)學(xué)報(自然科學(xué)版). 2016(07)
[6]基于投影的高效用項集挖掘算法[J]. 王敬華,羅相洲,吳倩.  小型微型計算機系統(tǒng). 2016(06)
[7]基于間隔鏈表改進的頻繁項集挖掘算法[J]. 徐永秀,劉旭敏,徐維祥.  計算機應(yīng)用. 2016(04)
[8]基于開項集剪枝的常量條件函數(shù)依賴挖掘[J]. 周金陵,刁興春,曹建軍.  清華大學(xué)學(xué)報(自然科學(xué)版). 2016(03)
[9]基于最大頻繁項集挖掘的微博炒作群體發(fā)現(xiàn)方法[J]. 劉琰,張進,陳靜,尹美娟,張偉麗.  計算機工程與應(yīng)用. 2017(04)
[10]基于頻繁項集的海量短文本聚類與主題抽取[J]. 彭敏,黃佳佳,朱佳暉,黃濟民,劉紀(jì)平.  計算機研究與發(fā)展. 2015(09)



本文編號:3393775

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3393775.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8ab7f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com