天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于關(guān)聯(lián)規(guī)則的并行優(yōu)化算法研究

發(fā)布時(shí)間:2019-09-07 13:07
【摘要】:在數(shù)據(jù)挖掘及其相關(guān)的應(yīng)用領(lǐng)域中,基于關(guān)聯(lián)規(guī)則的挖掘是一個(gè)重要的研究方向。然而當(dāng)前許多關(guān)聯(lián)規(guī)則挖掘的研究方法在處理不同的數(shù)據(jù)類型的數(shù)據(jù)集時(shí)并沒有挖掘出特別理想的挖掘結(jié)果,而且也沒有充分利用基于共享內(nèi)存的多核計(jì)算機(jī)的高效運(yùn)算能力來解決問題。因此,本文提出了一個(gè)新穎的發(fā)現(xiàn)頻繁項(xiàng)集的并行的關(guān)聯(lián)規(guī)則挖掘方法,來解決上述問題。本文提出的方法是基于共享內(nèi)存的方式并行挖掘頻繁項(xiàng)集,該方法集成了兩種關(guān)聯(lián)規(guī)則的挖掘策略,分別是水平化的挖掘策略和垂直化的挖掘策略。該方法會(huì)動(dòng)態(tài)選擇兩種挖掘策略中的最佳策略而應(yīng)用到數(shù)據(jù)集的每個(gè)子數(shù)據(jù)集中,從而高效地適應(yīng)數(shù)據(jù)的特征,并且無論數(shù)據(jù)集是稀疏的還是稠密的,該方法的運(yùn)行效率相比傳統(tǒng)的方法都更有優(yōu)勢(shì)。此外,本方法會(huì)盡量最小化并行過程中的同步開銷,而最大化數(shù)據(jù)分布的獨(dú)立性從而增強(qiáng)算法的可行性。本方法自身的結(jié)構(gòu)建立在基于多核的共享內(nèi)存架構(gòu)上,并且會(huì)采用動(dòng)態(tài)規(guī)劃引導(dǎo)自身去平衡數(shù)據(jù)的加載。實(shí)驗(yàn)結(jié)果表明,本文提出的方法要比傳統(tǒng)的并行關(guān)聯(lián)規(guī)則的挖掘方法運(yùn)行速度更快,消耗的內(nèi)存空間更少。
【圖文】:

多核,處理器,架構(gòu),集群化


3.1.1多核處理器架構(gòu)逡逑多核處理器是一種獨(dú)立的計(jì)算機(jī)組件,該組件由兩個(gè)或多個(gè)獨(dú)立的中央處理單元組逡逑成,而這些處理單元的物理結(jié)構(gòu)又是相同的。處理器架構(gòu)如圖3.1所示。起初處理器被逡逑設(shè)計(jì)為只擁有一個(gè)核心,然而不久,在2008年,由Intel和AMD兩家公司共同推出了逡逑商業(yè)化的多核處理器,,這使得多核處理器的普及稱為主流13?M2]。逡逑Thread邐Thread逡逑Chip逡逑Core邐Core逡逑邐I邐i邐逡逑Memory逡逑圖3.1多核處理器架構(gòu)模型逡逑多核處理器的計(jì)算機(jī)與之前的計(jì)算機(jī)集群或是SMP邋(對(duì)稱化的多核處理器)有著不逡逑同的規(guī)格:其內(nèi)存架構(gòu)不呈現(xiàn)集群化的分布而是呈現(xiàn)出共享式的分布。這一點(diǎn)與SMP逡逑17逡逑

實(shí)例數(shù)據(jù),策略,數(shù)據(jù)格式


表3.1實(shí)例數(shù)據(jù)集的Bit邋Vector構(gòu)造表逡逑TIP邐頻繁項(xiàng)集邐a邐b邐c邐d邐e逡逑1邐a,b,d邐1邐1邐0邐1邐_0_逡逑2邐b,c,d邐0邐1邐1邐1邐_0_逡逑3邐a,c,d,e邐1邐0邐1邐1邐1逡逑4邐a,邐d,邐e邐1邐0邐0邐1邐_1_逡逑5邐a,b,c邐1邐1邐1邐0邐_0_逡逑6邐a,b,邐c邐1邐1邐1邐0邐_0_逡逑_1_邐0邋0邋0邋0邋_0_逡逑8邐a,邐b,邐d邐1邐1邐0邐1邐_0_逡逑9邐a,b,邋c,e邐1邐1邐1邐0邐1逡逑ShaFEM算法對(duì)于頻繁模式的產(chǎn)生使用了兩種挖掘策略:其中FP-tree使用了基于水逡逑平的數(shù)據(jù)格式挖掘策略,而Bit-vector使用了基于垂直的數(shù)據(jù)格式挖掘策略。在挖掘頻逡逑
【學(xué)位授予單位】:哈爾濱工程大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP311.13

【參考文獻(xiàn)】

相關(guān)期刊論文 前8條

1 馮興杰,周諄;Apriori算法的改進(jìn)[J];計(jì)算機(jī)工程;2005年S1期

2 陳文慶,許棠;關(guān)聯(lián)規(guī)則挖掘Apriori算法的改進(jìn)與實(shí)現(xiàn)[J];微機(jī)發(fā)展;2005年08期

3 孟祥萍,王華金,王賢勇,任紀(jì)川,鞠傳香;基于改進(jìn)FP-樹的最大模式挖掘算法[J];計(jì)算機(jī)工程與應(yīng)用;2005年14期

4 楊君銳,趙群禮;基于FP-Tree的最大頻繁項(xiàng)目集更新挖掘算法[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年11期

5 朱紅蕾,李明;維護(hù)關(guān)聯(lián)規(guī)則的算法研究[J];蘭州理工大學(xué)學(xué)報(bào);2004年05期

6 李淑芝,鄭劍;一種基于Hash_tree的產(chǎn)生關(guān)聯(lián)規(guī)則的方法[J];南昌大學(xué)學(xué)報(bào)(理科版);2004年02期

7 陸楠,王U

本文編號(hào):2533035


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2533035.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶38e5d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com