天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 社科論文 > 軍事論文 >

面向單幅不確定大圖的頻繁模式挖掘技術(shù)研究

發(fā)布時(shí)間:2020-05-17 15:29
【摘要】:在軍事信息系統(tǒng)中,軍事情報(bào)分析與處理分系統(tǒng)占據(jù)重要地位。隨著各類情報(bào)獲取手段的演進(jìn),軍事情報(bào)數(shù)據(jù)呈現(xiàn)出異構(gòu)性和非結(jié)構(gòu)化等特點(diǎn),使得軍事情報(bào)分析與處理面臨極大的技術(shù)挑戰(zhàn)。海量文本情報(bào)分析是情報(bào)分析與處理中最重要和最基礎(chǔ)的組成部分。當(dāng)前,一種從整體上把握文本情報(bào)的有效手段是構(gòu)建以單個(gè)文本為節(jié)點(diǎn)、文本之間相互關(guān)系為聯(lián)系的文檔網(wǎng)絡(luò)圖,即單幅大圖(網(wǎng)絡(luò))數(shù)據(jù),并在此基礎(chǔ)上開展一系列分析研判。本文以文本情報(bào)分析為應(yīng)用背景研究單幅大圖(網(wǎng)絡(luò))上的數(shù)據(jù)挖掘問題。由于噪聲、測(cè)量誤差、保密性、不完整性等原因,不確定性在現(xiàn)實(shí)世界的數(shù)據(jù)中廣泛存在。作為一種具有廣泛建模能力的數(shù)據(jù)模型,圖數(shù)據(jù)中也存在著不確定性。除了前述的文檔網(wǎng)絡(luò)圖,生物信息學(xué)、社會(huì)網(wǎng)絡(luò)等領(lǐng)域中亦大量存在著不確定圖。因此,針對(duì)不確定圖的研究成為國(guó)內(nèi)外的熱點(diǎn)。本文使用不確定圖建模文本軍事情報(bào),并在此基礎(chǔ)上挖掘頻繁模式;目前在單幅不確定大圖上頻繁子圖挖掘的問題尚未見已公開的研究。首先,對(duì)單幅不確定大圖上子圖模式的支持度進(jìn)行了定義,據(jù)此提出了基于枚舉-評(píng)估的支持度評(píng)估方法。枚舉策略采用與確定圖挖掘時(shí)相同的方式,本文主要關(guān)注支持度評(píng)估過程。其次,通過證明在單幅不確定圖上期望支持度的計(jì)算是#-P難的,設(shè)計(jì)了一種具有精度保證的近似算法以滿足實(shí)際應(yīng)用需求。然后,為進(jìn)一步增強(qiáng)算法效率,提出了兩種優(yōu)化策略,一是考慮對(duì)樣本圖計(jì)算結(jié)果的重用,二是引入檢查點(diǎn)機(jī)制和基于結(jié)構(gòu)的上界,提前對(duì)不頻繁的分枝進(jìn)行剪枝。上述兩種優(yōu)化策略的應(yīng)用提升了挖掘性能。最后,在實(shí)際數(shù)據(jù)集上進(jìn)行的實(shí)驗(yàn)驗(yàn)證了該挖掘方法及優(yōu)化策略的實(shí)際可用性和有效性。為了進(jìn)一步評(píng)價(jià)所提技術(shù)的實(shí)際效用和意義,在真實(shí)文本情報(bào)數(shù)據(jù)上開展了應(yīng)用研究。對(duì)于采集的公開文本情報(bào)數(shù)據(jù),以文檔為節(jié)點(diǎn)、文檔間相似度為邊建立文檔關(guān)聯(lián)。使用LDA模型為節(jié)點(diǎn)附加標(biāo)簽,使用基于知識(shí)庫(kù)的算法衡量節(jié)點(diǎn)間相似度;當(dāng)相似度大于給定閾值時(shí),則連接一條邊,并以相似度值作為邊上的概率。最終建立文檔網(wǎng)絡(luò)圖,并用所提技術(shù)對(duì)其進(jìn)行挖掘。實(shí)驗(yàn)結(jié)果表明,發(fā)現(xiàn)的模式具有可解釋性,所提挖掘技術(shù)具有較好的實(shí)際應(yīng)用前景。
【圖文】:

優(yōu)化技術(shù),運(yùn)行時(shí)間


國(guó)防科學(xué)技術(shù)大學(xué)研究生院碩士學(xué)位論文5.3 評(píng)價(jià)優(yōu)化技術(shù)本節(jié)實(shí)驗(yàn)評(píng)價(jià)在近似框架下,所提優(yōu)化技術(shù)的效果。特別地,,我們比較了三個(gè)算法,為了表達(dá)清晰,分別表示為基本,+重用,+剪枝;荆夯镜幕诿商乜宸抡,挖掘單個(gè)不確定圖的近似算法,即在 3.3 節(jié)中提出的算法 1;+重用:在基本上應(yīng)用計(jì)算重用技術(shù),即 4.1 節(jié)所提,重用三種開銷;+剪枝:進(jìn)一步引入在 4.2 節(jié)提出的,基于檢查點(diǎn)機(jī)制的剪枝技術(shù),在+重用的基礎(chǔ)上,+剪枝包含所有提出的優(yōu)化策略。

優(yōu)化技術(shù),樣本量


(a)CIT 數(shù)據(jù)集 (b)COL 數(shù)據(jù)集圖 5-3 優(yōu)化技術(shù)樣本量對(duì)比進(jìn)一步鑒別剪枝技術(shù),我們研究總的樣本量。圖 5-3(a)和(b)描繪了在 CIT 和COL 上需要的總的樣本數(shù)量。重點(diǎn)需要觀察的是剪枝策略使得提前結(jié)束成為可能,使得需要更少的樣本。既然+重用并不考慮剪枝,那么其需要的樣本數(shù)量和基本是一樣的,因此我們忽略對(duì)其進(jìn)行比較。兩個(gè)圖都反映了剪枝規(guī)則很有效,減少了約1 1~4 3的樣本量。最終使得運(yùn)行速度加快?偟膩(lái)講,+重用相比基本體現(xiàn)了優(yōu)越性,而+剪枝比+重用更好。因此+剪枝作為最終的算法 fanta。接下來(lái),我們?cè)u(píng)價(jià)參數(shù)值變化對(duì)于 fanta 不確定性,及可擴(kuò)展性的影響。5.4 評(píng)價(jià)參數(shù)的影響除了 ,用戶定義的參數(shù) 與 也會(huì)影響算法性能。在本組實(shí)驗(yàn)中,我們衡量 與 的變化對(duì)算法效率的影響程度,其中 fanta 與基本進(jìn)行了比較與分析。我們
【學(xué)位授予單位】:國(guó)防科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:E11;TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 陳鳳娟;;概率代表頻繁模式挖掘[J];牡丹江師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2017年02期

2 陳鳳娟;;不確定數(shù)據(jù)的頻繁模式挖掘[J];白城師范學(xué)院學(xué)報(bào);2016年05期

3 石杰;;一種快速頻繁模式挖掘算法[J];煙臺(tái)大學(xué)學(xué)報(bào)(自然科學(xué)與工程版);2015年02期

4 張艷芳;過仕明;;基于分類頻繁模式挖掘的書目推薦策略與算法[J];情報(bào)科學(xué);2012年12期

5 張廣路;雷景生;;界標(biāo)窗口數(shù)據(jù)流頻繁模式挖掘特性[J];計(jì)算機(jī)工程與應(yīng)用;2011年10期

6 潘怡;杜紅燕;;概念格在頻繁模式挖掘中的應(yīng)用研究[J];湖南科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年02期

7 李群;;數(shù)據(jù)流的頻繁模式挖掘算法淺析[J];電腦知識(shí)與技術(shù);2008年S2期

8 戰(zhàn)立強(qiáng);劉大昕;;小波濾波在時(shí)間序列頻繁模式挖掘中的應(yīng)用[J];哈爾濱工程大學(xué)學(xué)報(bào);2008年01期

9 敖富江;顏躍進(jìn);黃健;黃柯棣;;數(shù)據(jù)流頻繁模式挖掘算法設(shè)計(jì)[J];計(jì)算機(jī)科學(xué);2008年03期

10 馬連燈;王占剛;;基于滑動(dòng)窗口模型的數(shù)據(jù)流加權(quán)頻繁模式挖掘算法[J];軟件工程;2016年10期

相關(guān)會(huì)議論文 前10條

1 侯俊杰;李春平;;一種基于內(nèi)存索引的頻繁模式挖掘算法[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2005年

2 袁晴晴;樓宇波;周皓峰;汪衛(wèi);施伯樂;;基于圖論的頻繁模式挖掘[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年

3 林景亮;董槐林;姜青山;吳書;;一種基于新增閾值的頻繁模式挖掘算法[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2006年

4 孟軍;姜軍曉;劉秋水;;基于滑動(dòng)窗口的流數(shù)據(jù)頻繁模式挖掘算法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

5 王聞;謝伙生;;基于FP樹和對(duì)稱矩陣的最大頻繁模式挖掘算法[A];第二十五屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(二)[C];2008年

6 韓蒙;張煒;李建中;;RAKING:一種高效的不確定圖K-極大頻繁模式挖掘算法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯一[C];2010年

7 馬秀莉;劉健;童云海;唐世渭;楊冬青;;基于模式索引樹的增量挖掘[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2003年

8 曾濤;向勇;包小源;劉胤田;蔣永光;;中醫(yī)古方挖掘:一種頻繁藥組發(fā)現(xiàn)與功效標(biāo)注算法[A];第二十五屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(一)[C];2008年

9 高晶;李建中;張兆功;;挖掘數(shù)值型數(shù)據(jù)流中的最大頻繁模式[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年

10 邱勇;蘭永杰;劉曉華;;高效FP-TREE創(chuàng)建算法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年

相關(guān)重要報(bào)紙文章 前1條

1 本報(bào)記者 姚琳;科學(xué)與追求相伴[N];廣西日?qǐng)?bào);2011年

相關(guān)博士學(xué)位論文 前10條

1 阮幼林;頻繁模式挖掘算法及在入侵檢測(cè)中的應(yīng)用研究[D];華中科技大學(xué);2004年

2 馬海兵;頻繁模式挖掘相關(guān)技術(shù)研究[D];復(fù)旦大學(xué);2005年

3 戰(zhàn)立強(qiáng);頻繁模式挖掘算法研究[D];哈爾濱工程大學(xué);2007年

4 貝毅君;XML數(shù)據(jù)頻繁模式挖掘技術(shù)研究[D];浙江大學(xué);2008年

5 林曉勇;頻繁模式挖掘和動(dòng)態(tài)維護(hù)的理論與方法研究[D];北京化工大學(xué);2008年

6 徐玉生;頻繁模式挖掘算法與剪枝策略研究[D];蘭州大學(xué);2008年

7 劉勇;頻繁模式挖掘相關(guān)技術(shù)研究[D];復(fù)旦大學(xué);2007年

8 王倩;基于位值壓縮存儲(chǔ)的頻繁模式挖掘方法及應(yīng)用研究[D];燕山大學(xué);2016年

9 于曉梅;面向不確定數(shù)據(jù)的頻繁模式挖掘方法研究[D];山東師范大學(xué);2016年

10 楊厚群;半結(jié)構(gòu)化數(shù)據(jù)頻繁模式挖掘相關(guān)技術(shù)研究[D];重慶大學(xué);2010年

相關(guān)碩士學(xué)位論文 前10條

1 陳一帆;面向單幅不確定大圖的頻繁模式挖掘技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2015年

2 付夕;大規(guī)模數(shù)據(jù)流的頻繁模式挖掘方法的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2018年

3 李杰;基于并行頻繁模式挖掘算法的博客推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2018年

4 袁二毛;生物序列近似頻繁模式挖掘研究[D];合肥工業(yè)大學(xué);2017年

5 高璐宇;基于頻繁模式挖掘算法的業(yè)務(wù)量預(yù)測(cè)研究[D];北京郵電大學(xué);2018年

6 鄭邦祺;基于時(shí)間序列的頻繁模式挖掘研究與應(yīng)用[D];電子科技大學(xué);2016年

7 劉金鳳;頻繁模式挖掘技術(shù)的研究及其在實(shí)時(shí)信號(hào)處理中的應(yīng)用[D];電子科技大學(xué);2016年

8 李寒;基于手機(jī)上下文的用戶頻繁模式挖掘技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2015年

9 王陽(yáng);頻繁模式挖掘技術(shù)及其在電信收入保障系統(tǒng)中的應(yīng)用研究[D];湖南大學(xué);2010年

10 杜叢強(qiáng);不確定數(shù)據(jù)流中頻繁模式挖掘算法的研究[D];山東師范大學(xué);2016年



本文編號(hào):2668776

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shekelunwen/renwuzj/2668776.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶646bb***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com