頻繁模式挖掘技術(shù)的研究及其在實時信號處理中的應(yīng)用
本文關(guān)鍵詞:頻繁模式挖掘技術(shù)的研究及其在實時信號處理中的應(yīng)用
更多相關(guān)文章: 頻繁模式 數(shù)據(jù)挖掘 數(shù)據(jù)流 滑動窗口
【摘要】:隨著信息技術(shù)在各領(lǐng)域的高速發(fā)展,頻繁模式挖掘技術(shù)在實際生活中得到了廣泛的應(yīng)用,如在生物學(xué)中用于疾病的預(yù)防和治療,金融行業(yè)則用于防止和規(guī)避金融風(fēng)險以及在軍事領(lǐng)域中的異常檢測等。對時序數(shù)據(jù)的挖掘分析已經(jīng)成為一個熱點研究問題。其中,實時數(shù)據(jù)的頻繁模式挖掘是基本問題之一,因此對數(shù)據(jù)流的頻繁模式挖掘方法的研究具有更高的挑戰(zhàn)意義。本文研究頻繁模式挖掘技術(shù)在實時信號數(shù)據(jù)中的應(yīng)用,希望通過挖掘?qū)崟r信號數(shù)據(jù)的頻繁模式提高雷達(dá)信號數(shù)據(jù)的質(zhì)量,發(fā)現(xiàn)入侵行為,為設(shè)備的故障診斷及輔助軍事偵察等提供可靠信息。基于時序數(shù)據(jù)的頻繁模式挖掘,本文對時序數(shù)據(jù)預(yù)處理的方法進行研究,并對已有的最大頻繁模式挖掘算法和閉頻繁模式挖掘算法進行了改進,主要工作包括:1.研究靜態(tài)數(shù)據(jù)集中的頻繁模式挖掘算法,在基于模式增長的Prefixspan算法上提出了一種改進的S-Prefixspan算法挖掘最大頻繁模式。該算法在Prefixspan算法的基礎(chǔ)上做了兩點改進:針對現(xiàn)存Prefixspan算法在挖掘的過程中需要掃描兩次數(shù)據(jù)庫以及會產(chǎn)生大量投影數(shù)據(jù)庫而消耗內(nèi)存,提出了一種基于位圖映射思想的鏈?zhǔn)酱鎯Y(jié)構(gòu),該數(shù)據(jù)結(jié)構(gòu)中存儲頻繁項在序列中的位置,通過該數(shù)據(jù)結(jié)構(gòu)減少投影數(shù)據(jù)庫的構(gòu)建及一次掃描即可,節(jié)省了內(nèi)存,提高了運行效率。同時,為了提高搜索的效率,在生成頻繁模式的過程中,通過有效的剪枝操作可以進一步提高查找的效率。2.研究數(shù)據(jù)流中的頻繁模式挖掘算法,在Moment算法的基礎(chǔ)上提出了一種改進的OS-Moment算法挖掘閉頻繁模式。改進的算法主要針對Moment算法在挖掘的過程中存在搜索空間比較大,中間無用結(jié)果比較多和只能挖掘無序序列等問題做相關(guān)的改進。改進的算法利用二進制位表示各個項便于計算項集的支持度數(shù),提高了運行效率;設(shè)計鏈?zhǔn)酱鎯Y(jié)構(gòu)維護項的序列信息有效的解決了原算法只能對無序序列挖掘的弊端;提出一種新的索引模式樹的存儲結(jié)構(gòu)來存儲閉頻繁項集加快了結(jié)果的查詢及結(jié)點信息的更新。同時,在挖掘過程中通過合理的剪枝策略,避免生成大量的無用結(jié)果,進一步提高了算法的運行效率。3.在雷達(dá)實時信號數(shù)據(jù)中對改進的算法分別做了相關(guān)實驗,分析改進算法在時間和空間上效率的提升。
【關(guān)鍵詞】:頻繁模式 數(shù)據(jù)挖掘 數(shù)據(jù)流 滑動窗口
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.13;TN911.7
【目錄】:
- 摘要5-6
- ABSTRACT6-11
- 第一章 緒論11-15
- 1.1 研究背景及意義11-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-13
- 1.3 論文的主要研究內(nèi)容13
- 1.4 論文的組織結(jié)構(gòu)13-15
- 第二章 頻繁模式挖掘相關(guān)技術(shù)15-28
- 2.1 頻繁模式挖掘概述15
- 2.2 數(shù)據(jù)在預(yù)處理中的主要方法15-18
- 2.2.1 數(shù)據(jù)清理15-16
- 2.2.2 數(shù)據(jù)集成16
- 2.2.3 數(shù)據(jù)變換16-17
- 2.2.4 數(shù)據(jù)歸約17-18
- 2.3 靜態(tài)數(shù)據(jù)集中頻繁模式挖掘18-23
- 2.3.1 基于候選集的挖掘算法18-19
- 2.3.2 基于模式增長的挖掘算法19-20
- 2.3.3 基于位圖的挖掘算法20-23
- 2.4 數(shù)據(jù)流中頻繁模式挖掘23-27
- 2.4.1 基于界標(biāo)時間窗模型的算法25
- 2.4.2 基于滑動時間窗模型的算法25-27
- 2.5 本章小結(jié)27-28
- 第三章 基于位圖的最大頻繁模式挖掘算法28-41
- 3.1 位圖的表示方法28-31
- 3.1.1 時序數(shù)據(jù)的位圖表示28-30
- 3.1.2 位圖的鏈?zhǔn)酱鎯Y(jié)構(gòu)30-31
- 3.2 基于位圖的S-Prefixspan算法31-38
- 3.2.1 數(shù)據(jù)噪聲去除32-33
- 3.2.2 數(shù)據(jù)分塊33-34
- 3.2.3 位圖映射34-35
- 3.2.4 頻繁模式挖掘35-37
- 3.2.5 算法偽代碼37-38
- 3.3 性能分析38-40
- 3.3.1 時間效率對比分析38-39
- 3.3.2 空間效率對比分析39-40
- 3.4 本章小結(jié)40-41
- 第四章 基于滑動窗口閉頻繁模式挖掘算法41-51
- 4.1 滑動窗口的閉頻繁模式挖掘41-43
- 4.1.1 相關(guān)定義及概念41
- 4.1.2 滑動窗口模型41-42
- 4.1.3 閉頻繁模式挖掘方法42-43
- 4.2 基于滑動窗口的OS-Moment算法43-49
- 4.2.1 基于索引樹的數(shù)據(jù)存儲模型44-47
- 4.2.2 頻繁模式支持度的計算47
- 4.2.3 索引樹的數(shù)據(jù)更新47-49
- 4.3 性能分析49-50
- 4.3.1 時間效率對比分析49-50
- 4.3.2 空間效率對比分析50
- 4.4 本章小結(jié)50-51
- 第五章 算法測試與實驗對比51-63
- 5.1 數(shù)據(jù)預(yù)處理的仿真實驗51-56
- 5.1.1 雷達(dá)信號原始數(shù)據(jù)51-52
- 5.1.2 噪聲處理52-54
- 5.1.3 數(shù)據(jù)分塊54-56
- 5.2 最大頻繁模式挖掘?qū)嶒瀸Ρ?/span>56-59
- 5.2.1 雷達(dá)數(shù)據(jù)挖掘結(jié)果56-58
- 5.2.2 實驗對比58-59
- 5.3 閉頻繁項集模式挖掘?qū)嶒瀸Ρ?/span>59-62
- 5.3.1 雷達(dá)數(shù)據(jù)挖掘結(jié)果59-61
- 5.3.2 實驗對比61-62
- 5.4 本章小結(jié)62-63
- 第六章 總結(jié)與展望63-65
- 6.1 全文總結(jié)63
- 6.2 后續(xù)工作展望63-65
- 致謝65-66
- 參考文獻(xiàn)66-70
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 吳孔玲;繆裕青;蘇杰;張曉華;;序列模式挖掘研究[J];計算機系統(tǒng)應(yīng)用;2012年06期
2 劉步中;;基于頻繁項集挖掘算法的改進與研究[J];計算機應(yīng)用研究;2012年02期
3 單顯明;;基于數(shù)據(jù)挖掘技術(shù)的炮兵雷達(dá)故障診斷[J];火控雷達(dá)技術(shù);2011年03期
4 陳景強;翁正秋;;一種基于投影數(shù)據(jù)庫的SPAM算法[J];電腦知識與技術(shù);2010年07期
5 李甲林;;Web日志挖掘中的數(shù)據(jù)預(yù)處理技術(shù)研究與實現(xiàn)[J];電腦知識與技術(shù);2009年14期
6 趙峰;李慶華;金莉;;多維流序列并行預(yù)測算法研究[J];小型微型計算機系統(tǒng);2007年02期
7 劉立軍;崔杰;梅紅巖;;GSP與PrefixSpan算法的比較與分析[J];遼寧工學(xué)院學(xué)報;2006年05期
8 潘云鶴;王金龍;徐從富;;數(shù)據(jù)流頻繁模式挖掘研究進展[J];自動化學(xué)報;2006年04期
9 夏明波;王曉川;孫永強;金士堯;;序列模式挖掘算法研究[J];計算機技術(shù)與發(fā)展;2006年04期
10 張昕;李曉光;王大玲;于戈;;數(shù)據(jù)流中一種快速啟發(fā)式頻繁模式挖掘方法[J];軟件學(xué)報;2005年12期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 童詠昕;張媛媛;袁玫;馬世龍;于丹;趙莉;;一種挖掘壓縮序列模式的有效算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(A輯)[C];2009年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 劉云霞;數(shù)據(jù)歸約的統(tǒng)計方法研究及應(yīng)用[D];廈門大學(xué);2007年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 趙利;基于RFID中間件的海量數(shù)據(jù)集成技術(shù)及其在現(xiàn)代物流決策分析中應(yīng)用研究[D];揚州大學(xué);2012年
2 黃威;數(shù)據(jù)流的頻繁模式挖掘算法研究[D];西安科技大學(xué);2010年
3 汪志貞;數(shù)據(jù)挖掘技術(shù)在短時交通流預(yù)測上的應(yīng)用研究[D];西安電子科技大學(xué);2010年
4 顧銳;數(shù)據(jù)挖掘技術(shù)在雷達(dá)數(shù)據(jù)處理中的應(yīng)用[D];南京理工大學(xué);2010年
本文關(guān)鍵詞:頻繁模式挖掘技術(shù)的研究及其在實時信號處理中的應(yīng)用
更多相關(guān)文章: 頻繁模式 數(shù)據(jù)挖掘 數(shù)據(jù)流 滑動窗口
,
本文編號:514932
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/514932.html