時序數(shù)據(jù)序列模式挖掘
本文關(guān)鍵詞:時序數(shù)據(jù)序列模式挖掘
更多相關(guān)文章: 遙測數(shù)據(jù) 特征表示 時間懲罰 全局平均序列 主旨模式挖掘 垂直數(shù)據(jù)表示 閉合模式挖掘
【摘要】:衛(wèi)星遙測數(shù)據(jù)中蘊含了豐富的客觀規(guī)律和知識,序列模式挖掘作為時間序列數(shù)據(jù)挖掘研究的一個重要分支,可為其提供有效的分析途徑。從中挖掘出的隱含有用的信息,可為在軌衛(wèi)星的安全管理與健康運行提供幫助。本文以某衛(wèi)星供配電系統(tǒng)240余萬行的電源數(shù)據(jù)為分析對象。在經(jīng)過野值剔除、參數(shù)選擇、周期分析之后,對5個具有代表性的遙測參數(shù)進行特征表示、主旨模式挖掘以及閉合模式挖掘。本文主要創(chuàng)新點如下:(1)針對現(xiàn)有分段線性表示方法中存在的壓縮效率低、過于細化某些尖端子序列等問題,提出了一種基于關(guān)鍵點的特征表示方法FR_KP。順序掃描整個序列,通過極值保持時間、變化幅度,以及轉(zhuǎn)折點前后線段的斜率差值來判斷是否為關(guān)鍵點。實驗表明,該方法能夠在實現(xiàn)高效壓縮的同時,準確不失真地刻畫原始序列的變化趨勢。(2)針對現(xiàn)有主旨模式挖掘方法中存在的問題,如難以在質(zhì)量與運行效率之間找到一個平衡點,匹配數(shù)較小的主旨序列容易被忽略等,提出了一種基于懲罰的全局平均序列主旨模式挖掘方法PGAS_Motifs。采用K-Means算法對子序列進行聚類,并將所有聚類中心作為不同的主旨模式輸出。針對聚類過程中的兩個關(guān)鍵問題:距離度量的選取、聚類中心的計算,分別提出了基于時間懲罰的動態(tài)時間彎曲距離PDTW以及基于PDTW的全局平均序列計算方法。PDTW在進行最短路徑計算時引入懲罰因子,解決了因錯誤匹配而帶來的距離失真問題;全局平均序列計算方法將同一簇中的所有序列作為一個整體進行考慮,避免了迭代過程中的誤差傳遞,并解決了因“過度擬合”而帶來的計算復(fù)雜度增加問題。實驗表明,該方法能夠成功提取出遙測數(shù)據(jù)中反映衛(wèi)星工作狀態(tài)的主旨模式序列;PDTW度量比DTW度量更加有效;全局平均序列計算方法與NLAAF相比,有更好的擬合效果。(3)針對傳統(tǒng)頻繁模式挖掘中存在的結(jié)果集合冗余且有效模式難以發(fā)現(xiàn),以及現(xiàn)有以模式增長為基礎(chǔ)的閉合模式挖掘方法效率低下等問題,提出了一種將垂直數(shù)據(jù)表示與啟發(fā)式剪枝策略相結(jié)合的閉合模式挖掘方法Clo PMVP。在閉合模式挖掘的過程中,引入SPADE算法中的垂直數(shù)據(jù)表示方法,在計算序列支持度時只需要進行簡單交集操作,從而提高了計算效率;在進行序列模式擴展時,利用Clo Span算法中的回溯子模式和回溯超模式進行有效剪枝,來減小搜索空間。實驗表明,當(dāng)序列集合的平均序列長度較長或支持度較小時,挖掘效率較Clo Span算法有了明顯的提升;此外,挖掘得到的閉合序列集合與SPADE算法的頻繁序列集合相比,更加緊湊,有效信息更容易被發(fā)現(xiàn)。
【關(guān)鍵詞】:遙測數(shù)據(jù) 特征表示 時間懲罰 全局平均序列 主旨模式挖掘 垂直數(shù)據(jù)表示 閉合模式挖掘
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP311.13
【目錄】:
- 摘要4-5
- ABSTRACT5-12
- 注釋表12-13
- 第一章 緒論13-20
- 1.1 研究背景及意義13
- 1.2 國內(nèi)外研究現(xiàn)狀13-17
- 1.2.1 遙測數(shù)據(jù)分析技術(shù)的研究現(xiàn)狀14-15
- 1.2.2 時序數(shù)據(jù)序列模式挖掘的研究現(xiàn)狀15-17
- 1.3 本文研究內(nèi)容及組織結(jié)構(gòu)17-20
- 第二章 時序數(shù)據(jù)序列模式挖掘相關(guān)技術(shù)20-34
- 2.1 特征表示20-24
- 2.1.1 頻域表示方法20-21
- 2.1.2 符號化表示方法21
- 2.1.3 奇異值分解表示法21-22
- 2.1.4 分段線性表示法22-24
- 2.2 主旨模式挖掘24-28
- 2.2.1 基本概念及定義24-26
- 2.2.2 EMMA算法26-28
- 2.3 閉合模式挖掘28-32
- 2.3.1 基本概念及定義28-29
- 2.3.2 Prefix Span算法29-31
- 2.3.3 Clo Span算法31-32
- 2.4 本章小結(jié)32-34
- 第三章 遙測數(shù)據(jù)特征分析及預(yù)處理34-47
- 3.1 遙測數(shù)據(jù)特性描述34-35
- 3.2 數(shù)據(jù)清洗35-37
- 3.3 遙測參數(shù)的選擇37-38
- 3.3.1 基本原理37-38
- 3.3.2 實驗分析38
- 3.4 周期分析38-41
- 3.4.1 基本原理39-40
- 3.4.2 實驗分析40-41
- 3.5 基于關(guān)鍵點的特征表示方法41-46
- 3.5.1 基本原理41-42
- 3.5.2 實驗分析42-46
- 3.6 本章小結(jié)46-47
- 第四章 遙測數(shù)據(jù)主旨模式挖掘算法研究47-65
- 4.1 相似性度量方法研究47-52
- 4.1.1 動態(tài)時間彎曲距離(DTW)48-49
- 4.1.2 問題的提出49-51
- 4.1.3 基于時間懲罰的DTW相似性度量方法51-52
- 4.2 平均序列計算方法研究52-55
- 4.2.1 DTW空間下的平均序列52-53
- 4.2.2 問題的提出53-54
- 4.2.3 基于PDTW的全局平均序列計算方法54-55
- 4.3 PGAS_Motifs算法描述55-58
- 4.4 實驗分析58-63
- 4.4.1 實驗結(jié)果58-60
- 4.4.2 結(jié)果分析60-63
- 4.5 本章小結(jié)63-65
- 第五章 遙測數(shù)據(jù)閉合模式挖掘算法研究65-80
- 5.1 參數(shù)離散化方法研究66-68
- 5.1.1 問題的提出66
- 5.1.2 基于聚類的離散化方法66-67
- 5.1.3 Clus Partion算法描述67-68
- 5.2 閉合模式挖掘方法研究68-75
- 5.2.1 問題描述及相關(guān)定義68-70
- 5.2.2 垂直數(shù)據(jù)表示70-71
- 5.2.3 有效閉合模式挖掘算法Clo PMVP71-72
- 5.2.4 Clo PMVP算法描述72-75
- 5.3 實驗分析75-78
- 5.3.1 實驗結(jié)果75-77
- 5.3.2 結(jié)果分析77-78
- 5.4 本章小結(jié)78-80
- 第六章 總結(jié)與展望80-82
- 6.1 本文總結(jié)80-81
- 6.2 展望81-82
- 參考文獻82-87
- 致謝87-88
- 在學(xué)期間的研究成果及發(fā)表的學(xué)術(shù)論文88
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 張長海;胡孔法;陳凌;;序列模式挖掘算法綜述[J];揚州大學(xué)學(xué)報(自然科學(xué)版);2007年01期
2 肖哲;任勝兵;;序列模式挖掘研究進展[J];科技信息(科學(xué)教研);2007年36期
3 陳卓;楊炳儒;宋威;宋澤鋒;;序列模式挖掘綜述[J];計算機應(yīng)用研究;2008年07期
4 王虎;丁世飛;;序列模式挖掘研究與發(fā)展[J];計算機科學(xué);2009年12期
5 陳曉;;一種模糊序列模式挖掘的有效方法[J];現(xiàn)代計算機(專業(yè)版);2010年13期
6 李乃乾;姚新會;田東平;;多時間粒度序列模式挖掘[J];小型微型計算機系統(tǒng);2011年01期
7 吳孔玲;繆裕青;蘇杰;張曉華;;序列模式挖掘研究[J];計算機系統(tǒng)應(yīng)用;2012年06期
8 聶成林,王浩,胡學(xué)鋼;基于概念格的序列模式挖掘[J];計算機工程;2003年20期
9 龔惠群,黃超,彭江平;具有雙時間維約束的股票序列模式挖掘[J];計算機工程;2003年20期
10 許兆新,郝燕玲;約束在序列模式挖掘中的應(yīng)用研究[J];計算機工程與應(yīng)用;2004年05期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 呂靜;陳未如;劉俊;Osei Adjei;;并發(fā)分支模式挖掘[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年
2 端義鋒;胡谷雨;丁力;;序列模式挖掘在網(wǎng)絡(luò)告警分析中的應(yīng)用[A];2004年全國通信軟件學(xué)術(shù)會議論文集[C];2004年
3 朱輝生;李存華;;序列模式挖掘的研究與實現(xiàn)[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年
4 程銀波;司菁菁;;帶有間隔約束的序列模式挖掘算法[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
5 李潤恒;賈焰;金鑫;;一種面向網(wǎng)絡(luò)安全的序列模式挖掘方法[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(二)[C];2008年
6 李晟;姜青山;郭順;王備戰(zhàn);;一種優(yōu)化的蛋白質(zhì)序列模式挖掘方法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
7 姚偉力;王錫祿;宋俊德;;基于序列模式挖掘的告警相關(guān)性分析算法[A];2005年信息與通信領(lǐng)域博士后學(xué)術(shù)會議論文集[C];2005年
8 任家東;解玉潔;何海濤;張愛國;;基于改進前綴樹PStree的最大序列模式挖掘[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年
9 牛興雯;楊冬青;唐世渭;王騰蛟;;OSAF-tree——可迭代的移動序列模式挖掘及增量更新方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年
10 張銳;熊峗;陳越;朱揚勇;;MS-BioSM:一個基于多支持度生物序列模式挖掘算法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 金陽;基于概念格模型的序列模式挖掘算法研究[D];吉林大學(xué);2007年
2 謝飛;帶有通配符的序列模式挖掘研究[D];合肥工業(yè)大學(xué);2011年
3 熊峗;生物序列模式挖掘與聚類研究[D];復(fù)旦大學(xué);2007年
4 楊鈐雯;序列模式挖掘方法及Web使用挖掘研究[D];天津大學(xué);2010年
5 陸介平;描述性規(guī)則挖掘若干關(guān)鍵技術(shù)研究[D];東南大學(xué);2006年
6 葉紅云;面向金融營銷問題的個性化推薦方法研究[D];合肥工業(yè)大學(xué);2011年
7 徐前方;基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)故障告警相關(guān)性研究[D];北京郵電大學(xué);2007年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張長海;分布式序列模式挖掘算法研究[D];揚州大學(xué);2008年
2 陳曉;基于模糊集的序列模式挖掘研究[D];天津大學(xué);2007年
3 俞單慶;序列模式挖掘及其在入侵檢測中的應(yīng)用研究[D];南京師范大學(xué);2008年
4 楊名時;加權(quán)負序列模式挖掘算法研究[D];齊魯工業(yè)大學(xué);2015年
5 周慧霞;回歸方法估算最長頻繁模式長度研究[D];河北工業(yè)大學(xué);2015年
6 馮建;基于命題邏輯的頻繁序列模式挖掘算法的研究[D];浙江工業(yè)大學(xué);2014年
7 廖清科;面向時間序列相似性的序列模式挖掘及應(yīng)用[D];重慶交通大學(xué);2015年
8 周坤;一般周期間隙約束的序列模式挖掘[D];河北工業(yè)大學(xué);2015年
9 向劍平;Web日志中序列模式挖掘算法的研究[D];重慶大學(xué);2015年
10 董鑫;時序數(shù)據(jù)序列模式挖掘[D];南京航空航天大學(xué);2015年
,本文編號:652709
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/652709.html