基于增量式的時(shí)間序列分類算法研究
發(fā)布時(shí)間:2017-06-26 07:06
本文關(guān)鍵詞:基于增量式的時(shí)間序列分類算法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:近幾年來(lái),數(shù)據(jù)挖掘技術(shù)已經(jīng)應(yīng)用到很多研究領(lǐng)域中,挖掘的數(shù)據(jù)類型也越來(lái)越復(fù)雜.作為研究熱點(diǎn)之一的時(shí)間序列數(shù)據(jù)也得到越來(lái)越廣泛地關(guān)注,例如股票交易數(shù)據(jù)、醫(yī)學(xué)腦電波圖像、經(jīng)濟(jì)銷售預(yù)測(cè)、手寫字跡圖像以及人體姿勢(shì)分析等.所有這些數(shù)據(jù)都有一個(gè)共同的特征,即數(shù)據(jù)本身是順序相關(guān)的,且都是相同時(shí)間間隔內(nèi)獲取的實(shí)值型數(shù)據(jù),定義具有上述特征的數(shù)據(jù)為時(shí)間序列數(shù)據(jù).以上可以看出,使用一般的數(shù)據(jù)挖掘方法從時(shí)間序列數(shù)據(jù)中進(jìn)行知識(shí)學(xué)習(xí)是不適用的,并且隨著大數(shù)據(jù)理論的不斷發(fā)展以及數(shù)據(jù)特征的不斷更新變化,希望能夠增量式地處理數(shù)據(jù)以減小時(shí)間序列數(shù)據(jù)的處理時(shí)間以及對(duì)存儲(chǔ)空間的需求. 本文基于時(shí)間序列數(shù)據(jù)維度高、實(shí)值有序、數(shù)據(jù)間存在自相關(guān)性等特點(diǎn),對(duì)時(shí)間序列分類過(guò)程進(jìn)行了研究.論文綜述了時(shí)間序列數(shù)據(jù)的預(yù)處理過(guò)程、數(shù)據(jù)表示技術(shù)、相似性度量方法以及時(shí)間序列分類現(xiàn)狀等幾個(gè)方面的內(nèi)容.總結(jié)了當(dāng)前比較流行的時(shí)間序列分類方法的研究現(xiàn)狀,其中值得一提的是基于shapelet決策樹的時(shí)間序列分類以及基于shapelets轉(zhuǎn)化的時(shí)間序列分類.繼而,本文重點(diǎn)研究了基于增量式的時(shí)間序列分類算法. 首先,從圖像處理的角度出發(fā),提出了一種將圖片信息轉(zhuǎn)化為時(shí)間序列數(shù)據(jù)的方法——ITTS方法.正如植物圖片信息、手寫字跡、人體姿勢(shì)等圖像信息,肉眼直觀獲取到的信息不能直接應(yīng)用到時(shí)間序列分類方法中,那么本文提出的ITTS方法能夠從圖像中獲取所需要的時(shí)間序列數(shù)據(jù). 其次,提出了一種基于增量式?jīng)Q策樹的時(shí)間序列分類算法一—ISDTC算法.傳統(tǒng)的時(shí)間序列分類算法只能處理靜態(tài)數(shù)據(jù)集,本文在此基礎(chǔ)上提出的算法能夠增量式地處理數(shù)據(jù)集,其中ISDTC算法是基于增量式?jīng)Q策樹的時(shí)間序列分類過(guò)程.實(shí)驗(yàn)表明,本文提出的ISDTC算法最終構(gòu)建的決策樹與使用靜態(tài)數(shù)據(jù)集構(gòu)建的決策樹非常相似. 最后,提出了一種基于動(dòng)態(tài)發(fā)現(xiàn)shapelets的增量式時(shí)間序列分類算法——IPST算法.shapelets作為最能夠表示一條時(shí)間序列的子序列,隨著時(shí)間的推移,這個(gè)特征序列可能會(huì)動(dòng)態(tài)發(fā)生變化.基于這樣的思想,本文提出的IPST算法能夠較好地動(dòng)態(tài)發(fā)現(xiàn)當(dāng)前最優(yōu)的k個(gè)shapelets,從而提高時(shí)間序列分類的準(zhǔn)確度.
【關(guān)鍵詞】:時(shí)間序列 分類 圖像轉(zhuǎn)化 增量式學(xué)習(xí)
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP311.13;O211.61
【目錄】:
- 致謝5-6
- 摘要6-7
- ABSTRACT7-12
- 1 引言12-16
- 1.1 研究背景和意義12-14
- 1.2 本文工作安排14-15
- 1.3 本文組織結(jié)構(gòu)15-16
- 2 時(shí)間序列分類綜述16-29
- 2.1 預(yù)處理16
- 2.2 表示方法16-18
- 2.2.1 非數(shù)據(jù)自適應(yīng)方法17-18
- 2.2.2 數(shù)據(jù)自適應(yīng)方法18
- 2.2.3 基于模型的方法18
- 2.3 相似性度量18-23
- 2.3.1 基于形狀的度量20-21
- 2.3.2 基于編輯的度量21
- 2.3.3 基于特征的度量21-22
- 2.3.4 基于結(jié)構(gòu)的度量22-23
- 2.3.5 距離度量中的壓縮技術(shù)23
- 2.4 索引技術(shù)23-25
- 2.5 時(shí)間序列分類25-26
- 2.6 時(shí)間序列分類應(yīng)用26-28
- 2.7 本章總結(jié)28-29
- 3 時(shí)間序列分類前期準(zhǔn)備29-43
- 3.1 基本決策樹理論29-37
- 3.1.1 決策樹基本思想29-32
- 3.1.2 決策樹基本算法32-33
- 3.1.3 決策樹重要技術(shù)33-37
- 3.2 圖像轉(zhuǎn)化為時(shí)間序列37-39
- 3.2.1 圖像預(yù)處理階段37-38
- 3.2.2 圖像轉(zhuǎn)化為時(shí)間序列—ITTS方法38-39
- 3.3 相關(guān)工作及定義39-42
- 3.4 本章總結(jié)42-43
- 4 基于增量式?jīng)Q策樹的時(shí)間序列分類43-53
- 4.1 增量式過(guò)程的綜述43
- 4.2 基于決策樹的時(shí)間序列分類43-49
- 4.2.1 shapelet的提出44-47
- 4.2.2 基于決策樹的時(shí)間序列分類47-49
- 4.3 基于增量式?jīng)Q策樹的時(shí)間序列分類49-52
- 4.3.1 增量式?jīng)Q策樹理論49-50
- 4.3.2 基于增量式?jīng)Q策樹的時(shí)間序列分類50-52
- 4.4 本章總結(jié)52-53
- 5 基于shapelets的增量式時(shí)間序列分類53-58
- 5.1 基于shapelets的時(shí)間序列分類53-55
- 5.1.1 shapelets的提出53-55
- 5.1.2 shapelets與其他分類器的結(jié)合55
- 5.2 基于shapelets的增量式時(shí)序分類55-57
- 5.3 本章總結(jié)57-58
- 6 實(shí)驗(yàn)結(jié)果及分析58-70
- 6.1 圖像轉(zhuǎn)化為時(shí)間序列58-61
- 6.1.1 實(shí)驗(yàn)平臺(tái)和數(shù)據(jù)58-59
- 6.1.2 實(shí)驗(yàn)結(jié)果分析59-61
- 6.2 基于增量式?jīng)Q策樹的時(shí)間序列分類61-66
- 6.2.1 實(shí)驗(yàn)平臺(tái)和數(shù)據(jù)61-62
- 6.2.2 實(shí)驗(yàn)結(jié)果分析62-66
- 6.3 基于shapelets的增量式時(shí)間序列分類66-69
- 6.3.1 實(shí)驗(yàn)平臺(tái)和數(shù)據(jù)66
- 6.3.2 實(shí)驗(yàn)結(jié)果分析66-69
- 6.4 本章總結(jié)69-70
- 7 總結(jié)與展望70-71
- 參考文獻(xiàn)71-75
- 作者簡(jiǎn)歷及攻讀碩士學(xué)位期間取得的研究成果75-77
- 學(xué)位論文數(shù)據(jù)集7
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 尹阿東,宮雨,吳勝利,武森,高學(xué)東,李擁軍;增量決策樹算法及復(fù)雜度分析[J];北京科技大學(xué)學(xué)報(bào);2004年02期
2 孫寧;;基于數(shù)據(jù)挖掘的客戶關(guān)系管理問題的研究[J];科技和產(chǎn)業(yè);2011年06期
3 孫梅玉;唐漾;方建安;;An Improving Indexing Approach on Time Series Based on Minimum Bounding Rectangle[J];Journal of Donghua University(English Edition);2009年01期
4 陳敏雅;石蕾;;基于SVM多分類決策樹的研究綜述[J];電腦知識(shí)與技術(shù);2008年08期
5 李明哲;葉春明;;增量決策樹知識(shí)獲取[J];電腦知識(shí)與技術(shù);2009年23期
6 張安勤;葉文s
本文編號(hào):485210
本文鏈接:http://sikaile.net/kejilunwen/yysx/485210.html
最近更新
教材專著