時間序列數(shù)據(jù)中相似子序列快速查詢技術研究
發(fā)布時間:2021-09-17 20:37
從序列數(shù)據(jù)集中查找趨勢相近的子序列是序列數(shù)據(jù)挖掘中一項關鍵技術,該技術在金融、醫(yī)療、氣象、網(wǎng)絡安全等領域均有重要應用。子序列查詢一般以動態(tài)時間規(guī)整(Dynamic Time Warping,DTW)作為相似性度量算法,但是該相似性度量算法時間復雜度較高,因此查詢長子序列時難以實現(xiàn)在線查詢。時間序列表示方法通過降低序列的維度,可以有效減小查詢的時間開銷。因此,本文采用時間序列表示與相似性度量算法相結合的方法解決時間序列數(shù)據(jù)中相似子序列快速查詢的問題。具體研究內容如下:(1)提出一種快速查詢長子序列算法MONEX(Modify ONline EXploration of time series)。首先,對數(shù)據(jù)集中特定長度下的所有子序列進行分組,并對具有代表性的子序列進行標記;其次,在查詢過程中,將查詢序列切分成指定長度的若干短序列,并采用DTW算法確定與這些短序列相似的子序列候選集;最后,對候選集進行序列拼接,獲取查詢結果序列。在真實數(shù)據(jù)集上的大量實驗表明,本文提出的MONEX算法在效率上較最先進的算法提升了近10倍。(2)子序列分組過程(即,時間序列表示過程),采用歐氏距離(Euclid...
【文章來源】:沈陽航空航天大學遼寧省
【文章頁數(shù)】:55 頁
【學位級別】:碩士
【部分圖文】:
圖1.1時間序列特征表示方法分類
兩個等長的時間序列1 2( , ,..., )nX x x x 和Y為:( ) ( )21EDni iiX,Y x y只需線性掃描就能完成計算過程,其算法求高效計算效率或者序列波動范圍較小的,即使二者的變化趨勢十分相似,所求出的時間序列之間的距離時,即使變化趨勢況的原因是歐氏距離在進行距離度量計算離值進行簡單的線性累加,而沒有事先將此,使用歐氏距離度量相似性時對數(shù)據(jù)有影響。如圖 2.1 所示,兩個時間序列在整拉伸,其中豎線連接的點是歐氏距離計算
圖 2.2 序列使用 DTW 距離匹配結果 中搜索到過多的無效路徑,規(guī)整路徑 W 需滿規(guī)整路徑必須是以1p (1,1)為起點,以 ( Tp :給定規(guī)整路徑元素 ( ,)tp a b ,其相鄰元素 1,即規(guī)整路徑中的相鄰元素必須為矩陣中的對應的匹配點。:給定規(guī)整路徑元素 ,其相元素即規(guī)整路徑形成時只能向上搜尋結果。DTW 距離即 DTW(X,Y),被定義為在所有可能)的權重。因此 X 和 Y 之間的 DTW 距離定義( )21DTW , ,tTi itX Y min w j歐氏距離或相關系數(shù)等方法,具有非常明顯的
【參考文獻】:
期刊論文
[1]金融數(shù)據(jù)時間序列相似性度量的應用研究[J]. 肖娜,郝泳濤. 電腦知識與技術. 2013(25)
[2]一種基于重要點的時間序列分割方法[J]. 廖俊,周中良,寇英信,羅寰. 計算機工程與應用. 2011(24)
[3]基于斜率偏離的時間序列相似性搜索方法研究[J]. 梁建海,張建業(yè),楊峰,潘泉. 計算機應用研究. 2010(01)
本文編號:3399456
【文章來源】:沈陽航空航天大學遼寧省
【文章頁數(shù)】:55 頁
【學位級別】:碩士
【部分圖文】:
圖1.1時間序列特征表示方法分類
兩個等長的時間序列1 2( , ,..., )nX x x x 和Y為:( ) ( )21EDni iiX,Y x y只需線性掃描就能完成計算過程,其算法求高效計算效率或者序列波動范圍較小的,即使二者的變化趨勢十分相似,所求出的時間序列之間的距離時,即使變化趨勢況的原因是歐氏距離在進行距離度量計算離值進行簡單的線性累加,而沒有事先將此,使用歐氏距離度量相似性時對數(shù)據(jù)有影響。如圖 2.1 所示,兩個時間序列在整拉伸,其中豎線連接的點是歐氏距離計算
圖 2.2 序列使用 DTW 距離匹配結果 中搜索到過多的無效路徑,規(guī)整路徑 W 需滿規(guī)整路徑必須是以1p (1,1)為起點,以 ( Tp :給定規(guī)整路徑元素 ( ,)tp a b ,其相鄰元素 1,即規(guī)整路徑中的相鄰元素必須為矩陣中的對應的匹配點。:給定規(guī)整路徑元素 ,其相元素即規(guī)整路徑形成時只能向上搜尋結果。DTW 距離即 DTW(X,Y),被定義為在所有可能)的權重。因此 X 和 Y 之間的 DTW 距離定義( )21DTW , ,tTi itX Y min w j歐氏距離或相關系數(shù)等方法,具有非常明顯的
【參考文獻】:
期刊論文
[1]金融數(shù)據(jù)時間序列相似性度量的應用研究[J]. 肖娜,郝泳濤. 電腦知識與技術. 2013(25)
[2]一種基于重要點的時間序列分割方法[J]. 廖俊,周中良,寇英信,羅寰. 計算機工程與應用. 2011(24)
[3]基于斜率偏離的時間序列相似性搜索方法研究[J]. 梁建海,張建業(yè),楊峰,潘泉. 計算機應用研究. 2010(01)
本文編號:3399456
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3399456.html
最近更新
教材專著