時(shí)間序列數(shù)據(jù)中相似子序列快速查詢技術(shù)研究
發(fā)布時(shí)間:2021-09-17 20:37
從序列數(shù)據(jù)集中查找趨勢相近的子序列是序列數(shù)據(jù)挖掘中一項(xiàng)關(guān)鍵技術(shù),該技術(shù)在金融、醫(yī)療、氣象、網(wǎng)絡(luò)安全等領(lǐng)域均有重要應(yīng)用。子序列查詢一般以動(dòng)態(tài)時(shí)間規(guī)整(Dynamic Time Warping,DTW)作為相似性度量算法,但是該相似性度量算法時(shí)間復(fù)雜度較高,因此查詢長子序列時(shí)難以實(shí)現(xiàn)在線查詢。時(shí)間序列表示方法通過降低序列的維度,可以有效減小查詢的時(shí)間開銷。因此,本文采用時(shí)間序列表示與相似性度量算法相結(jié)合的方法解決時(shí)間序列數(shù)據(jù)中相似子序列快速查詢的問題。具體研究內(nèi)容如下:(1)提出一種快速查詢長子序列算法MONEX(Modify ONline EXploration of time series)。首先,對(duì)數(shù)據(jù)集中特定長度下的所有子序列進(jìn)行分組,并對(duì)具有代表性的子序列進(jìn)行標(biāo)記;其次,在查詢過程中,將查詢序列切分成指定長度的若干短序列,并采用DTW算法確定與這些短序列相似的子序列候選集;最后,對(duì)候選集進(jìn)行序列拼接,獲取查詢結(jié)果序列。在真實(shí)數(shù)據(jù)集上的大量實(shí)驗(yàn)表明,本文提出的MONEX算法在效率上較最先進(jìn)的算法提升了近10倍。(2)子序列分組過程(即,時(shí)間序列表示過程),采用歐氏距離(Euclid...
【文章來源】:沈陽航空航天大學(xué)遼寧省
【文章頁數(shù)】:55 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1時(shí)間序列特征表示方法分類
兩個(gè)等長的時(shí)間序列1 2( , ,..., )nX x x x 和Y為:( ) ( )21EDni iiX,Y x y只需線性掃描就能完成計(jì)算過程,其算法求高效計(jì)算效率或者序列波動(dòng)范圍較小的,即使二者的變化趨勢十分相似,所求出的時(shí)間序列之間的距離時(shí),即使變化趨勢況的原因是歐氏距離在進(jìn)行距離度量計(jì)算離值進(jìn)行簡單的線性累加,而沒有事先將此,使用歐氏距離度量相似性時(shí)對(duì)數(shù)據(jù)有影響。如圖 2.1 所示,兩個(gè)時(shí)間序列在整拉伸,其中豎線連接的點(diǎn)是歐氏距離計(jì)算
圖 2.2 序列使用 DTW 距離匹配結(jié)果 中搜索到過多的無效路徑,規(guī)整路徑 W 需滿規(guī)整路徑必須是以1p (1,1)為起點(diǎn),以 ( Tp :給定規(guī)整路徑元素 ( ,)tp a b ,其相鄰元素 1,即規(guī)整路徑中的相鄰元素必須為矩陣中的對(duì)應(yīng)的匹配點(diǎn)。:給定規(guī)整路徑元素 ,其相元素即規(guī)整路徑形成時(shí)只能向上搜尋結(jié)果。DTW 距離即 DTW(X,Y),被定義為在所有可能)的權(quán)重。因此 X 和 Y 之間的 DTW 距離定義( )21DTW , ,tTi itX Y min w j歐氏距離或相關(guān)系數(shù)等方法,具有非常明顯的
【參考文獻(xiàn)】:
期刊論文
[1]金融數(shù)據(jù)時(shí)間序列相似性度量的應(yīng)用研究[J]. 肖娜,郝泳濤. 電腦知識(shí)與技術(shù). 2013(25)
[2]一種基于重要點(diǎn)的時(shí)間序列分割方法[J]. 廖俊,周中良,寇英信,羅寰. 計(jì)算機(jī)工程與應(yīng)用. 2011(24)
[3]基于斜率偏離的時(shí)間序列相似性搜索方法研究[J]. 梁建海,張建業(yè),楊峰,潘泉. 計(jì)算機(jī)應(yīng)用研究. 2010(01)
本文編號(hào):3399456
【文章來源】:沈陽航空航天大學(xué)遼寧省
【文章頁數(shù)】:55 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1時(shí)間序列特征表示方法分類
兩個(gè)等長的時(shí)間序列1 2( , ,..., )nX x x x 和Y為:( ) ( )21EDni iiX,Y x y只需線性掃描就能完成計(jì)算過程,其算法求高效計(jì)算效率或者序列波動(dòng)范圍較小的,即使二者的變化趨勢十分相似,所求出的時(shí)間序列之間的距離時(shí),即使變化趨勢況的原因是歐氏距離在進(jìn)行距離度量計(jì)算離值進(jìn)行簡單的線性累加,而沒有事先將此,使用歐氏距離度量相似性時(shí)對(duì)數(shù)據(jù)有影響。如圖 2.1 所示,兩個(gè)時(shí)間序列在整拉伸,其中豎線連接的點(diǎn)是歐氏距離計(jì)算
圖 2.2 序列使用 DTW 距離匹配結(jié)果 中搜索到過多的無效路徑,規(guī)整路徑 W 需滿規(guī)整路徑必須是以1p (1,1)為起點(diǎn),以 ( Tp :給定規(guī)整路徑元素 ( ,)tp a b ,其相鄰元素 1,即規(guī)整路徑中的相鄰元素必須為矩陣中的對(duì)應(yīng)的匹配點(diǎn)。:給定規(guī)整路徑元素 ,其相元素即規(guī)整路徑形成時(shí)只能向上搜尋結(jié)果。DTW 距離即 DTW(X,Y),被定義為在所有可能)的權(quán)重。因此 X 和 Y 之間的 DTW 距離定義( )21DTW , ,tTi itX Y min w j歐氏距離或相關(guān)系數(shù)等方法,具有非常明顯的
【參考文獻(xiàn)】:
期刊論文
[1]金融數(shù)據(jù)時(shí)間序列相似性度量的應(yīng)用研究[J]. 肖娜,郝泳濤. 電腦知識(shí)與技術(shù). 2013(25)
[2]一種基于重要點(diǎn)的時(shí)間序列分割方法[J]. 廖俊,周中良,寇英信,羅寰. 計(jì)算機(jī)工程與應(yīng)用. 2011(24)
[3]基于斜率偏離的時(shí)間序列相似性搜索方法研究[J]. 梁建海,張建業(yè),楊峰,潘泉. 計(jì)算機(jī)應(yīng)用研究. 2010(01)
本文編號(hào):3399456
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3399456.html
最近更新
教材專著