基于形態(tài)特征的時間序列相似性搜索研究
本文關(guān)鍵詞:基于形態(tài)特征的時間序列相似性搜索研究
更多相關(guān)文章: 時間序列 相似性搜索 形態(tài)特征 統(tǒng)計特征
【摘要】:如今,我們生活在一個復雜多變的數(shù)據(jù)時代,這些數(shù)據(jù)正源源不斷地產(chǎn)生于各個領(lǐng)域,并潛移默化的改變著我們的生活節(jié)奏和生活方式。在這些數(shù)據(jù)中,能夠給人們的生活帶來巨大影響的時間序列是一類重要的數(shù)據(jù),所以對其的分析變得十分重要。但由于高維和雜亂等因素的影響使得對時間序列的研究變得十分困難,為了找出序列中隱含的重要信息,研究人員開始運用數(shù)據(jù)挖掘的手段對時間序列進行探索研究。在時間序列數(shù)據(jù)挖掘算法中,時間序列相似性搜索占有重要地位,吸引了大多數(shù)學者的深入研究。隨著時間的推移,時間序列相似性搜索研究的方法和成果普遍應用于人們?nèi)粘I钪械母鱾領(lǐng)域,譬如:證券的投資與決策、地震勘探與預測、醫(yī)療保險等。在時間序列相似性搜索中,形態(tài)特征反映時間序列的主要特性,既能客觀的反映出序列的全部變化趨勢,又可以體現(xiàn)出細節(jié)變化特點。同時,基于形態(tài)特征的距離度量算法能夠很好地計算出序列間的形態(tài)差別,對時間序列相似性搜索技術(shù)的研究具有深遠影響。經(jīng)過閱讀和專研大量海內(nèi)外關(guān)于時間序列形態(tài)特征范疇內(nèi)的相關(guān)文獻,本文全面細致地概況了基于形態(tài)特征的時間序列相似性搜索算法的近況,并對其發(fā)展階段中的各個經(jīng)典算法進行了詳細的描述和分析,指出所存在問題,在此基礎(chǔ)上提出了相應的解決方法,本文主要研究工作包括:(1)將算術(shù)編碼技術(shù)應用到時間序列相似性搜索中,此方法首先運用關(guān)鍵點分段技術(shù)提取時間序列的均值和斜率等序列的特征信息,采取數(shù)字符號化方法得到能充分體現(xiàn)序列均值和斜率信息的符號序列;然后通過編碼技術(shù)將符號序列轉(zhuǎn)化為編碼序列,實現(xiàn)時間序列在概率區(qū)間上的模式表示;最后采用分層歐式距離算法進行相似性搜索,由粗到細進行篩選,從而達到序列整體趨勢匹配以及細節(jié)擬合的目標。(2)提出基于符號聚合近似(Symbolic Aggregate approximation,SAX)和角點彎曲值的復合搜索算法。該方法將時間序列進行角點分段并提取序列的角點彎曲度值和均值信息,利用二者組成二元組的形式對時間序列進行復合表示;在此基礎(chǔ)上,采用具有較高質(zhì)量的復合距離算法在時間序列集中進行相似性搜索,得到的結(jié)果集可以達到數(shù)值和形態(tài)兩方面都相似的目的。
【關(guān)鍵詞】:時間序列 相似性搜索 形態(tài)特征 統(tǒng)計特征
【學位授予單位】:蘭州理工大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP311.13;O211.61
【目錄】:
- 摘要7-8
- Abstract8-12
- 第1章 緒論12-25
- 1.1 課題研究背景與意義12-14
- 1.2 國內(nèi)外研究現(xiàn)狀14-23
- 1.2.1 時間序列數(shù)據(jù)挖掘的研究現(xiàn)狀14-17
- 1.2.2 基于形態(tài)特征的時間序列相似性搜索的現(xiàn)狀分析17-22
- 1.2.3 存在的問題22-23
- 1.3 本文主要工作23
- 1.4 本文內(nèi)容安排23-25
- 第2章 基于形態(tài)特征的時間序列相似性搜索相關(guān)技術(shù)及算法25-36
- 2.1 引言25
- 2.2 基于形態(tài)特征的時間序列模式表示25-30
- 2.2.1 模式表示的概述25-26
- 2.2.2 形態(tài)特征模式表示的主要方法26-30
- 2.3 基于形態(tài)特征的時間序列相似性度量30-35
- 2.3.1 Minkowski距離31-32
- 2.3.2 動態(tài)時間彎曲32-34
- 2.3.3 模式距離34-35
- 2.3.4 復合距離35
- 2.4 本章小結(jié)35-36
- 第3章 算術(shù)編碼技術(shù)在時間序列分層搜索上的應用36-45
- 3.1 引言36
- 3.2 相關(guān)理論及數(shù)據(jù)預處理36-38
- 3.2.1 數(shù)據(jù)規(guī)范化36-37
- 3.2.2 關(guān)鍵點分段與對等37-38
- 3.3 時間序列符號化與算術(shù)編碼算法38-42
- 3.3.1 均值和斜率符號化38
- 3.3.2 編碼38-40
- 3.3.3 相似性度量40-42
- 3.4 實驗仿真42-44
- 3.4.1 實驗數(shù)據(jù)42
- 3.4.2 相似性度量的比較42-44
- 3.5 結(jié)論44-45
- 第4章 基于角點彎曲度和均值的時間序列相似性匹配算法45-53
- 4.1 引言45
- 4.2 時間序列模式表示45-48
- 4.2.1 角點分段與對等46-47
- 4.2.2 符號化與角點表示47-48
- 4.2.3 復合表示48
- 4.3 相似性距離計算48-49
- 4.3.1 符號化距離和角點彎曲度距離48-49
- 4.3.2 復合距離49
- 4.4 實驗仿真49-52
- 4.4.1 實驗環(huán)境與實驗數(shù)據(jù)49-50
- 4.4.2 實驗與分析50-52
- 4.5 結(jié)論52-53
- 結(jié)論與展望53-55
- 參考文獻55-59
- 致謝59-60
- 附錄A 攻讀學位期間所發(fā)表的學術(shù)論文60
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 彭敏;方慧生;;酶功能分類與序列相似性研究進展[J];國外醫(yī)學.藥學分冊;2006年06期
2 杜云龍;;基于時間序列的數(shù)據(jù)相似性統(tǒng)計[J];內(nèi)蒙古電大學刊;2007年06期
3 楊敏,王志堅,尹燕敏;時間序列相似性搜索算法研究[J];山東師大學報(自然科學版);2001年04期
4 朱淵萍;;一種新的時間序列相似性模式發(fā)現(xiàn)算法[J];海南師范大學學報(自然科學版);2011年02期
5 李峰;;關(guān)于時間序列相似性問題中間隔因子討論[J];科技信息(科學教研);2007年14期
6 于海龍;肖云;艾靜;李霞;宮濱生;;毒蕈乙酰膽堿受體亞型關(guān)系的研究[J];遺傳;2007年10期
7 周勇;林旬;;時間序列相似性的圖形相似方法研究[J];統(tǒng)計與決策;2007年10期
8 鄭華;李煒;邱劍鋒;林晨;蔣阿芳;;基于時間序列相似性匹配算法的研究[J];井岡山大學學報(自然科學版);2010年03期
9 滕傳遠,吳紹熙;熱變性法測定紅色毛癬菌核中DNA鳥嘌呤加胞嘧啶含量的研究[J];中國醫(yī)學科學院學報;1989年04期
10 李梅;白鳳蘭;;基于DTW距離的DNA序列相似性分析[J];生物數(shù)學學報;2009年02期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 卓明;王麗珍;譚旭;;基于時間序列相似性搜索的預測算法[A];第十九屆全國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2002年
2 邱均平;王菲菲;;時間序列相似性查詢與索引方法研究[A];2009年中國索引學會年會暨學術(shù)研討會論文集[C];2009年
3 李鳳敏;李前忠;張俊萍;;基于離散增量和協(xié)變判別式識別小鼠蛋白質(zhì)亞細胞定位[A];第十一次中國生物物理學術(shù)大會暨第九屆全國會員代表大會摘要集[C];2009年
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 李俊奎;時間序列相似性問題研究[D];華中科技大學;2008年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 左芳;十二株放線菌系統(tǒng)發(fā)育的研究[D];河北大學;2007年
2 孫宏偉;基于DTW距離的時間序列相似性查詢和shapelets分類算法研究[D];太原理工大學;2016年
3 涂俐蘭;基于快速沃爾什變換的生物序列相似性比對[D];華中科技大學;2004年
4 陳偉;生物信息學中的序列相似性比對算法[D];中國海洋大學;2006年
5 李明亮;時間序列相似性聚類算法研究[D];湖南大學;2010年
6 王克龍;離散小波變換分析蛋白質(zhì)序列相似性[D];四川大學;2004年
7 劉芳;基于信息離散度的DNA序列相似性分析研究[D];湖南大學;2009年
8 孫達辰;基于DTW的時間序列相似性搜索的研究[D];大慶石油學院;2010年
9 杜洪波;時間序列相似性查詢及異常檢測算法的研究[D];沈陽工業(yè)大學;2008年
10 朱天;關(guān)于時間序列相似性及時序規(guī)則發(fā)現(xiàn)的研究[D];南昌大學;2007年
,本文編號:1041255
本文鏈接:http://sikaile.net/kejilunwen/yysx/1041255.html