時間序列數(shù)據(jù)相似性與聚合top-k查詢算法研究與應(yīng)用
本文關(guān)鍵詞:時間序列數(shù)據(jù)相似性與聚合top-k查詢算法研究與應(yīng)用,由筆耕文化傳播整理發(fā)布。
【摘要】:時間序列數(shù)據(jù)普遍存在于生活中各個方面的應(yīng)用領(lǐng)域中。一般的,時間序列數(shù)據(jù)是一個包含時間戳及數(shù)值的有序序列。近年來隨著傳感網(wǎng)絡(luò)等技術(shù)的發(fā)展,在金融、醫(yī)療、交通、環(huán)境監(jiān)測、數(shù)字文物保護(hù)等領(lǐng)域高速產(chǎn)生并累積了大量的時間序列數(shù)據(jù)。如何高效的對海量時間序列數(shù)據(jù)進(jìn)行挖掘和管理成為目前新的挑戰(zhàn)。本文針對海量時間序列數(shù)據(jù)查詢和管理方面存在的若干問題,研究了時間序列數(shù)據(jù)的相似性問題、聚合top-k查詢問題并實現(xiàn)了面向文物保護(hù)的時間序列數(shù)據(jù)的管理原型系統(tǒng)等。本文的具體工作如下:研究了時間序列數(shù)據(jù)相似性問題,提出了基于形狀信息的相似性度量方法——趨勢距離相似性度量,解決了時間序列數(shù)據(jù)中的多種形變及多尺度相似性定義導(dǎo)致的難以準(zhǔn)確判斷數(shù)據(jù)間的相似度的問題。本文首先對目前已有的時間序列數(shù)據(jù)相似性度量方法進(jìn)行了總結(jié)和分析,隨后提出了趨勢距離相似性度量方法并在多個數(shù)據(jù)集上進(jìn)行了實驗。研究了時間序列數(shù)據(jù)聚合top-k查詢問題,提出了I/0高效的查詢算法,解決了海量數(shù)據(jù)集上查詢速度慢的問題。目前已有的時間序列數(shù)據(jù)聚合top-k查詢算法的速度瓶頸在于查詢過程中訪問磁盤次數(shù)過多。為解決此問題,本文提出的算法引入新的索引結(jié)構(gòu)和剪枝策略,實驗結(jié)果表明該算法能有效降低查詢過程中訪問磁盤的次數(shù),提高查詢速度。設(shè)計并實現(xiàn)了面向文物保護(hù)的時間序列數(shù)據(jù)的管理原型系統(tǒng)。本系統(tǒng)包括時間序列數(shù)據(jù)流分析組件、歷史時間序列數(shù)據(jù)存儲管理組件及兩者之間的連接,加強(qiáng)了文物監(jiān)測現(xiàn)場的數(shù)據(jù)分析支持,更符合面向文物保護(hù)的時間序列數(shù)據(jù)管理需求。
【關(guān)鍵詞】:時間序列數(shù)據(jù) 相似性 聚合top-k 原型系統(tǒng)
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.13
【目錄】:
- 摘要4-5
- Abstract5-11
- 第1章 緒論11-20
- 1.1 研究背景11-12
- 1.2 研究現(xiàn)狀12-16
- 1.2.1 時間序列數(shù)據(jù)挖掘12-15
- 1.2.2 面向文物保護(hù)的時間序列數(shù)據(jù)存儲管理15-16
- 1.3 面臨的主要問題16-17
- 1.4 本文的研究內(nèi)容17-18
- 1.5 本文的組織結(jié)構(gòu)18-20
- 第2章 相關(guān)技術(shù)20-31
- 2.1 時間序列數(shù)據(jù)相似性度量20-23
- 2.2 時間序列數(shù)據(jù)聚合top-k查詢23-26
- 2.2.1 I/O高效算法模型23-24
- 2.2.2 移動小波樹索引24-26
- 2.3 時間序列數(shù)據(jù)存儲系統(tǒng)概述26-30
- 2.3.1 時間序列數(shù)據(jù)庫26-28
- 2.3.2 Elasticsearch概述28-30
- 2.4 本章小結(jié)30-31
- 第3章 基于形狀信息的相似性度量方法31-48
- 3.1 時間序列相似性問題分析31-33
- 3.2 問題定義及算法動機(jī)33-35
- 3.2.1 問題定義33-34
- 3.2.2 算法動機(jī)34-35
- 3.3 基于形狀信息的相似性度量35-41
- 3.3.1 時間序列數(shù)據(jù)預(yù)處理36
- 3.3.2 形狀信息提取模型36-40
- 3.3.3 趨勢距離函數(shù)40-41
- 3.4 實驗結(jié)果41-47
- 3.5 本章小結(jié)47-48
- 第4章 I/O高效的時間序列數(shù)據(jù)聚合top-k查詢48-72
- 4.1 時間序列數(shù)據(jù)聚合top-k問題分析48-49
- 4.2 問題定義及相關(guān)說明49-50
- 4.3 I/O高效的聚合top-k查詢算法50-67
- 4.4 實驗結(jié)果67-71
- 4.5 本章小結(jié)71-72
- 第5章 面向文物保護(hù)的時間序列數(shù)據(jù)管理原型系統(tǒng)72-81
- 5.1 建設(shè)需求72-73
- 5.2 系統(tǒng)建設(shè)目標(biāo)73
- 5.3 系統(tǒng)設(shè)計方案73-77
- 5.3.1 技術(shù)路線73-74
- 5.3.2 關(guān)鍵功能模塊設(shè)計74-77
- 5.4 系統(tǒng)實現(xiàn)77-80
- 5.5 本章小結(jié)80-81
- 第6章 總結(jié)與展望81-84
- 6.1 總結(jié)81-82
- 6.2 展望82-84
- 參考文獻(xiàn)84-88
- 攻讀碩士學(xué)位期間主要工作88-89
- 致謝89
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張麗紅;;查詢算法的優(yōu)化設(shè)計[J];職大學(xué)報;2009年02期
2 陳富強(qiáng);奚建清;;商覆蓋立方體中下掘與上卷操作的查詢算法設(shè)計[J];信息技術(shù);2011年04期
3 李英女,鄭國雄;鐵路客運信息查詢算法[J];鐵路計算機(jī)應(yīng)用;2000年02期
4 徐紅波;郝忠孝;;一種基于Z曲線近似k-最近對查詢算法[J];計算機(jī)研究與發(fā)展;2008年02期
5 劉平;陳旭燦;李思昆;;嵌入式空間數(shù)據(jù)庫綜合查詢算法[J];計算機(jī)工程;2008年17期
6 趙智慧;;基于對象方向方位的連續(xù)方向查詢算法[J];齊齊哈爾大學(xué)學(xué)報(自然科學(xué)版);2010年04期
7 徐紅波;韓啟龍;潘海為;;空間數(shù)據(jù)庫最優(yōu)位置查詢算法研究[J];計算機(jī)工程與應(yīng)用;2011年18期
8 杜左強(qiáng);基于對象的空間數(shù)據(jù)庫的方位查詢算法[J];信息技術(shù);2004年07期
9 徐紅波;郝忠孝;;一種采用Z曲線高維空間范圍查詢算法[J];小型微型計算機(jī)系統(tǒng);2009年10期
10 高靜波,李新友,唐澤圣,周曉輝;半動態(tài)矩形交查詢算法[J];軟件學(xué)報;1997年08期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 洪潤秋;金文;陳鋼;王能斌;;迭代查詢子查詢算法的研究[A];第十一屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1993年
2 常珂;劉辰;楊正球;;基于樹狀結(jié)構(gòu)的查詢算法的設(shè)計與實現(xiàn)[A];中國通信學(xué)會第六屆學(xué)術(shù)年會論文集(中)[C];2009年
3 孫煥良;劉江秀;許景科;;基于楔的時間序列流雙向封裝過濾查詢算法[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(二)[C];2008年
4 李江波;周強(qiáng);陳祖舜;;漢語詞典快速查詢算法研究[A];第二屆全國學(xué)生計算語言學(xué)研討會論文集[C];2004年
5 董科;王國仁;寧博;毛克明;趙相國;;基于壓縮葉子流的XML Twig查詢[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2006年
6 劉旭輝;馮建華;洪親;;一種支持更新的圖可達(dá)性查詢算法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2007年
7 劉怡;郝云飛;;一種有效的復(fù)調(diào)音樂查詢算法[A];第三屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2007)論文集[C];2007年
8 黃海;侯穎;朱圣平;;一種多維向量并行查詢算法[A];2010年全國開放式分布與并行計算機(jī)學(xué)術(shù)會議論文集[C];2010年
9 徐忠華;張剡;陳玲;柏文陽;;基于星型模型的輪廓連接查詢算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(A輯)[C];2009年
10 陳冬霞;吉根林;武志峰;;一種基于簽名的XML查詢算法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 徐紅波;基于空間填充曲線高維空間查詢算法研究[D];哈爾濱理工大學(xué);2010年
2 劉潤濤;基于序的空間數(shù)據(jù)索引及查詢算法研究[D];哈爾濱理工大學(xué);2009年
3 季長清;云計算環(huán)境下的大規(guī)?臻g近鄰查詢算法研究[D];大連海事大學(xué);2014年
4 鄒磊;圖數(shù)據(jù)庫中的子圖查詢算法研究[D];華中科技大學(xué);2009年
5 謝鯤;布魯姆過濾器查詢算法及其應(yīng)用研究[D];湖南大學(xué);2007年
6 劉艷;基于主存的高維空間連接及查詢算法研究[D];哈爾濱理工大學(xué);2011年
7 田小梅;多布魯姆過濾器查詢算法及其應(yīng)用研究[D];湖南大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 黃海龍;大規(guī)模圖的圖查詢算法研究[D];燕山大學(xué);2015年
2 李青;分布式計算環(huán)境下海量RDF數(shù)據(jù)的skyline查詢研究[D];鄭州大學(xué);2015年
3 鄧育;空間近似關(guān)鍵字反遠(yuǎn)鄰查詢方法研究[D];安徽工業(yè)大學(xué);2015年
4 于世龍;信息物理融合系統(tǒng)資源索引與查詢技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2013年
5 郭巖;實時數(shù)據(jù)流相似性查詢算法的研究[D];華北電力大學(xué);2015年
6 鐘麗娟;時間序列數(shù)據(jù)相似性與聚合top-k查詢算法研究與應(yīng)用[D];浙江大學(xué);2016年
7 龔翱;改進(jìn)的城市公交查詢算法研究[D];湖南大學(xué);2008年
8 郭聰敏;圖集的子圖查詢算法研究[D];燕山大學(xué);2012年
9 夏伯男;基于權(quán)值設(shè)定策略的公交查詢模型及實現(xiàn)研究[D];大連工業(yè)大學(xué);2010年
10 黃榮躍;連續(xù)K-支配SKYLINE查詢算法研究[D];蘇州大學(xué);2012年
本文關(guān)鍵詞:時間序列數(shù)據(jù)相似性與聚合top-k查詢算法研究與應(yīng)用,由筆耕文化傳播整理發(fā)布。
,本文編號:352804
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/352804.html