基于數(shù)據(jù)訪問模式挖掘的磁盤數(shù)據(jù)預(yù)取技術(shù)研究
本文關(guān)鍵詞:基于數(shù)據(jù)訪問模式挖掘的磁盤數(shù)據(jù)預(yù)取技術(shù)研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:計算機(jī)系統(tǒng)計算單元與存儲單元的性能差距越來越大。存儲系統(tǒng)性能的優(yōu)化對文件系統(tǒng)乃至計算機(jī)的整體性能提高有非常重要的作用。數(shù)據(jù)預(yù)取技術(shù)是重要的優(yōu)化手段之一,它不僅用在CPU內(nèi)部預(yù)取指令與數(shù)據(jù),更是在數(shù)據(jù)存儲領(lǐng)域得到廣泛的研究與應(yīng)用。然而,大多數(shù)的緩存預(yù)取算法對應(yīng)用程序的訪問模式有較嚴(yán)格的前提或者假設(shè),使得算法只能優(yōu)化特定的一類應(yīng)用程序。本文試圖使用數(shù)據(jù)挖掘的手段從應(yīng)用程序的數(shù)據(jù)訪問歷史中找到其訪問模式,以此來幫助預(yù)取程序識別訪問模式,并做出正確的預(yù)取決策。我們的算法不對應(yīng)用程序做假設(shè),只依賴挖掘出來的訪問模式。本文在回顧了一些具有代表性的研究成果和Linux內(nèi)核所實現(xiàn)的預(yù)取算法的基礎(chǔ)上,提出了在系統(tǒng)更底層實施預(yù)取算法的構(gòu)想。本文提出了面向預(yù)測的關(guān)聯(lián)規(guī)則,討論了這種規(guī)則的約束條件以及區(qū)別于一般關(guān)聯(lián)規(guī)則的特點(diǎn),重點(diǎn)討論了時間約束條件對規(guī)則的挖掘和應(yīng)用方面的影響。并指出磁盤的數(shù)據(jù)訪問模式可以用這樣的關(guān)聯(lián)規(guī)則表示,同時它也能直接用于預(yù)取算法中對磁盤訪問的預(yù)測。在第三章中我們詳細(xì)討論了規(guī)則挖掘算法設(shè)計要點(diǎn)與優(yōu)化手段。為了達(dá)到預(yù)取程序所需的實時性,規(guī)則的匹配也要求具有較強(qiáng)的實時性。在第四章我們討論了基本的規(guī)則匹配算法以及實時性更佳的基于布隆過濾器的匹配算法。該方法可以避免幾乎全部的無效查詢。實驗表明,每次規(guī)則匹配中,該算法幾乎能保證一次查詢就匹配到規(guī)則數(shù)據(jù)庫中的結(jié)果。最后文章給出了一個模擬仿真實驗環(huán)境,在此環(huán)境中可以評估本文提出的挖掘、預(yù)取算法的性能指標(biāo)。為了能獲取任意真實應(yīng)用程序的磁盤訪問行為,本文還給出了一個在Linux內(nèi)核中實現(xiàn)的磁盤訪問記錄抓取程序。作者使用這個工具分別記錄下系統(tǒng)運(yùn)行OLTPBench程序和編譯一次Linux內(nèi)核時,發(fā)生的所有磁盤訪問記錄。連同另外一個公共數(shù)據(jù)集[54]測試了算法的可行性與性能指標(biāo)。實驗表明,預(yù)取算法能夠明顯提升應(yīng)用程序的響應(yīng)時間,并達(dá)到了良好的實時性。
【關(guān)鍵詞】:關(guān)聯(lián)規(guī)則 數(shù)據(jù)預(yù)取 存儲系統(tǒng)
【學(xué)位授予單位】:西南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP333.35;TP311.13
【目錄】:
- 摘要5-6
- Abstract6-7
- 第1章 緒論7-15
- 1.1 研究背景與意義7-9
- 1.2 國內(nèi)外研究狀況9-11
- 1.3 研究內(nèi)容11-12
- 1.4 論文組織結(jié)構(gòu)12-13
- 1.5 本章小結(jié)13-15
- 第2章 基礎(chǔ)預(yù)取技術(shù)原理與體系結(jié)構(gòu)15-23
- 2.1 引言15
- 2.2 預(yù)取技術(shù)原理15-16
- 2.3 內(nèi)存頁順序讀的預(yù)取技術(shù)16-20
- 2.3.1 虛擬文件系統(tǒng)層和塊數(shù)據(jù)層概覽16-19
- 2.3.2 VFS中的順序預(yù)取算法原理19-20
- 2.4 本章小結(jié)20-23
- 第3章 磁盤塊語義關(guān)聯(lián)信息的挖掘算法23-39
- 3.1 引言23
- 3.2 磁盤塊相關(guān)性23-25
- 3.3 使用統(tǒng)一編址的數(shù)據(jù)塊25-26
- 3.4 面向預(yù)測的關(guān)聯(lián)規(guī)則26-28
- 3.4.1 數(shù)據(jù)塊的關(guān)聯(lián)規(guī)則示例26-27
- 3.4.2 時間約束27-28
- 3.5 關(guān)聯(lián)規(guī)則的挖掘算法28-37
- 3.5.1 預(yù)處理28-29
- 3.5.2 挖掘單項目先導(dǎo)規(guī)則29
- 3.5.3 模式擴(kuò)展29-35
- 3.5.4 算法并行化35-37
- 3.6 總結(jié)37-39
- 第4章 基于關(guān)聯(lián)規(guī)則的預(yù)取39-47
- 4.1 匹配規(guī)則39-40
- 4.1.1 觀察窗口39-40
- 4.1.2 對規(guī)則庫的查詢40
- 4.2 基礎(chǔ)規(guī)則匹配方案40-41
- 4.3 改進(jìn)的規(guī)則匹配方案41-44
- 4.3.1 布隆過濾器41-43
- 4.3.2 基于布隆過濾器的規(guī)則匹配43-44
- 4.4 預(yù)取項目的選擇44-45
- 4.5 本章小結(jié)45-47
- 第5章 實驗評價47-55
- 5.1 實驗設(shè)置47-48
- 5.2 實驗數(shù)據(jù)48-50
- 5.2.1 數(shù)據(jù)集描述48
- 5.2.2 磁盤訪問記錄器48-50
- 5.3 實驗分析50-54
- 5.3.0 挖掘算法開銷50-51
- 5.3.1 挖掘算法命中率的比較51-52
- 5.3.2 規(guī)則匹配算法的查詢次數(shù)52-53
- 5.3.3 與其他預(yù)取的比較53-54
- 5.4 本章小結(jié)54-55
- 第6章 總結(jié)與展望55-57
- 6.1 工作總結(jié)55
- 6.2 展望55-57
- 參考文獻(xiàn)57-61
- 致謝61-62
- 研究生期間研究成果情況62
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李春潔;王銳;李美珊;韋韞韜;閆莉薔;;基于多項式回歸的預(yù)取技術(shù)的研究[J];現(xiàn)代電子技術(shù);2012年22期
2 于曉寒;盧秉亮;梅義搏;;位置相關(guān)信息服務(wù)中的一種數(shù)據(jù)預(yù)取方法[J];微處理機(jī);2014年01期
3 曹新平;劉美華;韓真;古志民;張建鑫;;預(yù)取技術(shù)研究進(jìn)展[J];計算機(jī)科學(xué);2003年08期
4 李娜;張利萍;王莉莉;曹新平;;基于主觀貝葉斯方法的數(shù)據(jù)預(yù)取技術(shù)[J];計算機(jī)應(yīng)用;2008年S1期
5 王盛明;盧秉亮;;位置相關(guān)信息服務(wù)中一種基于價值的數(shù)據(jù)預(yù)取方法[J];價值工程;2011年10期
6 張建勛;古志民;;幫助線程預(yù)取技術(shù)研究綜述[J];計算機(jī)科學(xué);2013年07期
7 戴東波,印鑒,梁華金;結(jié)合訪問序列和內(nèi)容挖掘的預(yù)取技術(shù)[J];計算機(jī)工程;2005年22期
8 張榮蕓;;淺析緩存預(yù)取技術(shù)[J];現(xiàn)代計算機(jī)(專業(yè)版);2011年13期
9 張霄宏;雒芬;賈宗璞;沈記全;;一種適用于Hadoop MapReduce環(huán)境的數(shù)據(jù)預(yù)取方法[J];西安電子科技大學(xué)學(xué)報;2014年02期
10 尹春天,古志民,廖祥文;基于搜索結(jié)果的預(yù)取技術(shù)研究[J];計算機(jī)應(yīng)用;2004年01期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 歐國東;潘國騰;羅莉;;兩階段數(shù)據(jù)預(yù)取線程評估方法[A];第十六屆計算機(jī)工程與工藝年會暨第二屆微處理器技術(shù)論壇論文集[C];2012年
2 歐國東;王永文;張民選;;基于線程的多路徑數(shù)據(jù)預(yù)取技術(shù)研究[A];2010年第16屆全國信息存儲技術(shù)大會(IST2010)論文集[C];2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 歐國東;基于線程的數(shù)據(jù)預(yù)取技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 姚南野;基于關(guān)聯(lián)分析的移動評教數(shù)據(jù)預(yù)取與緩存研究[D];華中師范大學(xué);2015年
2 朱凌宇;基于數(shù)據(jù)訪問模式挖掘的磁盤數(shù)據(jù)預(yù)取技術(shù)研究[D];西南大學(xué);2015年
3 辛愿;面向嵌入式系統(tǒng)的自調(diào)數(shù)據(jù)預(yù)取[D];浙江大學(xué);2013年
4 張百達(dá);一種軟硬結(jié)合的預(yù)取技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2008年
5 劉敬偉;時空結(jié)合的數(shù)據(jù)預(yù)取[D];浙江工業(yè)大學(xué);2011年
6 鄭長安;多應(yīng)用環(huán)境下自適應(yīng)預(yù)取策略研究[D];華中科技大學(xué);2011年
7 張美玲;增量預(yù)取技術(shù)在持久化框架中的研究與應(yīng)用[D];中國海洋大學(xué);2010年
8 王世克;基于數(shù)據(jù)挖掘的Web服務(wù)器預(yù)取技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2005年
9 宋冰;Web預(yù)取與緩存一體化模型研究[D];鄭州大學(xué);2006年
10 史海振;基于雙關(guān)聯(lián)圖的Web預(yù)取模型研究[D];鄭州大學(xué);2011年
本文關(guān)鍵詞:基于數(shù)據(jù)訪問模式挖掘的磁盤數(shù)據(jù)預(yù)取技術(shù)研究,由筆耕文化傳播整理發(fā)布。
本文編號:323668
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/323668.html