基于數(shù)據(jù)訪問模式挖掘的磁盤數(shù)據(jù)預取技術研究
本文關鍵詞:基于數(shù)據(jù)訪問模式挖掘的磁盤數(shù)據(jù)預取技術研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:計算機系統(tǒng)計算單元與存儲單元的性能差距越來越大。存儲系統(tǒng)性能的優(yōu)化對文件系統(tǒng)乃至計算機的整體性能提高有非常重要的作用。數(shù)據(jù)預取技術是重要的優(yōu)化手段之一,它不僅用在CPU內(nèi)部預取指令與數(shù)據(jù),更是在數(shù)據(jù)存儲領域得到廣泛的研究與應用。然而,大多數(shù)的緩存預取算法對應用程序的訪問模式有較嚴格的前提或者假設,使得算法只能優(yōu)化特定的一類應用程序。本文試圖使用數(shù)據(jù)挖掘的手段從應用程序的數(shù)據(jù)訪問歷史中找到其訪問模式,以此來幫助預取程序識別訪問模式,并做出正確的預取決策。我們的算法不對應用程序做假設,只依賴挖掘出來的訪問模式。本文在回顧了一些具有代表性的研究成果和Linux內(nèi)核所實現(xiàn)的預取算法的基礎上,提出了在系統(tǒng)更底層實施預取算法的構想。本文提出了面向預測的關聯(lián)規(guī)則,討論了這種規(guī)則的約束條件以及區(qū)別于一般關聯(lián)規(guī)則的特點,重點討論了時間約束條件對規(guī)則的挖掘和應用方面的影響。并指出磁盤的數(shù)據(jù)訪問模式可以用這樣的關聯(lián)規(guī)則表示,同時它也能直接用于預取算法中對磁盤訪問的預測。在第三章中我們詳細討論了規(guī)則挖掘算法設計要點與優(yōu)化手段。為了達到預取程序所需的實時性,規(guī)則的匹配也要求具有較強的實時性。在第四章我們討論了基本的規(guī)則匹配算法以及實時性更佳的基于布隆過濾器的匹配算法。該方法可以避免幾乎全部的無效查詢。實驗表明,每次規(guī)則匹配中,該算法幾乎能保證一次查詢就匹配到規(guī)則數(shù)據(jù)庫中的結果。最后文章給出了一個模擬仿真實驗環(huán)境,在此環(huán)境中可以評估本文提出的挖掘、預取算法的性能指標。為了能獲取任意真實應用程序的磁盤訪問行為,本文還給出了一個在Linux內(nèi)核中實現(xiàn)的磁盤訪問記錄抓取程序。作者使用這個工具分別記錄下系統(tǒng)運行OLTPBench程序和編譯一次Linux內(nèi)核時,發(fā)生的所有磁盤訪問記錄。連同另外一個公共數(shù)據(jù)集[54]測試了算法的可行性與性能指標。實驗表明,預取算法能夠明顯提升應用程序的響應時間,并達到了良好的實時性。
【關鍵詞】:關聯(lián)規(guī)則 數(shù)據(jù)預取 存儲系統(tǒng)
【學位授予單位】:西南大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP333.35;TP311.13
【目錄】:
- 摘要5-6
- Abstract6-7
- 第1章 緒論7-15
- 1.1 研究背景與意義7-9
- 1.2 國內(nèi)外研究狀況9-11
- 1.3 研究內(nèi)容11-12
- 1.4 論文組織結構12-13
- 1.5 本章小結13-15
- 第2章 基礎預取技術原理與體系結構15-23
- 2.1 引言15
- 2.2 預取技術原理15-16
- 2.3 內(nèi)存頁順序讀的預取技術16-20
- 2.3.1 虛擬文件系統(tǒng)層和塊數(shù)據(jù)層概覽16-19
- 2.3.2 VFS中的順序預取算法原理19-20
- 2.4 本章小結20-23
- 第3章 磁盤塊語義關聯(lián)信息的挖掘算法23-39
- 3.1 引言23
- 3.2 磁盤塊相關性23-25
- 3.3 使用統(tǒng)一編址的數(shù)據(jù)塊25-26
- 3.4 面向預測的關聯(lián)規(guī)則26-28
- 3.4.1 數(shù)據(jù)塊的關聯(lián)規(guī)則示例26-27
- 3.4.2 時間約束27-28
- 3.5 關聯(lián)規(guī)則的挖掘算法28-37
- 3.5.1 預處理28-29
- 3.5.2 挖掘單項目先導規(guī)則29
- 3.5.3 模式擴展29-35
- 3.5.4 算法并行化35-37
- 3.6 總結37-39
- 第4章 基于關聯(lián)規(guī)則的預取39-47
- 4.1 匹配規(guī)則39-40
- 4.1.1 觀察窗口39-40
- 4.1.2 對規(guī)則庫的查詢40
- 4.2 基礎規(guī)則匹配方案40-41
- 4.3 改進的規(guī)則匹配方案41-44
- 4.3.1 布隆過濾器41-43
- 4.3.2 基于布隆過濾器的規(guī)則匹配43-44
- 4.4 預取項目的選擇44-45
- 4.5 本章小結45-47
- 第5章 實驗評價47-55
- 5.1 實驗設置47-48
- 5.2 實驗數(shù)據(jù)48-50
- 5.2.1 數(shù)據(jù)集描述48
- 5.2.2 磁盤訪問記錄器48-50
- 5.3 實驗分析50-54
- 5.3.0 挖掘算法開銷50-51
- 5.3.1 挖掘算法命中率的比較51-52
- 5.3.2 規(guī)則匹配算法的查詢次數(shù)52-53
- 5.3.3 與其他預取的比較53-54
- 5.4 本章小結54-55
- 第6章 總結與展望55-57
- 6.1 工作總結55
- 6.2 展望55-57
- 參考文獻57-61
- 致謝61-62
- 研究生期間研究成果情況62
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 李春潔;王銳;李美珊;韋韞韜;閆莉薔;;基于多項式回歸的預取技術的研究[J];現(xiàn)代電子技術;2012年22期
2 于曉寒;盧秉亮;梅義搏;;位置相關信息服務中的一種數(shù)據(jù)預取方法[J];微處理機;2014年01期
3 曹新平;劉美華;韓真;古志民;張建鑫;;預取技術研究進展[J];計算機科學;2003年08期
4 李娜;張利萍;王莉莉;曹新平;;基于主觀貝葉斯方法的數(shù)據(jù)預取技術[J];計算機應用;2008年S1期
5 王盛明;盧秉亮;;位置相關信息服務中一種基于價值的數(shù)據(jù)預取方法[J];價值工程;2011年10期
6 張建勛;古志民;;幫助線程預取技術研究綜述[J];計算機科學;2013年07期
7 戴東波,印鑒,梁華金;結合訪問序列和內(nèi)容挖掘的預取技術[J];計算機工程;2005年22期
8 張榮蕓;;淺析緩存預取技術[J];現(xiàn)代計算機(專業(yè)版);2011年13期
9 張霄宏;雒芬;賈宗璞;沈記全;;一種適用于Hadoop MapReduce環(huán)境的數(shù)據(jù)預取方法[J];西安電子科技大學學報;2014年02期
10 尹春天,古志民,廖祥文;基于搜索結果的預取技術研究[J];計算機應用;2004年01期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 歐國東;潘國騰;羅莉;;兩階段數(shù)據(jù)預取線程評估方法[A];第十六屆計算機工程與工藝年會暨第二屆微處理器技術論壇論文集[C];2012年
2 歐國東;王永文;張民選;;基于線程的多路徑數(shù)據(jù)預取技術研究[A];2010年第16屆全國信息存儲技術大會(IST2010)論文集[C];2010年
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 歐國東;基于線程的數(shù)據(jù)預取技術研究[D];國防科學技術大學;2011年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 姚南野;基于關聯(lián)分析的移動評教數(shù)據(jù)預取與緩存研究[D];華中師范大學;2015年
2 朱凌宇;基于數(shù)據(jù)訪問模式挖掘的磁盤數(shù)據(jù)預取技術研究[D];西南大學;2015年
3 辛愿;面向嵌入式系統(tǒng)的自調(diào)數(shù)據(jù)預取[D];浙江大學;2013年
4 張百達;一種軟硬結合的預取技術研究[D];國防科學技術大學;2008年
5 劉敬偉;時空結合的數(shù)據(jù)預取[D];浙江工業(yè)大學;2011年
6 鄭長安;多應用環(huán)境下自適應預取策略研究[D];華中科技大學;2011年
7 張美玲;增量預取技術在持久化框架中的研究與應用[D];中國海洋大學;2010年
8 王世克;基于數(shù)據(jù)挖掘的Web服務器預取技術研究[D];國防科學技術大學;2005年
9 宋冰;Web預取與緩存一體化模型研究[D];鄭州大學;2006年
10 史海振;基于雙關聯(lián)圖的Web預取模型研究[D];鄭州大學;2011年
本文關鍵詞:基于數(shù)據(jù)訪問模式挖掘的磁盤數(shù)據(jù)預取技術研究,由筆耕文化傳播整理發(fā)布。
本文編號:323668
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/323668.html