存儲(chǔ)系統(tǒng)中突發(fā)訪問(wèn)行為的分析與預(yù)測(cè)
本文關(guān)鍵詞:存儲(chǔ)系統(tǒng)中突發(fā)訪問(wèn)行為的分析與預(yù)測(cè),由筆耕文化傳播整理發(fā)布。
【摘要】:突發(fā)訪問(wèn)是指在一段極短的時(shí)間內(nèi)對(duì)服務(wù)器出現(xiàn)大量的突擊式訪問(wèn),但服務(wù)器的處理能力卻滿足不了急劇上升的訪問(wèn)量而無(wú)法順利完成用戶提交的相關(guān)請(qǐng)求。傳統(tǒng)的計(jì)算機(jī)系統(tǒng)往往是基于預(yù)期的峰值負(fù)載來(lái)對(duì)資源進(jìn)行靜態(tài)配置的,那么突發(fā)訪問(wèn)的存在就會(huì)帶來(lái)諸如能耗,資源浪費(fèi)等問(wèn)題。由于突發(fā)訪問(wèn)行為的隨機(jī)性,如何有效地預(yù)測(cè)突發(fā)訪問(wèn)行為一直是一個(gè)非常具有挑戰(zhàn)性的問(wèn)題。本文提出了一種基于數(shù)據(jù)挖掘的方法來(lái)獲取存儲(chǔ)系統(tǒng)中的頻繁關(guān)聯(lián)I/O,然后通過(guò)過(guò)濾頻繁關(guān)聯(lián)I/O來(lái)預(yù)測(cè)突發(fā)訪問(wèn)行為的發(fā)生。為了提高頻繁關(guān)聯(lián)I/O的挖掘效率,本文在Apriori算法的基礎(chǔ)上,結(jié)合I/O數(shù)據(jù)的時(shí)間屬性,引入關(guān)聯(lián)強(qiáng)化窗口。在產(chǎn)生頻繁關(guān)聯(lián)序列的過(guò)程中,該窗口能夠以默認(rèn)大小和不定步長(zhǎng),達(dá)到減少時(shí)間開(kāi)銷,實(shí)現(xiàn)時(shí)間局部感知以及強(qiáng)化規(guī)則關(guān)聯(lián)性的效果。實(shí)驗(yàn)表明,新的挖掘算法不但可以獲得與原來(lái)算法一致的結(jié)果,而且降低了原挖掘算法20%到40%的時(shí)間開(kāi)銷。此外,本文通過(guò)實(shí)驗(yàn)分析發(fā)現(xiàn)主導(dǎo)突發(fā)訪問(wèn)行為的因素并非頻繁關(guān)聯(lián)I/O,基于以上發(fā)現(xiàn),本文提出了一種基于關(guān)聯(lián)挖掘的突發(fā)預(yù)測(cè)算法。該算法主要包括以下五個(gè)步驟:首先對(duì)三個(gè)真實(shí)的I/O數(shù)據(jù)集的訓(xùn)練集進(jìn)行頻繁關(guān)聯(lián)I/O的挖掘;其次按照較長(zhǎng)時(shí)間粒度對(duì)數(shù)據(jù)集進(jìn)行劃分并獲得其對(duì)應(yīng)的I/O請(qǐng)求;再次對(duì)較短時(shí)間粒度內(nèi)發(fā)生的頻繁關(guān)聯(lián)I/O進(jìn)行過(guò)濾;然后利用過(guò)濾后的塊I/O來(lái)預(yù)測(cè)較長(zhǎng)時(shí)間粒度內(nèi)的突發(fā)訪問(wèn)行為;最后得出這種預(yù)測(cè)方法的命中率和發(fā)生率。本文在確定了突發(fā)閾值和觀察閾值后,接著利用該算法對(duì)三個(gè)I/O數(shù)據(jù)集的測(cè)試集進(jìn)行了驗(yàn)證實(shí)驗(yàn),并與傳統(tǒng)的時(shí)序預(yù)測(cè)算法進(jìn)行了對(duì)比。實(shí)驗(yàn)表明,在理想的情況下,這種方法可以獲得約70%左右的預(yù)測(cè)命中率,約2倍于時(shí)序預(yù)測(cè)。由此可以得到一個(gè)重要的結(jié)論:通過(guò)較短時(shí)間粒度的非頻繁關(guān)聯(lián)I/O來(lái)預(yù)測(cè)其對(duì)應(yīng)的較長(zhǎng)時(shí)間粒度范圍內(nèi)的突發(fā)訪問(wèn)情況是可行且具有現(xiàn)實(shí)意義的。
【關(guān)鍵詞】:存儲(chǔ)I/O 突發(fā)訪問(wèn) 關(guān)聯(lián)挖掘 關(guān)聯(lián)強(qiáng)化窗口 預(yù)測(cè)
【學(xué)位授予單位】:暨南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP311.13;TP333
【目錄】:
- 摘要3-4
- Abstract4-7
- 第一章 緒論7-13
- 1.1 研究目的與意義7-8
- 1.2 國(guó)內(nèi)外研究狀況8-11
- 1.3 本文的研究?jī)?nèi)容11-12
- 1.4 本文的創(chuàng)新之處12
- 1.5 本文的組織架構(gòu)12-13
- 第二章 理論基礎(chǔ)13-17
- 2.1 關(guān)聯(lián)規(guī)則的基本概念13-14
- 2.2 關(guān)聯(lián)規(guī)則挖掘算法Apriori的定義14-15
- 2.3 滑動(dòng)窗口的類型15
- 2.4 突發(fā)訪問(wèn)的基本定義15-17
- 第三章 可時(shí)間局部性感知的塊I/O關(guān)聯(lián)挖掘算法17-28
- 3.1 頻繁關(guān)聯(lián)塊17-18
- 3.2 基于關(guān)聯(lián)強(qiáng)化窗口的Apriori改進(jìn)算法18-21
- 3.3 實(shí)驗(yàn)評(píng)估與分析21-27
- 3.4 本章小結(jié)27-28
- 第四章 存儲(chǔ)系統(tǒng)中突發(fā)訪問(wèn)行為的分析與預(yù)測(cè)28-54
- 4.1 突發(fā)訪問(wèn)行為的主導(dǎo)因素28-33
- 4.2 基于關(guān)聯(lián)挖掘的突發(fā)預(yù)測(cè)算法33-38
- 4.3 時(shí)序預(yù)測(cè)算法38-44
- 4.4 實(shí)驗(yàn)評(píng)估與分析44-53
- 4.5 本章小結(jié)53-54
- 第五章 總結(jié)與展望54-56
- 5.1 本文總結(jié)54
- 5.2 展望54-56
- 參考文獻(xiàn)56-59
- 在校期間發(fā)表論文清單59-60
- 致謝60
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前5條
1 劉清華;黃明和;唐權(quán)華;王淵;;一種預(yù)測(cè)群體用戶訪問(wèn)行為的算法[J];計(jì)算機(jī)技術(shù)與發(fā)展;2014年02期
2 蔡青松,李子木,胡建平;Internet上的流媒體特性及用戶訪問(wèn)行為研究[J];北京航空航天大學(xué)學(xué)報(bào);2005年01期
3 杜文華;;基于用戶訪問(wèn)行為的案例模型研究[J];情報(bào)雜志;2007年02期
4 陳海龍;王天嬌;;社交網(wǎng)站中用戶訪問(wèn)行為的影響因素研究——以人人網(wǎng)為例[J];東南傳播;2012年05期
5 ;[J];;年期
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 本報(bào)記者 鄒大斌;大數(shù)據(jù)治理未雨綢繆[N];計(jì)算機(jī)世界;2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 黃立鋒;存儲(chǔ)系統(tǒng)中突發(fā)訪問(wèn)行為的分析與預(yù)測(cè)[D];暨南大學(xué);2015年
2 胡佳;基于近鄰決策樹的文件訪問(wèn)行為預(yù)測(cè)方法研究[D];華中科技大學(xué);2012年
3 潘蕾;用戶網(wǎng)絡(luò)訪問(wèn)行為分析模型的研究與設(shè)計(jì)[D];蘇州大學(xué);2006年
4 姜宏飛;基于web日志的訪問(wèn)行為分類技術(shù)研究[D];沈陽(yáng)航空工業(yè)學(xué)院;2010年
5 張澤云;基于多層B/S結(jié)構(gòu)的網(wǎng)友訪問(wèn)行為的分析系統(tǒng)[D];華南理工大學(xué);2011年
6 魏浩;基于Web數(shù)據(jù)流分析的用戶訪問(wèn)行為核查技術(shù)研究[D];解放軍信息工程大學(xué);2013年
本文關(guān)鍵詞:存儲(chǔ)系統(tǒng)中突發(fā)訪問(wèn)行為的分析與預(yù)測(cè),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):410271
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/410271.html