分級存儲系統(tǒng)中基于進化算法的數(shù)據(jù)管理與保護關鍵技術研究
發(fā)布時間:2020-09-14 19:34
隨著信息網(wǎng)絡的蓬勃發(fā)展,信息化技術越來越深入到人們的日常生活中,伴隨而來的是對海量數(shù)據(jù)處理的高要求。當代計算機系統(tǒng)中最為重要的存儲系統(tǒng)—分級存儲系統(tǒng)也面臨著一些巨大的挑戰(zhàn):夾雜著噪聲數(shù)據(jù)的數(shù)字信息爆炸增長,對有用信息的存儲布局與提取提出嚴峻的要求;個性化數(shù)據(jù)訪問的及時性與數(shù)據(jù)存儲的安全性日益增加。當前存儲系統(tǒng)中數(shù)據(jù)處理技術有著各自優(yōu)勢的同時,在大規(guī)模數(shù)據(jù)處理方面也存在著自身的不足。究其原因是,傳統(tǒng)的一些處理方法,在面對大規(guī)模數(shù)據(jù)時,無論是空間,還是時間的復雜度,會隨著數(shù)據(jù)量的增長呈幾何指數(shù)增長。進化算法具備有效處理大規(guī)模數(shù)據(jù)的特性,將進化算法的工具引入到分級存儲平臺中解決相應的問題成為一種值得嘗試的理念與方法。 分級存儲中為達到個性化數(shù)據(jù)訪問的及時性,更有效的對熱點數(shù)據(jù)的訪問給出響應,提出了基于均勻設計的基因表達式編程算法(UGEP)來有效的解決分級存儲中塊的預取問題。UGEP算法在傳統(tǒng)基因表達式算法的基礎上改進的工作有:1)在初始化時,對解空間的點做均勻化的抽取,保證解空間的均勻性,2)在進行交叉變異時,利用均勻設計的特性,對交叉算子做均勻交叉,保證個體多樣性的同時,能提高得到最優(yōu)解的效率。UGEP的設計能及時有效的收集用戶訪問序列的特征,找出該序列的規(guī)律,對將要訪問的熱點數(shù)據(jù)給出預測。通過四個實際應用系統(tǒng)工作流的仿真實驗表明:將UGEP算法應用于分級存儲系統(tǒng)的預取,其I/O性能在命中率和時間復雜度上都取得較好的結(jié)果。 關聯(lián)規(guī)則挖掘技術能有效的挖掘數(shù)據(jù)塊之間的關聯(lián)性,為大規(guī)模數(shù)據(jù)的存儲分布提供有效的支持。在基因表達式編程進化算法(Gene Expression Programming)的基礎上,提出了一種新的挖掘強關聯(lián)規(guī)則的算法框架。該方法主要貢獻在于提出并實現(xiàn)了基于小生境技術的基因表達式編程進化算法NGEP以用于挖掘數(shù)據(jù)塊之間的關聯(lián)規(guī)則。NEGP算法首先進行小生境演化,融合小生境并剔除同構的優(yōu)秀個體,然后對小生境解進行笛卡兒交叉以產(chǎn)生更好的結(jié)果;谡鎸嵃咐膶嶒灲Y(jié)果表明:與同類優(yōu)秀的算法對比,NGEP算法在進行關聯(lián)規(guī)則提取時,其種群多樣性與精確度都有很好的提升,并且該算法在挖掘文件的有效規(guī)則的效率上也有較好的提高。我們利用實際的I/Otrace實例來測試NGEP在數(shù)據(jù)放置中的性能,結(jié)果表明了在順序預取時,NGEP能有效的改善命中率和I/O響應時間。 基于存儲的可信訪問機制,能有效的在存儲層防范非法入侵;诖鎯Φ娜肭謾z測系統(tǒng)SIDS(Storage-based intrusion detection systems)能在操作系統(tǒng)失效后在存儲層觀察到此類入侵行為。提出了一種新的基于存儲的人工免疫入侵檢測方案。該方案收集關鍵代碼形成抗體基因庫,通過訓練得到抗體基因片段的權值,進而對入侵的操作序列給出預警。該方法克服了以往一些SIDS原型完全依賴規(guī)則的缺點,利用了人工免疫的自我免疫特性,來動態(tài)監(jiān)控用戶的訪問行為。根據(jù)收斂速度和檢測效率,擬合出本方案的最優(yōu)參數(shù)。最后的SISD在18類存儲入侵工具的檢測中結(jié)果表明:與同類優(yōu)秀原型相比,本方案能達到較高的檢測率和較低的誤警率。 通過上述3個方面的研究,將改造的進化算法引入到分級存儲平臺的數(shù)據(jù)管理與保護中,能夠較好的解決分級存儲平臺中可信的數(shù)據(jù)存儲與管理問題。
【學位單位】:華中科技大學
【學位級別】:博士
【學位年份】:2013
【中圖分類】:TP333
本文編號:2818573
【學位單位】:華中科技大學
【學位級別】:博士
【學位年份】:2013
【中圖分類】:TP333
【參考文獻】
相關期刊論文 前8條
1 史奎凡,董吉文,李金屏,曲守寧,楊波;正交遺傳算法[J];電子學報;2002年10期
2 蔣思偉,蔡之華,曾丹,李曲,程遠方;基于模擬退火的并行基因表達式編程算法研究[J];電子學報;2005年11期
3 徐堯強;邢春曉;周立柱;;流媒體服務中即時響應的層次存儲數(shù)據(jù)放置策略[J];計算機科學;2004年09期
4 蔡濤;鞠時光;牛德姣;;基于免疫安全存儲設備IBSSD的研究與實現(xiàn)[J];計算機科學;2009年01期
5 黃雙喜,范玉順;產(chǎn)品生命周期管理研究綜述[J];計算機集成制造系統(tǒng)-CIMS;2004年01期
6 呂帥;劉光明;徐凱;劉欣;;海量信息分級存儲數(shù)據(jù)遷移策略研究[J];計算機工程與科學;2009年S1期
7 彭京,唐常杰,李川,胡建軍;M-GEP:基于多層染色體基因表達式編程的遺傳進化算法[J];計算機學報;2005年09期
8 孫照焱,董永貴,賈惠波,馮冠平;附網(wǎng)存儲設備用戶行為的一種層次化免疫策略[J];計算機應用研究;2005年01期
本文編號:2818573
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2818573.html
最近更新
教材專著