基于Web的緩存與預取一體化技術研究
發(fā)布時間:2020-08-13 14:06
【摘要】: 在Internet高速發(fā)展的今天,隨著信息資源的爆炸,網(wǎng)絡信息的增長速度加快且遠遠超過了磁盤容量和網(wǎng)絡速度的增長。針對這個問題,已經(jīng)提出了多種解決方法,其中最關鍵的技術是網(wǎng)絡緩存和預取技術。目前對于預取與緩存技術的研究只是強調對預取算法和替換策略單方面的改進,而缺少對預取算法和替換策略相結合的研究。本文著重從以下幾個方面進行深入研究和探討。 首先,在預測模型方面,將序列模式挖掘應用到Web日志中,對序列模式算法PrefixSpan進行改進,并將該算法應用到基于用戶訪問序列的預測模型中。該預測模型利用前綴樹存儲用戶的訪問序列,采用改進的PrefixSpan算法挖掘訪問序列中的頻繁序列模式,然后與用戶當前的訪問序列相結合,采用滑動窗口進行預測,得到較高的預測準確性。 其次,針對替換策略的文檔命中率問題,在替換算法GDSF基礎上加入預測機制,提出了基于預測機制的緩存替換算法PGDSF,該算法根據(jù)用戶當前的訪問請求和用戶過去的歷史訪問記錄預測用戶將來可能訪問的對象。在一定的緩存空間內提高了緩存的命中率。 再次,在PGDSF替換算法基礎上,提出Web緩存與預取一體化模型,使緩存系統(tǒng)與預取系統(tǒng)相結合,提高了網(wǎng)絡的服務質量。 最后,通過仿真實驗對替換算法PGDSF進行驗證,證明了替換算法PGDSF在一定的緩存空間內相對于其它替換算法有較高的文檔命中率和字節(jié)命中率。
【學位授予單位】:燕山大學
【學位級別】:碩士
【學位授予年份】:2010
【分類號】:TP333
本文編號:2792104
【學位授予單位】:燕山大學
【學位級別】:碩士
【學位授予年份】:2010
【分類號】:TP333
【參考文獻】
相關期刊論文 前4條
1 李明星;衡萍;董沛武;陳健;;Web日志挖掘中的用戶序列模式識別[J];哈爾濱工業(yè)大學學報;2005年11期
2 金志剛,張鋼,舒炎泰;基于網(wǎng)絡性能的智能Web加速技術——緩存與預取[J];計算機研究與發(fā)展;2001年08期
3 許歡慶,王永成;基于用戶訪問路徑分析的網(wǎng)頁預取模型[J];軟件學報;2003年06期
4 徐寶文,張衛(wèi)豐;數(shù)據(jù)挖掘技術在Web預取中的應用研究[J];計算機學報;2001年04期
本文編號:2792104
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2792104.html
最近更新
教材專著