農(nóng)業(yè)搜索引擎倒排索引緩沖機制研究
本文選題:農(nóng)業(yè)搜索引擎 + 倒排索引; 參考:《新疆農(nóng)業(yè)大學(xué)學(xué)報》2011年02期
【摘要】:為了解決ASPSeek倒排索引直接采用操作系統(tǒng)文件緩沖訪問機制帶來的效率問題,本研究以125萬張中文農(nóng)業(yè)網(wǎng)頁為樣本,采用塊大小可變的倒排索引存儲結(jié)構(gòu),設(shè)計了基于LRU、MRU、LFU、MFU、Clock、Random、FPA替代策略的專用緩沖管理機制。對這7種替代策略的緩沖命中率及查詢訪問時間對比測試表明,當(dāng)所有詞條以相同的概率進行檢索時,Clock算法為較好的緩沖替代策略,當(dāng)詞條以特定差別概率進行檢索時,本研究提出的FPA算法為較好的緩沖替代策略。
[Abstract]:In order to solve the efficiency problem caused by the ASPSeek inverted index directly using the operating system file buffer access mechanism, this study takes 1.25 million Chinese agricultural web pages as samples and adopts a variable block size inverted index storage structure.A special buffer management mechanism based on LRUU MRU LFU MFU ClockClockFPA replacement strategy is designed.A comparative test of buffering hit ratio and query access time of the seven alternatives shows that when all the entries are retrieved with the same probability, the clock algorithm is a better buffer substitution strategy, and when the entries are retrieved with a specific difference probability,The proposed FPA algorithm is a better buffer substitution strategy.
【作者單位】: 新疆農(nóng)業(yè)大學(xué)計算機與信息工程學(xué)院;中國農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院;新疆維吾爾自治區(qū)招生辦公室;
【基金】:新疆維吾爾自治區(qū)科技攻關(guān)項目(200931103)
【分類號】:TP391.3
【參考文獻】
相關(guān)期刊論文 前6條
1 張震波;楊鶴標;馬振華;;基于LRU算法的Web系統(tǒng)緩存機制[J];計算機工程;2006年19期
2 劉小珠;彭智勇;陳旭;;高效的隨機訪問分塊倒排文件自索引技術(shù)[J];計算機學(xué)報;2010年06期
3 欒華;杜小勇;馮玉;王珊;;關(guān)系數(shù)據(jù)庫緩沖區(qū)置換策略的性能評測(英文)[J];計算機科學(xué)與探索;2008年02期
4 周鵬;吳華瑞;趙春江;楊寶祝;朱華吉;;基于Nutch農(nóng)業(yè)搜索引擎的研究與設(shè)計[J];計算機工程與設(shè)計;2009年03期
5 韓向春;邊瑋;沈峰;樊書娟;;代理緩存替換一致性算法的研究[J];計算機工程與設(shè)計;2009年11期
6 吳文娟;車明;;搜索引擎倒排索引技術(shù)的改進[J];微處理機;2006年06期
【共引文獻】
相關(guān)期刊論文 前10條
1 彭玉容;楊捧;高媛;;農(nóng)業(yè)搜索引擎的發(fā)展現(xiàn)狀及關(guān)鍵技術(shù)研究[J];安徽農(nóng)業(yè)科學(xué);2010年20期
2 常燕;劉純波;梁星濤;劉素紅;;應(yīng)用于村鎮(zhèn)信息自助平臺的電子地圖構(gòu)件關(guān)鍵技術(shù)研究[J];地理信息世界;2009年06期
3 李超;黃桂敏;賓辰忠;;一種基于改進LRU的P2P緩存機制[J];桂林電子科技大學(xué)學(xué)報;2011年03期
4 付光;;面向招聘信息主題搜索引擎的研究與設(shè)計[J];廣西教育;2011年18期
5 張琦;王梅;樂嘉錦;劉國華;;列存儲數(shù)據(jù)倉庫查詢執(zhí)行中重用緩沖區(qū)調(diào)度算法[J];計算機研究與發(fā)展;2011年10期
6 孔云;楊婷;;開源信息檢索技術(shù)在高校圖書館的應(yīng)用——以昆明理工大學(xué)圖書館為例[J];湖南科技學(xué)院學(xué)報;2011年08期
7 王遠定;梁久禎;;利用關(guān)鍵詞倒排表實時檢索中文網(wǎng)頁[J];計算機工程與應(yīng)用;2010年28期
8 楊溢;王志良;王魯;張富深;;面向智能空間的異構(gòu)網(wǎng)絡(luò)同構(gòu)化通信框架[J];計算機科學(xué);2012年04期
9 張璞;;基于Oracle DCN的緩存一致性技術(shù)[J];計算機工程;2008年22期
10 周進剛;邢鐵軍;紀勇;趙大哲;;一種結(jié)構(gòu)化數(shù)據(jù)緩存方法[J];計算機工程;2010年20期
相關(guān)會議論文 前1條
1 ;A Method for Building the Index Dictionary Files on Domain-specific Search Engine[A];中國自動化學(xué)會控制理論專業(yè)委員會B卷[C];2011年
相關(guān)碩士學(xué)位論文 前10條
1 徐萬錦;基于Ad Hoc網(wǎng)絡(luò)的移動P2P系統(tǒng)協(xié)同緩存研究[D];西安電子科技大學(xué);2009年
2 席敏;基于單漢字索引的全文檢索系統(tǒng)的研究與實現(xiàn)[D];西安電子科技大學(xué);2010年
3 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年
4 王洋;軍隊科技成果知識共享管理系統(tǒng)的設(shè)計與實現(xiàn)[D];吉林大學(xué);2011年
5 李帥;基于語義相似度的查詢擴展優(yōu)化[D];杭州電子科技大學(xué);2011年
6 李春豐;面向動態(tài)文本的在線索引若干問題研究[D];廣東工業(yè)大學(xué);2011年
7 薛煜陽;農(nóng)業(yè)搜索引擎倒排索引緩沖機制研究[D];新疆農(nóng)業(yè)大學(xué);2011年
8 陳車前;基于Nutch的并行搜索系統(tǒng)的優(yōu)化設(shè)計[D];華南理工大學(xué);2011年
9 董長春;基于Hadoop的倒排索引技術(shù)的研究[D];遼寧大學(xué);2011年
10 陳必坤;基于Nutch的圖情博客搜索引擎的設(shè)計與實現(xiàn)[D];鄭州大學(xué);2011年
【二級參考文獻】
相關(guān)期刊論文 前10條
1 王書芹;姜秀柱;徐敏;;不同代理緩存一致性技術(shù)中的網(wǎng)絡(luò)流量[J];福建電腦;2007年07期
2 張國印,陳先,皮鵬;基于詞頻統(tǒng)計的個性化信息過濾技術(shù)[J];哈爾濱工程大學(xué)學(xué)報;2003年01期
3 郭來德;劉輝林;劉蘭哲;王光興;;農(nóng)業(yè)信息搜索引擎設(shè)計與實現(xiàn)[J];河北工程大學(xué)學(xué)報(自然科學(xué)版);2007年03期
4 王本年,曹先彬;一種域分布式合作Web緩存系統(tǒng)[J];計算機研究與發(fā)展;2002年03期
5 楊春貴;吳產(chǎn)樂;彭鴻雁;;一種有效的Web代理緩存替換算法[J];計算機工程;2007年03期
6 胡濤;路紅英;;基于Nutch的搜索引擎的研究[J];計算機時代;2007年01期
7 楊鴻雁,尚俊平,徐延華,王萌,張宇;農(nóng)業(yè)專業(yè)搜索引擎建設(shè)探討[J];農(nóng)業(yè)圖書情報學(xué)刊;2005年04期
8 劉小珠;彭智勇;;全文索引技術(shù)時空效率分析[J];軟件學(xué)報;2009年07期
9 李世明;趙恒永;李世友;;專題搜索引擎中信息過濾的研究與實現(xiàn)[J];計算機工程與設(shè)計;2006年08期
10 張超群;李陶深;張增芳;;自適應(yīng)一致性替換算法的設(shè)計與實現(xiàn)[J];計算機工程與設(shè)計;2007年07期
相關(guān)碩士學(xué)位論文 前1條
1 蘇曉珂;基于Nutch的主題爬蟲研究與實現(xiàn)[D];昆明理工大學(xué);2007年
【相似文獻】
相關(guān)期刊論文 前10條
1 吳恒山,劉興宇,左瓊;一種基于可擴展散列表的倒排索引更新策略[J];計算機工程;2004年08期
2 王智強,劉建毅;一種實時更新索引結(jié)構(gòu)的設(shè)計與實現(xiàn)[J];計算機系統(tǒng)應(yīng)用;2005年10期
3 王宏宇;;基于Native-XML數(shù)據(jù)庫倒排索引算法研究[J];情報科學(xué);2006年07期
4 蘇潭英;郭憲勇;金鑫;;一種基于Lucene的中文全文檢索系統(tǒng)[J];計算機工程;2007年23期
5 黃少林;王華;張玉紅;蔣一峰;;基于Lucene的索引系統(tǒng)的設(shè)計與實現(xiàn)[J];現(xiàn)代情報;2009年07期
6 王濤;吳潔明;;搜索引擎建立倒排索引的算法研究[J];現(xiàn)代計算機(專業(yè)版);2008年01期
7 王路芳;張虎;;一種面向搜索引擎的基于集合模型的搜索算法[J];山西農(nóng)業(yè)大學(xué)學(xué)報(自然科學(xué)版);2009年06期
8 吐爾洪·吾司曼;維尼拉·木沙江;;維、哈、柯多語種搜索引擎中索引器的研究[J];新疆大學(xué)學(xué)報(自然科學(xué)版);2011年02期
9 余淼;楊丹;趙俊芹;;垂直搜索引擎的關(guān)鍵技術(shù)研究[J];軟件導(dǎo)刊;2007年23期
10 寧可為;;自動答疑系統(tǒng)知識庫文本的索引研究[J];電腦知識與技術(shù);2009年35期
相關(guān)會議論文 前10條
1 劉小珠;孫莎;曾承;彭智勇;;基于緩存的倒排索引機制研究[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2007年
2 李棟;史曉東;;對搜索引擎中倒排索引更新策略的研究和改進[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
3 董祥千;左志宏;劉強國;;Lucene倒排索引文件的實現(xiàn)與優(yōu)化[A];四川省通信學(xué)會2006年學(xué)術(shù)年會論文集(二)[C];2006年
4 辛欣;李涓子;;基于Java語言全文信息檢索系統(tǒng)的設(shè)計與實現(xiàn)[A];促進企業(yè)信息化進程——第十屆中國Java技術(shù)及應(yīng)用大會文集[C];2007年
5 維尼拉·木沙江;吳俊森;吐爾根·依布拉音;;維吾爾文搜索引擎的倒排索引設(shè)計與實現(xiàn)[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年
6 孫宇;劉憬;張宇;劉挺;;基于分詞和倒排索引的短文本檢索技術(shù)的研究與實現(xiàn)[A];黑龍江省計算機學(xué)會2007年學(xué)術(shù)交流年會論文集[C];2007年
7 李遠寧;劉汀;蔣樹強;黃慶明;;基于“Bag of Words”的視頻匹配方法[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會論文集(下冊)[C];2007年
8 李勇;陳文斌;;嵌入式平臺上的地址搜索[A];中國地理信息系統(tǒng)協(xié)會第四次會員代表大會暨第十一屆年會論文集[C];2007年
9 吐爾地·托合提;維尼拉·木沙江;艾斯卡爾·艾木都拉;;維、哈、柯全文搜索引擎中查詢處理研究與實現(xiàn)[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
10 朱虹;吳林;;DM4全文檢索機制的設(shè)計[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
相關(guān)重要報紙文章 前1條
1 清華大學(xué)計算機系智能技術(shù)與系統(tǒng)國家重點實驗室 張敏 金奕江;尋“寶”有術(shù)[N];計算機世界;2003年
相關(guān)博士學(xué)位論文 前7條
1 吳煒;密文全文檢索系統(tǒng)中的索引機制研究[D];華中科技大學(xué);2009年
2 龍柏;并行計算平臺上的數(shù)據(jù)索引技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2011年
3 鄺礫;基于接口和行為語義的Web服務(wù)發(fā)現(xiàn)與適配研究[D];浙江大學(xué);2009年
4 胥正川;基于關(guān)系數(shù)據(jù)庫的XML數(shù)據(jù)存儲、更新和檢索[D];復(fù)旦大學(xué);2003年
5 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學(xué);2011年
6 劉紅;近重復(fù)視頻檢測算法研究[D];復(fù)旦大學(xué);2012年
7 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 董長春;基于Hadoop的倒排索引技術(shù)的研究[D];遼寧大學(xué);2011年
2 潘勝一;基于倒排索引的壓縮算法性能研究[D];杭州電子科技大學(xué);2009年
3 薛煜陽;農(nóng)業(yè)搜索引擎倒排索引緩沖機制研究[D];新疆農(nóng)業(yè)大學(xué);2011年
4 吳俊森;維哈柯多語種搜索引擎倒排索引模塊的實現(xiàn)[D];新疆大學(xué);2007年
5 劉雪芹;單漢字全文檢索技術(shù)研究[D];河北工業(yè)大學(xué);2005年
6 盧光華;基于Lucene的全文檢索研究與應(yīng)用[D];吉林大學(xué);2009年
7 呂曉旭;基于倒排索引的關(guān)系數(shù)據(jù)庫全文檢索查詢效率研究[D];北京工業(yè)大學(xué);2009年
8 江毅銘;專業(yè)搜索引擎索引技術(shù)的研究與實現(xiàn)[D];北京化工大學(xué);2005年
9 吳寶貴;搜索引擎中索引技術(shù)研究與實現(xiàn)[D];西安電子科技大學(xué);2008年
10 王穎;中文局域網(wǎng)搜索引擎設(shè)計與實現(xiàn)[D];電子科技大學(xué);2009年
,本文編號:1753318
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1753318.html