改進(jìn)搜索引擎及其數(shù)據(jù)結(jié)構(gòu)的設(shè)計(jì)
本文關(guān)鍵詞: 搜索引擎 Web檢索 索引詞 中文分詞 出處:《情報(bào)科學(xué)》2012年02期 論文類(lèi)型:期刊論文
【摘要】:針對(duì)傳統(tǒng)搜索引擎在搜索過(guò)程中產(chǎn)生的臨時(shí)文件多、占用磁盤(pán)空間大的問(wèn)題,本文改進(jìn)了搜索引擎的數(shù)據(jù)結(jié)構(gòu),采用索引壓縮技術(shù)減少了臨時(shí)文件,提高了檢索效率。
[Abstract]:In order to solve the problem that the traditional search engine produces more temporary files and occupies large disk space, this paper improves the data structure of the search engine, reduces the temporary files by using index compression technology, and improves the retrieval efficiency.
【作者單位】: 吉林化工學(xué)院理學(xué)院;吉林大學(xué)通信工程學(xué)院;湖北大學(xué)商學(xué)院;北京大學(xué)軟件與微電子學(xué)院;
【分類(lèi)號(hào)】:G353
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 焦麗;路波;;基于五大因素的搜索引擎優(yōu)化研究[J];中國(guó)管理信息化;2009年17期
2 丁岳偉;郭輝;;利用蟻群算法對(duì)PageRank算法的改進(jìn)[J];計(jì)算機(jī)應(yīng)用;2009年10期
3 鄭志宏;鄭志高;王玉婷;;模糊查找算法的設(shè)計(jì)實(shí)現(xiàn)[J];情報(bào)科學(xué);2010年06期
4 呂學(xué)強(qiáng),蘇祺,孫斌,俞士汶;搜索引擎用短語(yǔ)詞典建設(shè)[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年S1期
5 陳麗君;林懷忠;;搜索引擎頁(yè)面刷新策略研究綜述[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2009年07期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 官連軍;丁光耀;張燕妮;;支持多種模糊處理的英文智能預(yù)提示輸入引擎[J];成都信息工程學(xué)院學(xué)報(bào);2012年02期
2 張曉民;劉凱;;PowerPoint動(dòng)畫(huà)技術(shù)在數(shù)據(jù)結(jié)構(gòu)教學(xué)中的應(yīng)用實(shí)踐[J];電腦知識(shí)與技術(shù);2009年23期
3 李婧;;淺談提高數(shù)據(jù)結(jié)構(gòu)教學(xué)質(zhì)量的方式方法[J];電腦知識(shí)與技術(shù);2010年17期
4 周巍巍;;網(wǎng)絡(luò)爬蟲(chóng)網(wǎng)頁(yè)庫(kù)智能更新策略分析與研究[J];電腦知識(shí)與技術(shù);2010年31期
5 李觀金;;基于搜索引擎自然檢索的搜索引擎優(yōu)化[J];硅谷;2011年07期
6 肖詩(shī)斌;趙紅改;王洪俊;呂學(xué)強(qiáng);;搜索引擎日志中“N_1+N_2+V”型名詞短語(yǔ)研究[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期
7 羅婷;呂歆;;現(xiàn)代網(wǎng)站SEO的方法與技巧[J];信息通信;2011年06期
8 許憲成;張凌;;基于HASH表的二叉樹(shù)結(jié)構(gòu)在網(wǎng)絡(luò)處理器系統(tǒng)中的應(yīng)用[J];河南大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期
9 孫秀婷;;大規(guī)模圖數(shù)據(jù)路徑查詢(xún)分析[J];黑龍江科技信息;2011年01期
10 許世峰;高軍;楊冬青;王騰蛟;;基于穿行次數(shù)的大規(guī)模圖數(shù)據(jù)路徑查詢(xún)[J];計(jì)算機(jī)研究與發(fā)展;2010年01期
相關(guān)會(huì)議論文 前4條
1 詹海生;王啟戶(hù);;一種自適應(yīng)字長(zhǎng)的中文詞庫(kù)的構(gòu)建方法[A];2010年第16屆全國(guó)信息存儲(chǔ)技術(shù)大會(huì)(IST2010)論文集[C];2010年
2 穆飛;李維佳;薛巍;舒繼武;;一種分布式信息檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(下冊(cè))[C];2007年
3 王啟戶(hù);詹海生;周水生;;一種自適應(yīng)字長(zhǎng)的中文詞庫(kù)的構(gòu)建方法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
4 許世峰;高軍;楊冬青;王騰蛟;;基于穿行次數(shù)的大規(guī)模圖數(shù)據(jù)路徑查詢(xún)[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(A輯)[C];2009年
相關(guān)博士學(xué)位論文 前1條
1 許憲成;基于網(wǎng)絡(luò)處理器的入侵檢測(cè)系統(tǒng)設(shè)計(jì)與性能優(yōu)化研究[D];華南理工大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 詹圣君;基于用戶(hù)行為日志分析的搜索引擎排序算法研究[D];湖北工業(yè)大學(xué);2011年
2 曹成龍;基于文件過(guò)濾驅(qū)動(dòng)的移動(dòng)存儲(chǔ)控制系統(tǒng)的研究與實(shí)現(xiàn)[D];南京信息工程大學(xué);2011年
3 吳娛;網(wǎng)絡(luò)輿情分析關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2011年
4 桂許軍;基于JavaEE平臺(tái)與Lucene的信息文檔搜索引擎系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西南交通大學(xué);2011年
5 馮波;企業(yè)網(wǎng)站實(shí)施搜索引擎優(yōu)化的基本策略研究[D];哈爾濱工業(yè)大學(xué);2011年
6 羅會(huì)紅;基于SSH和Lucene垂直搜索引擎研究[D];長(zhǎng)沙理工大學(xué);2011年
7 葉繼平;基于Lucene的全文信息檢索技術(shù)的研究與應(yīng)用[D];江南大學(xué);2012年
8 郭慶寶;基于PageRank的搜索引擎優(yōu)化方法研究[D];山東師范大學(xué);2012年
9 戴運(yùn)桃;動(dòng)態(tài)可配置綜合導(dǎo)航顯控臺(tái)系統(tǒng)軟件設(shè)計(jì)[D];哈爾濱工程大學(xué);2006年
10 馬志強(qiáng);校園網(wǎng)搜索引擎核心技術(shù)—中文自動(dòng)分詞[D];北京機(jī)械工業(yè)學(xué)院;2006年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前8條
1 魯宏偉;魏凱;孔華鋒;;一種改進(jìn)的KMP高效模式匹配算法[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年10期
2 王建勇,單松巍,雷鳴,謝正茂,李曉明;海量Web搜索引擎系統(tǒng)中用戶(hù)行為的分布特征及其啟示[J];中國(guó)科學(xué)E輯:技術(shù)科學(xué);2001年04期
3 劉務(wù)華;羅鐵堅(jiān);王文杰;;一個(gè)Web社區(qū)搜索引擎系統(tǒng)[J];計(jì)算機(jī)應(yīng)用研究;2007年02期
4 呂學(xué)強(qiáng),蘇祺,孫斌,俞士汶;搜索引擎用短語(yǔ)詞典建設(shè)[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年S1期
5 孟濤;王繼民;閆宏飛;;網(wǎng)頁(yè)變化與增量搜集技術(shù)[J];軟件學(xué)報(bào);2006年05期
6 宋聚平,王永成,尹中航,滕偉;對(duì)網(wǎng)頁(yè)P(yáng)ageRank算法的改進(jìn)[J];上海交通大學(xué)學(xué)報(bào);2003年03期
7 黃德才;戚華春;錢(qián)能;;基于主題相似度模型的TS-PageRank算法[J];小型微型計(jì)算機(jī)系統(tǒng);2007年03期
8 戚華春,黃德才,鄭月鋒;具有時(shí)間反饋的PageRank改進(jìn)算法[J];浙江工業(yè)大學(xué)學(xué)報(bào);2005年03期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 藍(lán)海洋,周杰韓,張和明;文本索引詞項(xiàng)相對(duì)權(quán)重計(jì)算方法與應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2003年15期
2 陳莉;淺談古籍書(shū)目索引的編纂[J];圖書(shū)情報(bào)知識(shí);2005年03期
3 陳莉;韓錫鐸;;淺談古籍書(shū)目索引的編纂[J];中國(guó)索引;2004年04期
4 張新鳳;;SciFinder Scholar數(shù)據(jù)庫(kù)醫(yī)院圖書(shū)館學(xué)研究文獻(xiàn)內(nèi)容分析[J];醫(yī)學(xué)信息學(xué)雜志;2009年11期
5 胡小菁;情報(bào)檢索語(yǔ)言語(yǔ)法手段分析[J];上海第二工業(yè)大學(xué)學(xué)報(bào);1991年01期
6 劉丹;利用《CA on CD》光盤(pán)數(shù)據(jù)庫(kù)查找信息資源[J];大學(xué)化學(xué);2001年04期
7 劉樹(shù)安,于大鵬;基于推理網(wǎng)絡(luò)的文本檢索模型[J];控制與決策;2001年S1期
8 王彤宇,李興福;應(yīng)用于學(xué)生知識(shí)拓展的智能Web檢索系統(tǒng)[J];濟(jì)南職業(yè)學(xué)院學(xué)報(bào);2005年02期
9 Jeff prosise ,姚萍;用Web檢索[J];個(gè)人電腦;1996年10期
10 鐘曉班;Web檢索接口的一種結(jié)構(gòu)[J];管理科學(xué)文摘;1999年06期
相關(guān)會(huì)議論文 前10條
1 王彥祥;王廣林;;“索引之星”的研制和索引編制[A];2004年辭書(shū)與數(shù)字化研討會(huì)論文集[C];2004年
2 孫琦;牛軍鈺;;基于倒排文件的索引模型綜述[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2007年
3 陳莉;;淺談古籍書(shū)目索引的編纂[A];2004年度中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)討論會(huì)論文集[C];2004年
4 喻宏勇;趙鐵軍;鄭德權(quán);王月穎;;一種面向文件的高效檢索方法[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
5 張惠榮;;美國(guó)《化學(xué)文摘》光盤(pán)數(shù)據(jù)庫(kù)的檢索與利用[A];圖書(shū)館改革與發(fā)展——陜西省社會(huì)科學(xué)信息學(xué)會(huì)第六次學(xué)術(shù)討論會(huì)論文集[C];2003年
6 王梅;;索引語(yǔ)義擴(kuò)展的探討[A];2005年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年
7 劉華;邢海鷹;;Word在書(shū)稿加工中的應(yīng)用[A];多出精品 多出人才——中國(guó)編輯學(xué)會(huì)第八屆年會(huì)論文集[C];2003年
8 王培嵩;王淑珍;萬(wàn)金娥;呂秋寧;劉學(xué)玲;;椎間盤(pán)炎與高壓氧治療[A];中華醫(yī)學(xué)會(huì)第十五次全國(guó)高壓氧醫(yī)學(xué)學(xué)術(shù)會(huì)議論文匯編[C];2006年
9 沈志宏;;科技文獻(xiàn)主題索引準(zhǔn)確性探討[A];外向型文獻(xiàn)庫(kù)的數(shù)據(jù)質(zhì)量控制——首屆CUJA系統(tǒng)學(xué)術(shù)討論會(huì)論文集[C];1990年
10 胡鳳國(guó);;基于Web檢索的語(yǔ)料庫(kù)資源共享—現(xiàn)狀和展望[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年
相關(guān)重要報(bào)紙文章 前7條
1 中國(guó)科學(xué)院計(jì)算技術(shù)研究所 王 斌;內(nèi)容為王[N];計(jì)算機(jī)世界;2004年
2 裘宗燕;輕松做索引[N];中華讀書(shū)報(bào);2002年
3 本報(bào)記者 張欣;萬(wàn)兆“花”開(kāi)“果”未熟[N];計(jì)算機(jī)世界;2003年
4 本報(bào)記者 李敏;微軟研究院:領(lǐng)導(dǎo)、員工一流技術(shù)才能領(lǐng)先[N];國(guó)際商報(bào);2004年
5 辛風(fēng);培養(yǎng)人才就是積累資本[N];中國(guó)審計(jì)報(bào);2002年
6 希安;微軟試水信息檢索[N];經(jīng)濟(jì)日?qǐng)?bào);2004年
7 河南省審計(jì)科研所 胡友良;論文寫(xiě)作格式指導(dǎo)[N];中國(guó)審計(jì)報(bào);2009年
相關(guān)博士學(xué)位論文 前6條
1 王斌;面向關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵字近似搜索技術(shù)研究[D];東北大學(xué);2008年
2 劉喜平;XML文檔搜索中的查詢(xún)處理技術(shù)研究[D];江西財(cái)經(jīng)大學(xué);2010年
3 劉康苗;自適應(yīng)網(wǎng)絡(luò)信息獲取服務(wù)技術(shù)研究[D];浙江大學(xué);2008年
4 胡佳妮;文本挖掘中若干關(guān)鍵問(wèn)題的研究[D];北京郵電大學(xué);2008年
5 駱傳偉;專(zhuān)名的涵義與指稱(chēng)[D];上海外國(guó)語(yǔ)大學(xué);2011年
6 劉守群;海量網(wǎng)絡(luò)視頻快速檢索關(guān)鍵技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 李春豐;面向動(dòng)態(tài)文本的在線索引若干問(wèn)題研究[D];廣東工業(yè)大學(xué);2011年
2 燕昆;分布式搜索引擎索引安全及緩存策略研究[D];華中科技大學(xué);2011年
3 武慶榮;索引詞研究述評(píng)[D];西南大學(xué);2009年
4 張虹;基于集成詞表和對(duì)照索引的文獻(xiàn)分類(lèi)法兼容互換研究[D];南京農(nóng)業(yè)大學(xué);2008年
5 李樹(shù)成;WEB主題檢索系統(tǒng)的性能優(yōu)化設(shè)計(jì)[D];河北大學(xué);2006年
6 柴變芳;基于貝葉斯網(wǎng)絡(luò)的XML文檔檢索[D];河北大學(xué);2006年
7 鄭莉霞;基于文本的Web圖像檢索技術(shù)研究[D];廣西大學(xué);2007年
8 林潔;基于綜合倒排索引的個(gè)性化搜索技術(shù)研究[D];貴州大學(xué);2008年
9 姜洪強(qiáng);基于語(yǔ)義Web文檔的索引技術(shù)研究[D];北京工業(yè)大學(xué);2010年
10 何水霞;基于B-Tree索引和BerkeleyDB的中文詞庫(kù)的設(shè)計(jì)和實(shí)現(xiàn)[D];華中科技大學(xué);2009年
,本文編號(hào):1512289
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1512289.html