高效FTP搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)
本文選題:文件傳輸協(xié)議 + 搜索引擎。 參考:《華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版)》2009年01期
【摘要】:為了解決傳統(tǒng)FTP搜索引擎對檢索結(jié)果優(yōu)化程度不夠而造成的檢索質(zhì)量低的問題,在對FTP用戶查詢?nèi)罩具M(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)上,采用雙字節(jié)倒排索引、檢索結(jié)果自動(dòng)分類以及查詢自動(dòng)糾錯(cuò)等技術(shù)設(shè)計(jì)了一種高性能的智能化FTP搜索引擎.雙字節(jié)倒排是對文件名中每兩個(gè)字節(jié)建立倒排索引表,自動(dòng)分類是對檢索結(jié)果按主題劃分為層次結(jié)構(gòu),查詢自動(dòng)糾錯(cuò)是以用戶查詢?nèi)罩局械母哳l查詢詞為數(shù)據(jù)源構(gòu)建拼寫錯(cuò)誤詞典.試驗(yàn)結(jié)果表明,該方案能夠有效地提高FTP搜索引擎的文件檢索效率與質(zhì)量.
[Abstract]:In order to solve the problem of low retrieval quality caused by the poor optimization of search results caused by the traditional FTP search engine, based on the statistical analysis of the query logs of FTP users, a double-byte inverted index is adopted. A high performance intelligent FTP search engine is designed by automatic classification of retrieval results and automatic error correction of query. Double-byte inversion is to create an inverted index table for every two bytes in the file name. The automatic classification is to divide the retrieval results into hierarchies according to the topic. Query automatic error correction is to construct spelling error dictionary based on high frequency query words in user query log. The experimental results show that this scheme can effectively improve the efficiency and quality of FTP search engine file retrieval.
【作者單位】: 中國農(nóng)業(yè)大學(xué)工學(xué)院;國家農(nóng)業(yè)信息化工程技術(shù)研究中心;
【基金】:國家“863”計(jì)劃項(xiàng)目(2006AA10Z239) 國家科技支撐計(jì)劃項(xiàng)目(2006BAH02A16)
【分類號】:TP391.3
【共引文獻(xiàn)】
相關(guān)期刊論文 前6條
1 李艷梅;圖書館FTP服務(wù)器的建立和安全分析[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年03期
2 周燕;網(wǎng)絡(luò)信息資源組織研究[J];圖書與情報(bào);2003年01期
3 趙旭;陳肖飛;;基于Web的高校FTP搜索引擎的技術(shù)研究[J];電腦知識與技術(shù)(學(xué)術(shù)交流);2007年22期
4 席生長;胡宏濤;;信息檢索技術(shù)在中石油勘探與生產(chǎn)分公司門戶內(nèi)的應(yīng)用研究[J];福建電腦;2008年01期
5 易清亮;劉克劍;蔡祖戀;;基于P2P技術(shù)的大型分布式FTP搜索引擎研究[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年01期
6 許昊;王躍勝;;基于Lucene的FTP搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];福建電腦;2012年07期
相關(guān)博士學(xué)位論文 前2條
1 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
2 張永暉;基于用戶行為的下一代移動(dòng)互聯(lián)網(wǎng)絡(luò)若干關(guān)鍵問題的研究[D];中南大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 蘭沖;基于統(tǒng)計(jì)規(guī)則的中文分詞研究[D];西安電子科技大學(xué);2011年
2 劉治華;面向主題的文檔摘要技術(shù)研究[D];北方工業(yè)大學(xué);2011年
3 軒春青;基于客戶反饋的FTP搜索引擎的研究與設(shè)計(jì)[D];鄭州大學(xué);2011年
4 仇亞東;面向農(nóng)業(yè)領(lǐng)域的垂直搜索技術(shù)的研究[D];南京農(nóng)業(yè)大學(xué);2010年
5 李東偉;移動(dòng)互聯(lián)網(wǎng)環(huán)境下無線垂直搜索引擎的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2011年
6 余舟華;基于陷阱的spider檢測評價(jià)模型研究[D];沈陽航空航天大學(xué);2011年
7 黃素珍;并行多元搜索引擎的研究與設(shè)計(jì)[D];廣西大學(xué);2001年
8 李建平;智能化WEB信息搜索引擎的研究與實(shí)現(xiàn)[D];大慶石油學(xué)院;2003年
9 薛云;Internet上元搜索引擎的研究與設(shè)計(jì)[D];太原理工大學(xué);2003年
10 陳先;智能搜索引擎關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];哈爾濱工程大學(xué);2003年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 黃少林;王華;張玉紅;蔣一峰;;基于Lucene的索引系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];現(xiàn)代情報(bào);2009年07期
2 王濤;吳潔明;;搜索引擎建立倒排索引的算法研究[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2008年01期
3 王路芳;張虎;;一種面向搜索引擎的基于集合模型的搜索算法[J];山西農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年06期
4 方冰;張一中;;高性能FTP搜索引擎的設(shè)計(jì)[J];南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年03期
5 李棟;史曉東;;一種支持高效檢索的實(shí)時(shí)更新倒排索引策略[J];情報(bào)學(xué)報(bào);2006年01期
6 趙麗紅;維尼拉·木沙江;;維、哈、柯多語種搜索引擎中改進(jìn)索引創(chuàng)建的新方法的構(gòu)思[J];現(xiàn)代計(jì)算機(jī);2011年06期
7 吳文娟;車明;;搜索引擎倒排索引技術(shù)的改進(jìn)[J];微處理機(jī);2006年06期
8 李曉明;單棟棟;;基于文檔重要度的靜態(tài)索引剪枝方法[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年04期
9 匡振國;倪宏;嵇智輝;劉磊;;一種基于Lucene的影片搜索引擎的研究和應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2008年29期
10 易清亮;劉克劍;蔡祖戀;;基于P2P技術(shù)的大型分布式FTP搜索引擎研究[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年01期
相關(guān)會(huì)議論文 前10條
1 維尼拉·木沙江;吳俊森;吐爾根·依布拉音;;維吾爾文搜索引擎的倒排索引設(shè)計(jì)與實(shí)現(xiàn)[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
2 孫宇;劉憬;張宇;劉挺;;基于分詞和倒排索引的短文本檢索技術(shù)的研究與實(shí)現(xiàn)[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2007年學(xué)術(shù)交流年會(huì)論文集[C];2007年
3 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
4 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國中醫(yī)藥信息研究會(huì)第二屆理事大會(huì)暨學(xué)術(shù)交流會(huì)議論文匯編[C];2003年
5 李棟;史曉東;;對搜索引擎中倒排索引更新策略的研究和改進(jìn)[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
6 鄧長壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
7 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
8 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年
9 姚樹宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國開放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集[C];2005年
10 倪俊峰;;基于黃頁搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年
相關(guān)重要報(bào)紙文章 前10條
1 李一鑫;搜索排名的紅與黑[N];財(cái)經(jīng)時(shí)報(bào);2007年
2 周文林;搜狗3.0能否撼動(dòng)搜索市場[N];經(jīng)濟(jì)參考報(bào);2007年
3 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財(cái)經(jīng)日報(bào);2005年
4 賽迪顧問股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;搜索,還是門戶[N];中國計(jì)算機(jī)報(bào);2005年
5 陳珊;浙江移動(dòng)推出手機(jī)搜索引擎服務(wù)[N];人民郵電;2005年
6 趙法忠;搜索引擎還需悠著點(diǎn)[N];中國經(jīng)營報(bào);2005年
7 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報(bào);2006年
8 本報(bào)記者 趙曉輝 孟昭麗;搜索引擎駛?cè)搿氨茱L(fēng)港”[N];中國證券報(bào);2006年
9 孫t;搜索引擎驚喜侵權(quán)官司止于“避風(fēng)港”?[N];第一財(cái)經(jīng)日報(bào);2006年
10 姜蕊;問天下誰識搜索?[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2006年
相關(guān)博士學(xué)位論文 前10條
1 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
2 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
3 岑榮偉;基于用戶行為分析的搜索引擎評價(jià)研究[D];清華大學(xué);2010年
4 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
5 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年
6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
7 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評估研究[D];吉林大學(xué);2010年
8 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
9 白玉琪;空間信息搜索引擎研究[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
10 費(fèi)巍;搜索引擎檢索功能的性能評價(jià)研究[D];武漢大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 吳俊森;維哈柯多語種搜索引擎倒排索引模塊的實(shí)現(xiàn)[D];新疆大學(xué);2007年
2 封俊;基于Hadoop的分布式搜索引擎研究與實(shí)現(xiàn)[D];太原理工大學(xué);2010年
3 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年
4 王珍;維、哈、柯文搜索引擎中的自動(dòng)分類技術(shù)研究[D];新疆大學(xué);2010年
5 劉雪芹;單漢字全文檢索技術(shù)研究[D];河北工業(yè)大學(xué);2005年
6 王穎;中文局域網(wǎng)搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2009年
7 吳寶貴;搜索引擎中索引技術(shù)研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2008年
8 薛云;Internet上元搜索引擎的研究與設(shè)計(jì)[D];太原理工大學(xué);2003年
9 胡曉翠;站點(diǎn)搜索引擎的研究與實(shí)現(xiàn)[D];武漢科技大學(xué);2009年
10 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年
,本文編號:1849408
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1849408.html