高性能FTP搜索引擎的設(shè)計(jì)
本文選題:FTP 切入點(diǎn):搜索引擎 出處:《南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版)》2007年03期
【摘要】:FTP(file transfer protcol)搜索引擎的重點(diǎn)在于中文分詞技術(shù)和檢索技術(shù)。使用了一種面向FTP搜索優(yōu)化的最大前向匹配分詞算法,并將用戶查詢作為反饋來更新分詞算法中所使用的字典,結(jié)合倒排索引技術(shù)實(shí)現(xiàn)了一個(gè)高性能的FTP搜索引擎的原型系統(tǒng)。壓力測試結(jié)果表明此FTP搜索引擎具有很高的性能。
[Abstract]:FTP(file transfer protcoll search engine focuses on Chinese word segmentation and retrieval technology.In this paper, a maximum forward matching segmentation algorithm for FTP search optimization is used, and the user query is used as feedback to update the dictionary used in the segmentation algorithm. A high performance prototype system of FTP search engine is implemented with inverted index technology.The stress test results show that the FTP search engine has high performance.
【作者單位】: 南京郵電大學(xué)通信與信息工程學(xué)院 東南大學(xué)無線電工程系
【分類號】:TP393.093
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 王顯芳,杜利民;一種能夠檢測所有交叉歧義的漢語分詞算法[J];電子學(xué)報(bào);2004年01期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳曉明;梁雄友;;一種實(shí)用的PCFG多階段全局尋優(yōu)句法分析算法[J];長春理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年02期
2 肖紅;劉淑華;;一種文本多級分類方法研究[J];長江大學(xué)學(xué)報(bào)(自然科學(xué)版)理工卷;2008年02期
3 于源,衣襲;中文全切分快速分詞方法[J];大連鐵道學(xué)院學(xué)報(bào);2005年02期
4 謝紅薇;王棟;;基于Web文本挖掘中的一種中文分詞算法研究[J];電腦開發(fā)與應(yīng)用;2007年07期
5 鄭志波;;搜索器的設(shè)計(jì)與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年01期
6 郭屹;;對中文自動(dòng)分詞機(jī)制的研究和改進(jìn)[J];電腦知識(shí)與技術(shù);2008年07期
7 邵晶,黨海峰,白慧先,鄭慶華;OPAC資源與網(wǎng)絡(luò)教育資源共享集成關(guān)鍵技術(shù)研究[J];大學(xué)圖書館學(xué)報(bào);2005年03期
8 蔡勇智;基于最大匹配分詞算法的中文詞語粗分模型[J];福建電腦;2005年09期
9 和海蓮;曾玉華;;向量空間模型中的用戶模型建立方法探討[J];福建電腦;2007年07期
10 席生長;胡宏濤;;信息檢索技術(shù)在中石油勘探與生產(chǎn)分公司門戶內(nèi)的應(yīng)用研究[J];福建電腦;2008年01期
相關(guān)會(huì)議論文 前4條
1 馬春雷;;基于向量空間模型的中文文本檢索研究[A];2007年河北省電子學(xué)會(huì)、河北省計(jì)算機(jī)學(xué)會(huì)、河北省自動(dòng)化學(xué)會(huì)、河北省人工智能學(xué)會(huì)、河北省計(jì)算機(jī)輔助設(shè)計(jì)研究會(huì)、河北省軟件行業(yè)協(xié)會(huì)聯(lián)合學(xué)術(shù)年會(huì)論文集[C];2007年
2 陳曉;;中文文本自動(dòng)分詞研究述要[A];第四屆全國語言文字應(yīng)用學(xué)術(shù)研討會(huì)論文集[C];2005年
3 王虎;王潛平;;對整詞二分自動(dòng)分詞機(jī)制的改進(jìn)[A];中國計(jì)算技術(shù)與語言問題研究——第七屆中文信息處理國際會(huì)議論文集[C];2007年
4 張玉連;張敏;張波;;一種無詞典分詞方法的分析與研究[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
相關(guān)博士學(xué)位論文 前5條
1 孫越恒;基于統(tǒng)計(jì)的NLP技術(shù)在中文信息檢索中的應(yīng)用研究[D];天津大學(xué);2005年
2 馮敏萱;論漢英平行語料的平行處理[D];南京師范大學(xué);2006年
3 姜韶華;科研項(xiàng)目管理中的文本挖掘方法研究及應(yīng)用[D];大連理工大學(xué);2006年
4 楊傳耀;中文信息檢索索引模型及相關(guān)技術(shù)研究[D];復(fù)旦大學(xué);2007年
5 劉政怡;中文整句智能輸入方法研究[D];安徽大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 劉洋;基于本體的醫(yī)保審計(jì)知識(shí)庫構(gòu)建研究[D];哈爾濱工程大學(xué);2010年
2 徐德玉;中文文檔內(nèi)容相似度檢測方法研究[D];長春工業(yè)大學(xué);2010年
3 蔡蕊;一種新的搜索引擎分詞詞典的研究[D];山東大學(xué);2010年
4 王軍;中文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2004年
5 楊超;基于最大匹配的書面漢語自動(dòng)分詞研究[D];湖南大學(xué);2004年
6 朱軍;中文垃圾郵件過濾技術(shù)研究及應(yīng)用[D];合肥工業(yè)大學(xué);2005年
7 崔飛虎;一種多Agent的個(gè)性化信息檢索系統(tǒng)的研究與設(shè)計(jì)[D];中國人民解放軍信息工程大學(xué);2005年
8 張曉淼;基于神經(jīng)網(wǎng)絡(luò)的中文分詞算法的研究[D];大連理工大學(xué);2006年
9 張博;基于內(nèi)容安全的中文網(wǎng)頁過濾系統(tǒng)[D];西安電子科技大學(xué);2006年
10 沈斌;基于分詞的中文文本相似度計(jì)算研究[D];天津財(cái)經(jīng)大學(xué);2006年
【二級參考文獻(xiàn)】
相關(guān)碩士學(xué)位論文 前1條
1 趙鵬;基于數(shù)據(jù)壓縮的信息檢索技術(shù)的研究[D];黑龍江大學(xué);2002年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 鈕焱;黎冬;;基于客戶反饋的FTP搜索引擎模型設(shè)計(jì)[J];湖北工業(yè)大學(xué)學(xué)報(bào);2008年05期
2 黃曉梅;王浩;;千萬級FTP搜索引擎數(shù)據(jù)庫索引的設(shè)計(jì)方法探討[J];考試周刊;2008年11期
3 李俊青;季文天;彭菊萍;;局域網(wǎng)FTP搜索引擎的建立[J];計(jì)算機(jī)與信息技術(shù);2007年09期
4 王萍;蘇莉英;陳曉紅;;基于Web的FTP搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)時(shí)代;2005年12期
5 汪劍;牟奇春;王霖;萬蓉;;基于SQL Server的FTP搜索引擎系統(tǒng)的設(shè)計(jì)[J];軟件導(dǎo)刊;2008年06期
6 盛啟東;譚守標(biāo);徐超;馮二媛;陳軍寧;;巧用黑盒法逆推百度中文分詞算法[J];計(jì)算機(jī)技術(shù)與發(fā)展;2010年04期
7 賈永慶;一種FTP搜索引擎的研究與實(shí)踐[J];武漢職業(yè)技術(shù)學(xué)院學(xué)報(bào);2005年05期
8 陳金龍;;分布式FTP并行搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)時(shí)代;2008年07期
9 李華英;軒春青;;基于WEB的文件搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[J];福建電腦;2011年06期
10 易清亮;劉克劍;蔡祖戀;;基于P2P技術(shù)的大型分布式FTP搜索引擎研究[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年01期
相關(guān)會(huì)議論文 前10條
1 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
2 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國中醫(yī)藥信息研究會(huì)第二屆理事大會(huì)暨學(xué)術(shù)交流會(huì)議論文匯編[C];2003年
3 鄧長壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
4 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識(shí)庫建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
5 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年
6 姚樹宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國開放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集[C];2005年
7 倪俊峰;;基于黃頁搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年
8 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2010年
9 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年
10 楊萌;李春麗;朱明;;網(wǎng)絡(luò)搜索技術(shù)下的編輯工作[A];學(xué)報(bào)編輯論叢(第十一集)[C];2003年
相關(guān)重要報(bào)紙文章 前10條
1 李一鑫;搜索排名的紅與黑[N];財(cái)經(jīng)時(shí)報(bào);2007年
2 周文林;搜狗3.0能否撼動(dòng)搜索市場[N];經(jīng)濟(jì)參考報(bào);2007年
3 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財(cái)經(jīng)日報(bào);2005年
4 賽迪顧問股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;搜索,,還是門戶[N];中國計(jì)算機(jī)報(bào);2005年
5 陳珊;浙江移動(dòng)推出手機(jī)搜索引擎服務(wù)[N];人民郵電;2005年
6 趙法忠;搜索引擎還需悠著點(diǎn)[N];中國經(jīng)營報(bào);2005年
7 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報(bào);2006年
8 本報(bào)記者 趙曉輝 孟昭麗;搜索引擎駛?cè)搿氨茱L(fēng)港”[N];中國證券報(bào);2006年
9 孫t;搜索引擎驚喜侵權(quán)官司止于“避風(fēng)港”?[N];第一財(cái)經(jīng)日報(bào);2006年
10 姜蕊;問天下誰識(shí)搜索?[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2006年
相關(guān)博士學(xué)位論文 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評價(jià)研究[D];清華大學(xué);2010年
2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
5 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
6 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評估研究[D];吉林大學(xué);2010年
7 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
8 白玉琪;空間信息搜索引擎研究[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
9 費(fèi)巍;搜索引擎檢索功能的性能評價(jià)研究[D];武漢大學(xué);2010年
10 黃河;農(nóng)業(yè)復(fù)雜自適應(yīng)搜索模型研究及實(shí)現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 曹仲偉;FTP搜索引擎的關(guān)鍵技術(shù)研究[D];湖北工業(yè)大學(xué);2011年
2 徐財(cái)應(yīng);基于Lucene的搜索引擎技術(shù)的研究與改進(jìn)[D];長春理工大學(xué);2010年
3 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年
4 馬東;基于Nutch搜索引擎的中文分詞算法研究與實(shí)現(xiàn)[D];內(nèi)蒙古農(nóng)業(yè)大學(xué);2011年
5 薛云;Internet上元搜索引擎的研究與設(shè)計(jì)[D];太原理工大學(xué);2003年
6 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年
7 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實(shí)現(xiàn)和優(yōu)化[D];吉林大學(xué);2011年
8 董晨;基于模糊聚類的個(gè)性化搜索引擎的研究[D];福州大學(xué);2005年
9 封俊;基于Hadoop的分布式搜索引擎研究與實(shí)現(xiàn)[D];太原理工大學(xué);2010年
10 李浩;分布式教育網(wǎng)信息檢索系統(tǒng)的研究和實(shí)現(xiàn)[D];華南理工大學(xué);2010年
本文編號:1720110
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1720110.html