分布式數(shù)據(jù)庫搜索引擎的索引建立和優(yōu)化
本文選題:分布式 + 數(shù)據(jù)庫搜索引擎。 參考:《計算機工程》2008年18期
【摘要】:對于使用數(shù)據(jù)的用戶來說,能找到準確的數(shù)據(jù)且沒有遺漏是一件非常困難的事。為了較好地滿足用戶需求,該文提出了利用分布式數(shù)據(jù)庫搜索引擎架構來實現(xiàn)智能化的搜索和定位。通過建立和優(yōu)化索引,并使用適當?shù)呐判蛩惴?搜索引擎能將最貼近用戶需要的結果排在其他結果之前,從而提高搜索引擎的檢索效率、查全率和查精率。實驗表明,該引擎的查全率為90.02%,查精率為89.78%。
[Abstract]:It is difficult for users to find accurate data without missing it. In order to meet the needs of users, this paper proposes a distributed database search engine architecture to achieve intelligent search and location. By establishing and optimizing the index and using the proper sorting algorithm, the search engine can rank the results closest to the users' needs before the other results, thus improving the search engine's retrieval efficiency, recall and precision rate. The experimental results show that the recall rate of the engine is 90.02 and the precision rate is 89.78.
【作者單位】: 解放軍理工大學工程兵工程學院;
【基金】:國家自然科學基金資助項目(70371039)
【分類號】:TP311.13
【參考文獻】
相關期刊論文 前3條
1 彭波;;大規(guī)模搜索引擎檢索系統(tǒng)框架與實現(xiàn)要點[J];計算機工程與科學;2006年03期
2 張曉衛(wèi);朱巧明;;一種基于Lucene的Web全文信息檢索系統(tǒng)的設計與實現(xiàn)[J];計算機與現(xiàn)代化;2006年12期
3 周瑛;劉政怡;;覆蓋算法在文本分類中的應用[J];情報理論與實踐;2006年01期
【共引文獻】
相關期刊論文 前1條
1 劉慧婷;倪志偉;李建洋;劉政怡;;基于交叉覆蓋算法的時間序列模式匹配[J];計算機應用;2007年02期
相關博士學位論文 前1條
1 鄭婷婷;隨機商分形模型及其在蛋白質(zhì)分析中的應用[D];安徽大學;2007年
相關碩士學位論文 前10條
1 李文澤;個性化垂直搜索引擎研究[D];河南大學;2007年
2 陳艷平;基于Web的農(nóng)作物遠程診斷系統(tǒng)分析與設計[D];重慶大學;2006年
3 竇亞君;Luder基于內(nèi)容的文檔搜索引擎[D];天津工業(yè)大學;2007年
4 姜華;基于Lucene面向主題搜索引擎的研究與設計[D];華東師范大學;2007年
5 李四達;全文索引引擎Lucene的研究及其手機中的應用實現(xiàn)[D];華北電力大學(北京);2007年
6 劉琳;校園網(wǎng)搜索引擎系統(tǒng)的設計與實現(xiàn)[D];山東大學;2007年
7 馮月;基于專業(yè)搜索引擎網(wǎng)絡蜘蛛搜索策略研究[D];電子科技大學;2007年
8 劉芳芳;電子政務標準化工作平臺的設計與開發(fā)[D];北京化工大學;2007年
9 黃杰;基于Lucene的全文檢索系統(tǒng)模型的研究[D];暨南大學;2007年
10 周漢民;基于角色的全文檢索技術的研究和實現(xiàn)[D];蘇州大學;2007年
【二級參考文獻】
相關期刊論文 前5條
1 王建勇,單松巍,雷鳴,謝正茂,李曉明;海量Web搜索引擎系統(tǒng)中用戶行為的分布特征及其啟示[J];中國科學E輯;2001年04期
2 馮是聰,張志剛,李曉明;一種中文網(wǎng)頁自動分類方法的實現(xiàn)及應用[J];計算機工程;2004年05期
3 錢鐵云,王元珍,馮小年;結合類頻率的關聯(lián)中文文本分類[J];中文信息學報;2004年06期
4 楊文清,黃宜華,張福炎;中文Web文檔庫全文檢索技術研究與實現(xiàn)[J];中文信息學報;1999年04期
5 張鈴,張鈸;M-P神經(jīng)元模型的幾何意義及其應用[J];軟件學報;1998年05期
【相似文獻】
相關期刊論文 前10條
1 蔣本天;賀楠;邢愷;史國良;;基于RNN的數(shù)據(jù)分片技術的研究[J];佳木斯教育學院學報;2011年04期
2 趙昕;崔靜;;基于分布式數(shù)據(jù)庫的高校設備管理系統(tǒng)的設計與實現(xiàn)[J];計算機與現(xiàn)代化;2011年07期
3 何坤;;基于內(nèi)存數(shù)據(jù)庫的分布式數(shù)據(jù)庫架構[J];程序員;2010年07期
4 何波;;快速挖掘分布式數(shù)據(jù)庫全局最大頻繁項集[J];控制與決策;2011年08期
5 李嬌;劉全;傅啟明;王庭鋼;;分布式數(shù)據(jù)庫中基于局部CON模型的記錄匹配方法[J];通信學報;2011年07期
6 李紅;劉志杰;謝曉堯;;Oracle分布式數(shù)據(jù)庫系統(tǒng)及網(wǎng)絡安全策略研究[J];貴州師范大學學報(自然科學版);2011年03期
7 岑賢生;楊志;梁麗;麥冬;;分布式數(shù)據(jù)庫中間件系統(tǒng)在制糖企業(yè)信息化中的應用研究[J];廣西輕工業(yè);2011年08期
8 單楠;張紹杰;徐媛媛;金慧;;民機機電綜合控制系統(tǒng)數(shù)字仿真平臺[J];電氣時代;2011年08期
9 劉智琦;徐奕奕;;XML在電子商務中的應用[J];黑龍江科技信息;2011年20期
10 吳春雷;崔學榮;;一種基于程序控制的Web系統(tǒng)數(shù)據(jù)傳輸方法[J];科學技術與工程;2011年21期
相關會議論文 前10條
1 杜方;劉利萍;蒙應杰;趙書城;;基于分布式數(shù)據(jù)庫的物流系統(tǒng)的設計和實現(xiàn)[A];第十八屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2001年
2 杜會林;袁小京;;分布式數(shù)據(jù)庫在油田中的應用[A];第十屆全國數(shù)據(jù)庫學術會議論文集[C];1992年
3 習新魁;張斌;鄭懷遠;;基于客戶/服務器模型的分布式數(shù)據(jù)庫中復制字典系統(tǒng)的設計與實現(xiàn)[A];數(shù)據(jù)庫研究與進展95——第十三屆全國數(shù)據(jù)庫學術會議論文集[C];1995年
4 蘆禮祥;高俊;何守才;;分布式數(shù)據(jù)庫中死鎖檢測[A];第十屆全國數(shù)據(jù)庫學術會議論文集[C];1992年
5 許智君;葉新銘;張s,
本文編號:2036615
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2036615.html