基于Solr技術(shù)的專利檢索系統(tǒng)設(shè)計與實現(xiàn)
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1用戶檢索流程
具體要點如下:1)系統(tǒng)中包含語法儲存庫,與詞匯庫相結(jié)合后,對句子中的詞匯進(jìn)行分析2)包含詞匯儲存庫,將使用較為廣泛的詞匯搭配方式、使用頻率較高的詞庫中;3)具有較寬的詞匯量,設(shè)置專業(yè)詞匯庫,從而實現(xiàn)專業(yè)文獻(xiàn)的搜索;4)若句子無法進(jìn)行分詞,可以將句子中的每個字作為詞匯進(jìn)行分....
圖2-2全文檢索系統(tǒng)架構(gòu)圖
了該搜索方式。排名查詢RankedQuery的使用范圍較大,通過向量空間模型算法、概率模型算法等對文檔、關(guān)鍵詞之間的相關(guān)度進(jìn)行計算,同時依據(jù)相關(guān)度的高低進(jìn)行搜索結(jié)果的排列,將相關(guān)度排名的前一百條消息返回給用戶,用戶可以設(shè)置消息返回數(shù)量。2.2.3全文檢索全文數(shù)據(jù)庫是全文檢....
圖2-3全文檢索流程圖
用于全文搜索和搜索。使用Lucene實現(xiàn)全文搜索的開發(fā),其能夠提供具有強(qiáng)大功能的應(yīng)用程序界面[6]。Lucene屬于Java中的免費(fèi)開源工具,發(fā)展較為成熟,是目前Java中最受歡迎的工具。雖然信息檢索庫與搜索引擎有關(guān),但不應(yīng)混淆[9]。2.3.1Lucene實現(xiàn)....
圖2-4詞典結(jié)構(gòu)圖
圖2-4詞典結(jié)構(gòu)圖要。詞典結(jié)構(gòu)有很多種,每種都有各自的優(yōu)缺點組,通過二進(jìn)制搜索方法檢索數(shù)據(jù),并且有哈希,但需要更高的性能來支持TB級數(shù)據(jù)的倒排索圖列出了一些常用字典的優(yōu)缺點。如表2-1所示表2-1數(shù)據(jù)結(jié)構(gòu)對比表優(yōu)缺點實現(xiàn)簡單,但性能差性能高,內(nèi)存消耗大占用內(nèi)存....
本文編號:3978242
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3978242.html