基于SolrCloud的網(wǎng)絡百科檢索服務的實現(xiàn)
本文關(guān)鍵詞:基于SolrCloud的網(wǎng)絡百科檢索服務的實現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:網(wǎng)絡百科是一部在線百科全書,為用戶提供了資源豐富、內(nèi)容詳實的網(wǎng)絡查詢工具。網(wǎng)絡百科檢索服務是基于Solr Cloud搭建的檢索平臺,服務部署在集群上,具有集中式的信息配置、自動容錯、近實時搜索和查詢時自動負載均衡的特點。本文介紹了Solr Cloud平臺的搭建方案,結(jié)合數(shù)據(jù)特點設計了索引結(jié)構(gòu),增加了中文分詞器和中文詞表,提高了在創(chuàng)建索引和檢索索引過程中的中文分詞效果。在Solr Cloud平臺基礎(chǔ)上,本文根據(jù)搜索引擎原理提出了搜索引擎優(yōu)化方案,進一步提升了搜索效果。通過在創(chuàng)建索引時對關(guān)鍵字段設置多顆粒度分詞模式,在檢索索引時對不同顆粒度分詞設置不同的權(quán)重,提高檢索效果;通過挖掘數(shù)據(jù)內(nèi)在的引用關(guān)系為文檔質(zhì)量評分,提高優(yōu)質(zhì)文檔在搜索結(jié)果中的排名。實驗數(shù)據(jù)表明,優(yōu)化方法對網(wǎng)絡百科檢索服務效果有很大的提升。
【作者單位】: 北京郵電大學計算機學院;
【關(guān)鍵詞】: 計算機軟件 搜索引擎優(yōu)化 Solr Cloud 中文分詞
【分類號】:TP391.1
【正文快照】: 0引言1.網(wǎng)絡百科是一個包羅萬象的在線百科全書,涉及經(jīng)濟、政治、文化等各個方面。網(wǎng)絡百科的主體為詞條,分為中文和英文,由千萬量級的詞條構(gòu)成了龐大的知識庫,具有很強的知識性和科普價值,同時又鼓勵用戶參與創(chuàng)建和修改詞條,使網(wǎng)絡百科在豐富權(quán)威的同時,也具有趣味性和快更新
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 徐樹振;羅學禮;王森;楊莉;段嘉杰;張德剛;;企業(yè)非結(jié)構(gòu)化數(shù)據(jù)檢索研究[J];信息技術(shù);2014年04期
2 劉曉婉;胡燕祝;艾新波;;開源中文分詞器在web搜索引擎中的應用[J];軟件;2013年03期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 徐新愛;;無人機海量飛行數(shù)據(jù)快速檢索方法研究[J];計算機測量與控制;2014年12期
2 阮衛(wèi)華;;搜索引擎優(yōu)化技術(shù)的研究與實現(xiàn)[J];軟件;2014年07期
3 徐治;;Visual C++調(diào)用MATLAB函數(shù)庫的混合編程技術(shù)[J];軟件;2015年02期
中國碩士學位論文全文數(shù)據(jù)庫 前3條
1 曹奇峰;基于Nutch的食品安全信息垂直搜索引擎研究[D];杭州電子科技大學;2014年
2 靳佩瑤;基于內(nèi)容的網(wǎng)頁文本信息過濾技術(shù)研究[D];西南石油大學;2015年
3 徐康;基于用戶興趣模型的個性化搜索排序研究[D];浙江理工大學;2015年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前9條
1 程志華;倪時龍;黃文思;龔賀;;企業(yè)級非結(jié)構(gòu)化數(shù)據(jù)管理平臺研究及實踐[J];電力信息化;2012年03期
2 孫鐵利;劉延吉;;中文分詞技術(shù)的研究現(xiàn)狀與困難[J];信息技術(shù);2009年07期
3 崔杰;李陶深;蘭紅星;;基于Hadoop的海量數(shù)據(jù)存儲平臺設計與開發(fā)[J];計算機研究與發(fā)展;2012年S1期
4 費洪曉,康松林,朱小娟,謝文彪;基于詞頻統(tǒng)計的中文分詞的研究[J];計算機工程與應用;2005年07期
5 陳林;楊丹;趙俊芹;;基于語義理解的智能搜索引擎研究[J];計算機科學;2008年06期
6 陳紅濤;楊放春;陳磊;;基于大規(guī)模中文搜索引擎的搜索日志挖掘[J];計算機應用研究;2008年06期
7 李戴維;李寧;;基于Solr的分布式全文檢索系統(tǒng)的研究與實現(xiàn)[J];計算機與現(xiàn)代化;2012年11期
8 鄧鵬;李枚毅;何誠;;Namenode單點故障解決方案研究[J];計算機工程;2012年21期
9 林碧英;趙銳;陳良臣;;基于Lucene的全文檢索引擎研究與應用[J];計算機技術(shù)與發(fā)展;2007年05期
中國碩士學位論文全文數(shù)據(jù)庫 前3條
1 王小森;基于Solr的搜索引擎的設計與實現(xiàn)[D];北京郵電大學;2011年
2 王茜;基于字符串匹配的中英文混合分詞技術(shù)研究[D];四川師范大學;2011年
3 張新生;基于solr的分布式搜索引擎研究[D];華中科技大學;2012年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉莎;;網(wǎng)絡百科信息組織模式的調(diào)查[J];圖書館理論與實踐;2012年05期
2 黃令賀;朱慶華;;網(wǎng)絡百科用戶貢獻行為研究綜述[J];圖書情報工作;2013年22期
3 馮凱悅;徐建華;;新世紀以來中國“百科全書”研究分析[J];圖書館雜志;2012年05期
4 宋培彥;路青;趙星;;網(wǎng)絡百科知識組織方法研究[J];情報資料工作;2012年05期
5 劉月學;賈二鵬;;網(wǎng)絡百科信息生態(tài)鏈構(gòu)成要素與形成機理研究[J];圖書館學研究;2014年02期
6 萬力勇;;網(wǎng)絡百科用戶協(xié)同創(chuàng)作的互動機制研究——以百度百科貼吧為例[J];情報雜志;2014年01期
7 秦卻;;網(wǎng)絡百科的媒體夢[J];新經(jīng)濟導刊;2010年06期
8 丁玉東;張春峰;劉穎;;期刊論文引用中文Wiki網(wǎng)絡百科的統(tǒng)計與分析[J];情報雜志;2013年03期
9 許博;;網(wǎng)絡百科全書管理機制與公眾參與行為研究[J];圖書情報知識;2011年03期
10 彭程;;傳統(tǒng)百科全書與網(wǎng)絡百科的比較研究[J];華北水利水電學院學報(社科版);2012年04期
中國重要報紙全文數(shù)據(jù)庫 前3條
1 本報記者 陶韜;網(wǎng)絡百科未必權(quán)威準確[N];江蘇科技報;2014年
2 實習生 邱明瑜;有問題找百科,,行嗎?[N];中國文化報;2014年
3 余靖靜 王若陽 孟琳;快樂假期不等于“炫”,高價夏令營遇“寒流”[N];新華每日電訊;2009年
中國碩士學位論文全文數(shù)據(jù)庫 前4條
1 鄧孛;基于TAM的網(wǎng)絡信息資源用戶采納影響因素研究[D];云南財經(jīng)大學;2015年
2 楊欣;國內(nèi)維基類網(wǎng)絡百科研究[D];武漢理工大學;2012年
3 戴云海;網(wǎng)絡口碑與網(wǎng)絡百科用戶忠誠度的關(guān)系研究[D];江西理工大學;2014年
4 楊宇飛;面向中文網(wǎng)絡百科的屬性關(guān)系抽取研究[D];西南交通大學;2014年
本文關(guān)鍵詞:基于SolrCloud的網(wǎng)絡百科檢索服務的實現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號:497802
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/497802.html