基于SolrCloud的網(wǎng)絡(luò)百科檢索服務(wù)的實(shí)現(xiàn)
本文關(guān)鍵詞:基于SolrCloud的網(wǎng)絡(luò)百科檢索服務(wù)的實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:網(wǎng)絡(luò)百科是一部在線百科全書,為用戶提供了資源豐富、內(nèi)容詳實(shí)的網(wǎng)絡(luò)查詢工具。網(wǎng)絡(luò)百科檢索服務(wù)是基于Solr Cloud搭建的檢索平臺(tái),服務(wù)部署在集群上,具有集中式的信息配置、自動(dòng)容錯(cuò)、近實(shí)時(shí)搜索和查詢時(shí)自動(dòng)負(fù)載均衡的特點(diǎn)。本文介紹了Solr Cloud平臺(tái)的搭建方案,結(jié)合數(shù)據(jù)特點(diǎn)設(shè)計(jì)了索引結(jié)構(gòu),增加了中文分詞器和中文詞表,提高了在創(chuàng)建索引和檢索索引過(guò)程中的中文分詞效果。在Solr Cloud平臺(tái)基礎(chǔ)上,本文根據(jù)搜索引擎原理提出了搜索引擎優(yōu)化方案,進(jìn)一步提升了搜索效果。通過(guò)在創(chuàng)建索引時(shí)對(duì)關(guān)鍵字段設(shè)置多顆粒度分詞模式,在檢索索引時(shí)對(duì)不同顆粒度分詞設(shè)置不同的權(quán)重,提高檢索效果;通過(guò)挖掘數(shù)據(jù)內(nèi)在的引用關(guān)系為文檔質(zhì)量評(píng)分,提高優(yōu)質(zhì)文檔在搜索結(jié)果中的排名。實(shí)驗(yàn)數(shù)據(jù)表明,優(yōu)化方法對(duì)網(wǎng)絡(luò)百科檢索服務(wù)效果有很大的提升。
【作者單位】: 北京郵電大學(xué)計(jì)算機(jī)學(xué)院;
【關(guān)鍵詞】: 計(jì)算機(jī)軟件 搜索引擎優(yōu)化 Solr Cloud 中文分詞
【分類號(hào)】:TP391.1
【正文快照】: 0引言1.網(wǎng)絡(luò)百科是一個(gè)包羅萬(wàn)象的在線百科全書,涉及經(jīng)濟(jì)、政治、文化等各個(gè)方面。網(wǎng)絡(luò)百科的主體為詞條,分為中文和英文,由千萬(wàn)量級(jí)的詞條構(gòu)成了龐大的知識(shí)庫(kù),具有很強(qiáng)的知識(shí)性和科普價(jià)值,同時(shí)又鼓勵(lì)用戶參與創(chuàng)建和修改詞條,使網(wǎng)絡(luò)百科在豐富權(quán)威的同時(shí),也具有趣味性和快更新
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 徐樹(shù)振;羅學(xué)禮;王森;楊莉;段嘉杰;張德剛;;企業(yè)非結(jié)構(gòu)化數(shù)據(jù)檢索研究[J];信息技術(shù);2014年04期
2 劉曉婉;胡燕祝;艾新波;;開(kāi)源中文分詞器在web搜索引擎中的應(yīng)用[J];軟件;2013年03期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條
1 徐新愛(ài);;無(wú)人機(jī)海量飛行數(shù)據(jù)快速檢索方法研究[J];計(jì)算機(jī)測(cè)量與控制;2014年12期
2 阮衛(wèi)華;;搜索引擎優(yōu)化技術(shù)的研究與實(shí)現(xiàn)[J];軟件;2014年07期
3 徐治;;Visual C++調(diào)用MATLAB函數(shù)庫(kù)的混合編程技術(shù)[J];軟件;2015年02期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 曹奇峰;基于Nutch的食品安全信息垂直搜索引擎研究[D];杭州電子科技大學(xué);2014年
2 靳佩瑤;基于內(nèi)容的網(wǎng)頁(yè)文本信息過(guò)濾技術(shù)研究[D];西南石油大學(xué);2015年
3 徐康;基于用戶興趣模型的個(gè)性化搜索排序研究[D];浙江理工大學(xué);2015年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前9條
1 程志華;倪時(shí)龍;黃文思;龔賀;;企業(yè)級(jí)非結(jié)構(gòu)化數(shù)據(jù)管理平臺(tái)研究及實(shí)踐[J];電力信息化;2012年03期
2 孫鐵利;劉延吉;;中文分詞技術(shù)的研究現(xiàn)狀與困難[J];信息技術(shù);2009年07期
3 崔杰;李陶深;蘭紅星;;基于Hadoop的海量數(shù)據(jù)存儲(chǔ)平臺(tái)設(shè)計(jì)與開(kāi)發(fā)[J];計(jì)算機(jī)研究與發(fā)展;2012年S1期
4 費(fèi)洪曉,康松林,朱小娟,謝文彪;基于詞頻統(tǒng)計(jì)的中文分詞的研究[J];計(jì)算機(jī)工程與應(yīng)用;2005年07期
5 陳林;楊丹;趙俊芹;;基于語(yǔ)義理解的智能搜索引擎研究[J];計(jì)算機(jī)科學(xué);2008年06期
6 陳紅濤;楊放春;陳磊;;基于大規(guī)模中文搜索引擎的搜索日志挖掘[J];計(jì)算機(jī)應(yīng)用研究;2008年06期
7 李戴維;李寧;;基于Solr的分布式全文檢索系統(tǒng)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)與現(xiàn)代化;2012年11期
8 鄧鵬;李枚毅;何誠(chéng);;Namenode單點(diǎn)故障解決方案研究[J];計(jì)算機(jī)工程;2012年21期
9 林碧英;趙銳;陳良臣;;基于Lucene的全文檢索引擎研究與應(yīng)用[J];計(jì)算機(jī)技術(shù)與發(fā)展;2007年05期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 王小森;基于Solr的搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2011年
2 王茜;基于字符串匹配的中英文混合分詞技術(shù)研究[D];四川師范大學(xué);2011年
3 張新生;基于solr的分布式搜索引擎研究[D];華中科技大學(xué);2012年
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 劉莎;;網(wǎng)絡(luò)百科信息組織模式的調(diào)查[J];圖書館理論與實(shí)踐;2012年05期
2 黃令賀;朱慶華;;網(wǎng)絡(luò)百科用戶貢獻(xiàn)行為研究綜述[J];圖書情報(bào)工作;2013年22期
3 馮凱悅;徐建華;;新世紀(jì)以來(lái)中國(guó)“百科全書”研究分析[J];圖書館雜志;2012年05期
4 宋培彥;路青;趙星;;網(wǎng)絡(luò)百科知識(shí)組織方法研究[J];情報(bào)資料工作;2012年05期
5 劉月學(xué);賈二鵬;;網(wǎng)絡(luò)百科信息生態(tài)鏈構(gòu)成要素與形成機(jī)理研究[J];圖書館學(xué)研究;2014年02期
6 萬(wàn)力勇;;網(wǎng)絡(luò)百科用戶協(xié)同創(chuàng)作的互動(dòng)機(jī)制研究——以百度百科貼吧為例[J];情報(bào)雜志;2014年01期
7 秦卻;;網(wǎng)絡(luò)百科的媒體夢(mèng)[J];新經(jīng)濟(jì)導(dǎo)刊;2010年06期
8 丁玉東;張春峰;劉穎;;期刊論文引用中文Wiki網(wǎng)絡(luò)百科的統(tǒng)計(jì)與分析[J];情報(bào)雜志;2013年03期
9 許博;;網(wǎng)絡(luò)百科全書管理機(jī)制與公眾參與行為研究[J];圖書情報(bào)知識(shí);2011年03期
10 彭程;;傳統(tǒng)百科全書與網(wǎng)絡(luò)百科的比較研究[J];華北水利水電學(xué)院學(xué)報(bào)(社科版);2012年04期
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前3條
1 本報(bào)記者 陶韜;網(wǎng)絡(luò)百科未必權(quán)威準(zhǔn)確[N];江蘇科技報(bào);2014年
2 實(shí)習(xí)生 邱明瑜;有問(wèn)題找百科,,行嗎?[N];中國(guó)文化報(bào);2014年
3 余靖靜 王若陽(yáng) 孟琳;快樂(lè)假期不等于“炫”,高價(jià)夏令營(yíng)遇“寒流”[N];新華每日電訊;2009年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條
1 鄧孛;基于TAM的網(wǎng)絡(luò)信息資源用戶采納影響因素研究[D];云南財(cái)經(jīng)大學(xué);2015年
2 楊欣;國(guó)內(nèi)維基類網(wǎng)絡(luò)百科研究[D];武漢理工大學(xué);2012年
3 戴云海;網(wǎng)絡(luò)口碑與網(wǎng)絡(luò)百科用戶忠誠(chéng)度的關(guān)系研究[D];江西理工大學(xué);2014年
4 楊宇飛;面向中文網(wǎng)絡(luò)百科的屬性關(guān)系抽取研究[D];西南交通大學(xué);2014年
本文關(guān)鍵詞:基于SolrCloud的網(wǎng)絡(luò)百科檢索服務(wù)的實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號(hào):497802
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/497802.html