Nutch搜索引擎的公安應(yīng)用研究
本文關(guān)鍵詞:Nutch搜索引擎的公安應(yīng)用研究
更多相關(guān)文章: 搜索引擎 Nutch 網(wǎng)絡(luò)輿情 信息搜索
【摘要】:網(wǎng)絡(luò)"爬蟲"作為網(wǎng)絡(luò)信息搜索的工具,在網(wǎng)絡(luò)輿情管控、搜查中起著至關(guān)重要的作用。隨著互聯(lián)網(wǎng)的廣泛普及,網(wǎng)絡(luò)中不安全因素、不和諧因素日益增多,使用百度等商業(yè)搜索引擎已經(jīng)不能滿足日益增長的公安輿情信息監(jiān)控工作需求。在介紹搜索引擎工作原理的基礎(chǔ)上,詳細(xì)分析了Nutch的工作機制,并與商業(yè)搜索引擎進(jìn)行了比對分析,實驗結(jié)果表明了商業(yè)搜索引擎在公安應(yīng)用中的局限性,在特定的公安應(yīng)用背景下,在搜索精度、結(jié)果排序方面,Nutch要優(yōu)于商業(yè)搜索引擎。
【作者單位】: 中國刑警學(xué)院;大連市公安局西崗分局;
【關(guān)鍵詞】: 搜索引擎 Nutch 網(wǎng)絡(luò)輿情 信息搜索
【基金】:公安部公安理論及軟科學(xué)研究項目(編號:2012LLYJXJXY052) 遼寧省教育科學(xué)“十二五”規(guī)劃立項課題(編號:JG14db440)
【分類號】:TP391.3
【正文快照】: Nutch是Apache公司推出的一款用JAVA語言編寫的支持分布式的開源網(wǎng)絡(luò)爬蟲軟件,它提供了用戶構(gòu)建網(wǎng)絡(luò)搜索引擎的全部工具。Nutch性能卓越,構(gòu)建簡易,功能強大。當(dāng)下,海量的、復(fù)雜的輿情信息充斥在網(wǎng)絡(luò)間,如何快速、精確地找到網(wǎng)絡(luò)輿情信息是對公安工作的重大考驗;贜utch網(wǎng)絡(luò)
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 黃德才;戚華春;;PageRank算法研究[J];計算機工程;2006年04期
2 龔磊;武友新;;Lucene全文檢索系統(tǒng)的研究與實現(xiàn)[J];計算機與數(shù)字工程;2010年05期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 鐘斌青;劉湘南;;基于空間化PageRank算法的人口流動空間集聚性分析[J];地理與地理信息科學(xué);2011年05期
2 張玉寶;;中文搜索引擎的原理及相關(guān)技術(shù)分析[J];福建電腦;2008年01期
3 肖卓磊;;搜索引擎作弊及反作弊技術(shù)探究[J];阜陽師范學(xué)院學(xué)報(自然科學(xué)版);2011年04期
4 王向陽;馬軍;;一個基于PageRank的科技文獻(xiàn)質(zhì)量評價算法[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2009年01期
5 吳迪;周利娟;林鴻飛;;基于隨機游走的就業(yè)推薦系統(tǒng)研究與實現(xiàn)[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2011年01期
6 梁迪龍;;云計算技術(shù)發(fā)展分析及其應(yīng)用探討[J];電腦知識與技術(shù);2012年19期
7 連雁平;章甲午;;網(wǎng)絡(luò)蜘蛛模擬系統(tǒng)分析與設(shè)計[J];安陽工學(xué)院學(xué)報;2012年06期
8 周豐;;基于用戶查詢偏好的搜索排序算法[J];電腦知識與技術(shù);2013年11期
9 張皓;王玉龍;;一種網(wǎng)站分析系統(tǒng)的設(shè)計方案[J];電信網(wǎng)技術(shù);2013年10期
10 劉喜文;鄭昌興;王文龍;湯剛強;;構(gòu)建數(shù)據(jù)倉庫過程中的數(shù)據(jù)清洗研究[J];圖書與情報;2013年05期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 徐曉東;郭燕慧;;AppStore應(yīng)用信息自動化采集系統(tǒng)設(shè)計與實現(xiàn)[A];2013年中國信息通信研究新進(jìn)展論文集[C];2014年
2 徐曉東;郭燕慧;;App Store應(yīng)用信息自動化采集系統(tǒng)設(shè)計與實現(xiàn)[A];2013年中國信息通信研究新進(jìn)展論文集[C];2014年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 李強;基于本體論的個性化和社會化元搜索引擎的研究[D];浙江大學(xué);2006年
2 陳紅濤;基于搜索日志的用戶行為研究及應(yīng)用[D];北京郵電大學(xué);2008年
3 劉馨月;Web挖掘中的鏈接分析與話題檢測研究[D];大連理工大學(xué);2012年
4 馬飛;云數(shù)據(jù)中心中虛擬機放置和實時遷移研究[D];北京交通大學(xué);2013年
5 樂承毅;企業(yè)知識與員工知識貢獻(xiàn)度集成評價方法及應(yīng)用研究[D];浙江大學(xué);2013年
6 孫甲申;基于主題模型和隨機游走的標(biāo)簽技術(shù)研究[D];北京郵電大學(xué);2013年
7 張鵬;數(shù)據(jù)中心網(wǎng)絡(luò)的流量管理和優(yōu)化問題研究[D];北京郵電大學(xué);2013年
8 龔書;抽取式多文檔文摘的文本表示研究[D];北京交通大學(xué);2013年
9 尹莉;基礎(chǔ)數(shù)學(xué)領(lǐng)域作者合作網(wǎng)絡(luò)實證分析[D];西北大學(xué);2013年
10 李朋;異構(gòu)信息網(wǎng)絡(luò)分析模型及其應(yīng)用研究[D];重慶大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 吳迪;高校畢業(yè)生就業(yè)推薦系統(tǒng)的設(shè)計與開發(fā)[D];大連理工大學(xué);2010年
2 龔磊;統(tǒng)一數(shù)據(jù)交換平臺的研究與應(yīng)用[D];南昌大學(xué);2010年
3 李娟;電信公司薪酬管理系統(tǒng)的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2010年
4 周志剛;數(shù)據(jù)挖掘技術(shù)在計算機取證的研究[D];大連交通大學(xué);2010年
5 范先爽;基于個性化服務(wù)的汽車信息搜索引擎的研究[D];武漢理工大學(xué);2011年
6 陳凱;搜索引擎有關(guān)排序算法研究[D];武漢理工大學(xué);2011年
7 涂能彬;圖書館檢索系統(tǒng)中圖書推薦技術(shù)的研究[D];暨南大學(xué);2011年
8 郭笑笑;基于雙結(jié)構(gòu)網(wǎng)絡(luò)的信息準(zhǔn)實時公平共享系統(tǒng)的設(shè)計與實現(xiàn)[D];湖北師范學(xué)院;2011年
9 李宜兵;基于搜索引擎網(wǎng)頁排序算法研究[D];沈陽理工大學(xué);2011年
10 金川明;垂直搜索引擎研究與實現(xiàn)[D];云南大學(xué);2011年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前8條
1 徐海;李軍民;;基于LUCENE的站內(nèi)搜索的研究與實現(xiàn)[J];河北軟件職業(yè)技術(shù)學(xué)院學(xué)報;2009年01期
2 張嶺,馬范援;加速評估算法:一種提高Web結(jié)構(gòu)挖掘質(zhì)量的新方法[J];計算機研究與發(fā)展;2004年01期
3 宋佳;諸云強;劉潤達(dá);;一種基于Lucene改進(jìn)的全文檢索工具包[J];計算機工程與應(yīng)用;2008年04期
4 嚴(yán)良達(dá);;基于Lucene搜索引擎的設(shè)計與實現(xiàn)[J];寧波職業(yè)技術(shù)學(xué)院學(xué)報;2009年02期
5 周錦程;王丹;;基于Lucene的全文搜索引擎研究與應(yīng)用[J];黔南民族師范學(xué)院學(xué)報;2009年03期
6 宋聚平,王永成,尹中航,滕偉;對網(wǎng)頁PageRank算法的改進(jìn)[J];上海交通大學(xué)學(xué)報;2003年03期
7 王鵑;洪承煜;沈哲;;基于Compass框架的電子商務(wù)網(wǎng)站搜索引擎設(shè)計[J];現(xiàn)代計算機(專業(yè)版);2009年02期
8 黃少林;王華;張玉紅;蔣一峰;;基于Lucene的索引系統(tǒng)的設(shè)計與實現(xiàn)[J];現(xiàn)代情報;2009年07期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 嚴(yán)春來;;基于Nutch的個性化搜索引擎的研究與探討[J];電腦編程技巧與維護(hù);2014年04期
2 夏天;;Nutch的插件機制分析[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2010年01期
3 馬睿;黃穗;;基于補償?shù)腘utch搜索引擎的設(shè)計與實現(xiàn)[J];科學(xué)技術(shù)與工程;2011年34期
4 李村合;呂克強;;Nutch搜索引擎的頁面排序修改方法研究[J];計算機工程與設(shè)計;2009年06期
5 顧s,
本文編號:1117964
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1117964.html