基于Lucene搜索引擎的涉恐信息檢索模塊設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-10-05 15:30
互聯(lián)網(wǎng)中存在大量涉恐信息,加強(qiáng)對(duì)這些信息的組織與利用,在防恐、反恐中起著重要的作用。針對(duì)網(wǎng)絡(luò)涉恐信息零散情況,通過(guò)網(wǎng)絡(luò)爬蟲技術(shù)收集互聯(lián)網(wǎng)上的涉恐信息,構(gòu)建涉恐信息數(shù)據(jù)庫(kù);在此基礎(chǔ)上,引入中文分詞器進(jìn)行合理粒度分詞,使用Lucene構(gòu)建全文搜索引擎以提升檢索效率。同時(shí),在建立索引時(shí)根據(jù)文檔包含涉恐信息特征詞匯的數(shù)量改變權(quán)重,查詢時(shí)包含多特征詞匯的涉恐信息排序更靠前。系統(tǒng)采用Python進(jìn)行信息采集和數(shù)據(jù)結(jié)構(gòu)化,使用MySQL構(gòu)建涉恐信息數(shù)據(jù)庫(kù),通過(guò)Lucene構(gòu)建全文檢索引擎,測(cè)試表明,該引擎能夠快速、準(zhǔn)確地完成信息檢索。
【文章來(lái)源】:信息技術(shù)與網(wǎng)絡(luò)安全. 2019,38(11)
【文章頁(yè)數(shù)】:6 頁(yè)
【文章目錄】:
0 引言
1 系統(tǒng)總體架構(gòu)
2 涉恐信息爬蟲及數(shù)據(jù)庫(kù)建立
2.1 涉恐信息爬蟲
2.2 涉恐信息分類與實(shí)體抽取
2.3 數(shù)據(jù)庫(kù)建立
3 全文搜索引擎設(shè)計(jì)
3.1 倒排索引
3.2 中文分詞器選擇
3.3 搜索結(jié)果排序
3.4 查詢及高亮顯示
4 搜索引擎實(shí)現(xiàn)與性能測(cè)試
4.1 檢索命中文檔數(shù)及查詢耗時(shí)對(duì)比
4.2 檢索得分排序?qū)Ρ?br>5 結(jié)論
【參考文獻(xiàn)】:
期刊論文
[1]網(wǎng)絡(luò)反恐知識(shí)庫(kù)構(gòu)建研究[J]. 黃煒,余輝,李岳峰. 情報(bào)雜志. 2017(05)
[2]全球恐怖主義數(shù)據(jù)庫(kù)及對(duì)中國(guó)反恐?jǐn)?shù)據(jù)庫(kù)建設(shè)的啟示[J]. 周松青. 情報(bào)雜志. 2016(09)
[3]基于大數(shù)據(jù)的反恐情報(bào)數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)設(shè)計(jì)[J]. 瞿志凱,張婷. 情報(bào)雜志. 2016(02)
[4]我國(guó)民族因素突發(fā)事件案例統(tǒng)計(jì)評(píng)析與應(yīng)對(duì)策略——基于1980-2015年中國(guó)大陸民族因素突發(fā)事件知識(shí)庫(kù)的研究[J]. 吳鋒,張紅強(qiáng). 情報(bào)雜志. 2016(01)
[5]統(tǒng)計(jì)與詞典相結(jié)合的領(lǐng)域自適應(yīng)中文分詞[J]. 張梅山,鄧知龍,車萬(wàn)翔,劉挺. 中文信息學(xué)報(bào). 2012(02)
[6]各國(guó)建立反恐情報(bào)數(shù)據(jù)庫(kù)情況綜述[J]. 高穎. 國(guó)際資料信息. 2005(08)
碩士論文
[1]基于循環(huán)神經(jīng)網(wǎng)絡(luò)模型的文本分類[D]. 龔千健.華中科技大學(xué) 2016
[2]基于Lucene的全文搜索引擎的研究與實(shí)現(xiàn)[D]. 何榮杰.江蘇科技大學(xué) 2016
[3]我國(guó)反恐情報(bào)的搜集與利用[D]. 譚嘯.南京大學(xué) 2015
[4]基于全球恐怖主義數(shù)據(jù)庫(kù)的社會(huì)安全事件時(shí)空關(guān)聯(lián)分析方法研究[D]. 郭文月.解放軍信息工程大學(xué) 2015
[5]濰坊市公安局反恐管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 趙新穎.山東大學(xué) 2013
本文編號(hào):3420032
【文章來(lái)源】:信息技術(shù)與網(wǎng)絡(luò)安全. 2019,38(11)
【文章頁(yè)數(shù)】:6 頁(yè)
【文章目錄】:
0 引言
1 系統(tǒng)總體架構(gòu)
2 涉恐信息爬蟲及數(shù)據(jù)庫(kù)建立
2.1 涉恐信息爬蟲
2.2 涉恐信息分類與實(shí)體抽取
2.3 數(shù)據(jù)庫(kù)建立
3 全文搜索引擎設(shè)計(jì)
3.1 倒排索引
3.2 中文分詞器選擇
3.3 搜索結(jié)果排序
3.4 查詢及高亮顯示
4 搜索引擎實(shí)現(xiàn)與性能測(cè)試
4.1 檢索命中文檔數(shù)及查詢耗時(shí)對(duì)比
4.2 檢索得分排序?qū)Ρ?br>5 結(jié)論
【參考文獻(xiàn)】:
期刊論文
[1]網(wǎng)絡(luò)反恐知識(shí)庫(kù)構(gòu)建研究[J]. 黃煒,余輝,李岳峰. 情報(bào)雜志. 2017(05)
[2]全球恐怖主義數(shù)據(jù)庫(kù)及對(duì)中國(guó)反恐?jǐn)?shù)據(jù)庫(kù)建設(shè)的啟示[J]. 周松青. 情報(bào)雜志. 2016(09)
[3]基于大數(shù)據(jù)的反恐情報(bào)數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)設(shè)計(jì)[J]. 瞿志凱,張婷. 情報(bào)雜志. 2016(02)
[4]我國(guó)民族因素突發(fā)事件案例統(tǒng)計(jì)評(píng)析與應(yīng)對(duì)策略——基于1980-2015年中國(guó)大陸民族因素突發(fā)事件知識(shí)庫(kù)的研究[J]. 吳鋒,張紅強(qiáng). 情報(bào)雜志. 2016(01)
[5]統(tǒng)計(jì)與詞典相結(jié)合的領(lǐng)域自適應(yīng)中文分詞[J]. 張梅山,鄧知龍,車萬(wàn)翔,劉挺. 中文信息學(xué)報(bào). 2012(02)
[6]各國(guó)建立反恐情報(bào)數(shù)據(jù)庫(kù)情況綜述[J]. 高穎. 國(guó)際資料信息. 2005(08)
碩士論文
[1]基于循環(huán)神經(jīng)網(wǎng)絡(luò)模型的文本分類[D]. 龔千健.華中科技大學(xué) 2016
[2]基于Lucene的全文搜索引擎的研究與實(shí)現(xiàn)[D]. 何榮杰.江蘇科技大學(xué) 2016
[3]我國(guó)反恐情報(bào)的搜集與利用[D]. 譚嘯.南京大學(xué) 2015
[4]基于全球恐怖主義數(shù)據(jù)庫(kù)的社會(huì)安全事件時(shí)空關(guān)聯(lián)分析方法研究[D]. 郭文月.解放軍信息工程大學(xué) 2015
[5]濰坊市公安局反恐管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 趙新穎.山東大學(xué) 2013
本文編號(hào):3420032
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3420032.html
最近更新
教材專著