基于旋轉(zhuǎn)森林集成學(xué)習(xí)的涉恐實(shí)體挖掘研究
本文關(guān)鍵詞:基于旋轉(zhuǎn)森林集成學(xué)習(xí)的涉恐實(shí)體挖掘研究 出處:《情報(bào)雜志》2015年05期 論文類型:期刊論文
更多相關(guān)文章: 反恐 非結(jié)構(gòu)化文本 數(shù)據(jù)挖掘 旋轉(zhuǎn)森林 集成學(xué)習(xí)
【摘要】:近期,我國(guó)出現(xiàn)了一系列暴力恐怖襲擊事件,面臨的反恐形勢(shì)日趨嚴(yán)峻。傳統(tǒng)的被動(dòng)警務(wù)防范模型弊端日益凸顯,亟需有效應(yīng)對(duì)恐怖襲擊的智能化防范策略。作為近年來(lái)的研究熱點(diǎn),數(shù)據(jù)挖掘技術(shù)和應(yīng)用發(fā)展迅速。文章充分利用數(shù)據(jù)挖掘的前沿技術(shù)和成果,提出了一個(gè)相對(duì)完整的涉恐實(shí)體挖掘模型,以期為反恐實(shí)戰(zhàn)工作服務(wù)。其中,簡(jiǎn)要介紹針對(duì)中文和維吾爾文非結(jié)構(gòu)化文本數(shù)據(jù)的挖掘流程,提出一個(gè)有效應(yīng)用于識(shí)別和預(yù)測(cè)涉恐實(shí)體的基于旋轉(zhuǎn)森林的集成分類模型,并用實(shí)驗(yàn)證明這一模型較之一般的分類器會(huì)有更優(yōu)越的分類性能。
[Abstract]:Recently, there have been a series of violent terrorist attacks in our country, and the situation of anti-terrorism is becoming more and more serious. The disadvantages of the traditional passive policing prevention model are becoming increasingly prominent. As a research hotspot in recent years, data mining technology and application are developing rapidly. This paper makes full use of the advanced technology and achievements of data mining. A relatively complete model of terrorist entity mining is proposed in order to serve the actual combat against terrorism. Among them, the mining process for Chinese and Uygur unstructured text data is briefly introduced. An integrated classification model based on rotating forest is proposed to identify and predict terrorist entities. Experiments show that this model has better classification performance than the general classifier.
【作者單位】: 中國(guó)人民公安大學(xué)反恐怖學(xué)院;中國(guó)人民公安大學(xué)犯罪學(xué)院;
【分類號(hào)】:D631.4;G350
【正文快照】: Sun Feifei1Lin Ping1Cao Zhuo2(People's Public Security University of China,Beijing 100038)0引言近年來(lái),社會(huì)安全和反恐形勢(shì)日趨復(fù)雜。警方不僅要加強(qiáng)對(duì)犯罪分子的控制,還要竭力識(shí)別出對(duì)國(guó)家和人民生命財(cái)產(chǎn)安全產(chǎn)生(潛在)威脅的危險(xiǎn)分子,防患于未然。傳統(tǒng)上,情報(bào)部門(mén)對(duì)
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 陳松峰;范明;;利用PCA和AdaBoost建立基于貝葉斯的組合分類器[J];計(jì)算機(jī)科學(xué);2010年08期
2 劉敏;謝伙生;;一種基于旋轉(zhuǎn)森林的集成協(xié)同訓(xùn)練算法[J];計(jì)算機(jī)工程與應(yīng)用;2011年30期
3 蘇金樹(shù);張博鋒;徐昕;;基于機(jī)器學(xué)習(xí)的文本分類技術(shù)研究進(jìn)展[J];軟件學(xué)報(bào);2006年09期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李文斌;劉椿年;鐘寧;;基于兩階段集成學(xué)習(xí)的分類器集成[J];北京工業(yè)大學(xué)學(xué)報(bào);2010年03期
2 文翰;肖南峰;;基于特征分布的半監(jiān)督分類[J];北京工業(yè)大學(xué)學(xué)報(bào);2012年01期
3 周世斌;白敬華;劉玉樹(shù);;統(tǒng)計(jì)流形上基于核近鄰算法的文本分類研究[J];北京理工大學(xué)學(xué)報(bào);2010年03期
4 陳爽;陳福;杜天蒼;;一種啟發(fā)式網(wǎng)絡(luò)信息采集系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];北京石油化工學(xué)院學(xué)報(bào);2007年04期
5 黃文良;李石堅(jiān);劉菊新;徐從富;;一個(gè)大規(guī)模垃圾短信實(shí)時(shí)過(guò)濾系統(tǒng)[J];北京郵電大學(xué)學(xué)報(bào);2008年03期
6 柯麗;王明文;何世柱;黎佳;羅遠(yuǎn)勝;;基于頻率共現(xiàn)熵的跨語(yǔ)言網(wǎng)頁(yè)自動(dòng)分類研究[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期
7 曾立梅;;基于文本數(shù)據(jù)挖掘的碩士論文分類技術(shù)[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年05期
8 陳可華;;文本自動(dòng)分類新探究[J];赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年04期
9 殷宏威;趙偉;楊志偉;;蟻群算法在KNN文本分類中的應(yīng)用[J];長(zhǎng)春理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年01期
10 沈競(jìng);蔣僑;;DSTFA分布式短文本過(guò)濾算法[J];四川兵工學(xué)報(bào);2011年10期
相關(guān)會(huì)議論文 前10條
1 黃文良;李石堅(jiān);劉菊新;徐從富;;大規(guī)模垃圾短信實(shí)時(shí)過(guò)濾系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];中國(guó)通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
2 李文波;孫樂(lè);黃瑞紅;馮元勇;張大鯤;;基于Labeled-LDA模型的文本分類新算法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
3 王輝;左萬(wàn)利;;利用質(zhì)心向量構(gòu)建增量式分類器(英文)[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
4 劉健;張維明;;基于文本概念序列的非線性分析方法初探[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
5 黃云平;孫樂(lè);李文波;;基于上下文圖模型文本表示的文本分類研究[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
6 ;Text Feature Automatic Selection Algorithm Based on Cloud Model[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
7 張愛(ài)華;靖紅芳;王斌;徐燕;;文本分類中特征權(quán)重因子的作用研究[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
8 朱振方;劉培玉;;求解中文文本信息過(guò)濾的自適應(yīng)遺傳算法及收斂性分析[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
9 張愛(ài)華;王斌;徐燕;;非均衡文本分類中基于特征分布的抽樣技術(shù)研究[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
10 李月倫;李湘;常寶寶;袁毓林;;一種基于認(rèn)知情景框架的文本分類方法[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
相關(guān)博士學(xué)位論文 前10條
1 鄧斌;B2C在線評(píng)論中的客戶知識(shí)管理研究[D];電子科技大學(xué);2010年
2 張曉艷;新聞話題表示模型和關(guān)聯(lián)追蹤技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
3 張翔;文本挖掘技術(shù)研究及其在綜合風(fēng)險(xiǎn)信息網(wǎng)絡(luò)中的應(yīng)用[D];西北大學(xué);2011年
4 祝翠玲;基于類別結(jié)構(gòu)的文本層次分類方法研究[D];山東大學(xué);2011年
5 代勁;云模型在文本挖掘應(yīng)用中的關(guān)鍵問(wèn)題研究[D];重慶大學(xué);2011年
6 劉伍穎;面向垃圾信息過(guò)濾的主動(dòng)多域?qū)W習(xí)文本分類方法研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年
7 孫珂;大規(guī)模文檔標(biāo)簽自動(dòng)標(biāo)注技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2011年
8 李智星;用于文本分類的簡(jiǎn)明語(yǔ)義分析技術(shù)研究[D];重慶大學(xué);2011年
9 朱振方;基于微粒群和遺傳優(yōu)化的文本過(guò)濾關(guān)鍵技術(shù)研究[D];山東師范大學(xué);2012年
10 楊傳耀;中文信息檢索索引模型及相關(guān)技術(shù)研究[D];復(fù)旦大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 郭明;基于文本分類技術(shù)的文本情感傾向性研究[D];鄭州大學(xué);2010年
2 左維松;規(guī)則和統(tǒng)計(jì)相結(jié)合的篇章情感傾向性分析研究[D];鄭州大學(xué);2010年
3 劉國(guó)峰;數(shù)據(jù)模板匹配研究及在社保審計(jì)中的應(yīng)用[D];哈爾濱工程大學(xué);2010年
4 李曉光;數(shù)據(jù)挖掘技術(shù)在高校招生和教務(wù)管理中的應(yīng)用[D];哈爾濱工程大學(xué);2010年
5 徐旭;基于決策樹(shù)的Web應(yīng)用系統(tǒng)個(gè)性化身份驗(yàn)證研究[D];合肥工業(yè)大學(xué);2010年
6 李瓊瓊;網(wǎng)絡(luò)文本自動(dòng)分類器的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2010年
7 趙素娟;基于互聯(lián)網(wǎng)的人物簡(jiǎn)歷問(wèn)答系統(tǒng)的研究與設(shè)計(jì)[D];東北財(cái)經(jīng)大學(xué);2010年
8 袁路妍;鎢層文本自動(dòng)分類技術(shù)的研究與應(yīng)用[D];東華大學(xué);2011年
9 李一磊;服裝設(shè)計(jì)風(fēng)格決策模型的研究與實(shí)現(xiàn)[D];東華大學(xué);2011年
10 劉繼勇;網(wǎng)絡(luò)輿情預(yù)警輔助決策支持系統(tǒng)模型及關(guān)鍵技術(shù)研究[D];石家莊經(jīng)濟(jì)學(xué)院;2010年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 王建會(huì),王洪偉,申展,胡運(yùn)發(fā);一種實(shí)用高效的文本分類算法[J];計(jì)算機(jī)研究與發(fā)展;2005年01期
2 李榮陸,王建會(huì),陳曉云,陶曉鵬,胡運(yùn)發(fā);使用最大熵模型進(jìn)行中文文本分類[J];計(jì)算機(jī)研究與發(fā)展;2005年01期
3 陳毅松,汪國(guó)平,董士海;基于支持向量機(jī)的漸進(jìn)直推式分類學(xué)習(xí)算法[J];軟件學(xué)報(bào);2003年03期
【相似文獻(xiàn)】
相關(guān)會(huì)議論文 前4條
1 關(guān)菁華;劉大有;賈海洋;;自適應(yīng)多分類器集成學(xué)習(xí)算法[A];第二十五屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(二)[C];2008年
2 劉伍穎;王挺;;一種多過(guò)濾器集成學(xué)習(xí)垃圾郵件過(guò)濾方法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
3 葉紅云;倪志偉;陳恩紅;;一種混合型集成學(xué)習(xí)演化決策樹(shù)算法[A];2005年“數(shù)字安徽”博士科技論壇論文集[C];2005年
4 李燁;蔡云澤;許曉鳴;;基于支持向量機(jī)集成的故障診斷[A];第16屆中國(guó)過(guò)程控制學(xué)術(shù)年會(huì)暨第4屆全國(guó)故障診斷與安全性學(xué)術(shù)會(huì)議論文集[C];2005年
相關(guān)博士學(xué)位論文 前10條
1 張春霞;集成學(xué)習(xí)中有關(guān)算法的研究[D];西安交通大學(xué);2010年
2 劉天羽;基于特征選擇技術(shù)的集成學(xué)習(xí)方法及其應(yīng)用研究[D];上海大學(xué);2007年
3 尹華;面向高維和不平衡數(shù)據(jù)分類的集成學(xué)習(xí)研究[D];武漢大學(xué);2012年
4 王清;集成學(xué)習(xí)中若干關(guān)鍵問(wèn)題的研究[D];復(fù)旦大學(xué);2011年
5 方育柯;集成學(xué)習(xí)理論研究及其在個(gè)性化推薦中的應(yīng)用[D];電子科技大學(xué);2011年
6 李燁;基于支持向量機(jī)的集成學(xué)習(xí)研究[D];上海交通大學(xué);2007年
7 程麗麗;支持向量機(jī)集成學(xué)習(xí)算法研究[D];哈爾濱工程大學(xué);2009年
8 林智勇;基于核方法的不平衡數(shù)據(jù)學(xué)習(xí)[D];華南理工大學(xué);2009年
9 李磊軍;基于間隔和置信度的選擇性集成學(xué)習(xí)算法研究[D];哈爾濱工業(yè)大學(xué);2014年
10 夏俊士;基于集成學(xué)習(xí)的高光譜遙感影像分類[D];中國(guó)礦業(yè)大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 張妤;支持向量機(jī)集成學(xué)習(xí)方法研究[D];山西大學(xué);2008年
2 李濤;基于條件互信息的集成學(xué)習(xí)的研究與應(yīng)用[D];中國(guó)海洋大學(xué);2009年
3 楊長(zhǎng)盛;基于成對(duì)差異性度量的選擇性集成學(xué)習(xí)方法研究[D];安徽大學(xué);2010年
4 曹振田;基于Q統(tǒng)計(jì)量的選擇性集成學(xué)習(xí)研究[D];安徽大學(xué);2010年
5 王麗麗;集成學(xué)習(xí)算法研究[D];廣西大學(xué);2006年
6 馬冉冉;集成學(xué)習(xí)算法研究[D];山東科技大學(xué);2010年
7 張新東;集成學(xué)習(xí)及其應(yīng)用研究[D];石家莊經(jīng)濟(jì)學(xué)院;2010年
8 吳科主;基于多任務(wù)的多層次選擇性集成學(xué)習(xí)的研究[D];安徽工業(yè)大學(xué);2010年
9 李平;集成學(xué)習(xí)中差異性控制方法研究[D];大連海事大學(xué);2012年
10 田智輝;基于集成學(xué)習(xí)的故障診斷方法研究[D];西安石油大學(xué);2013年
,本文編號(hào):1367011
本文鏈接:http://sikaile.net/falvlunwen/fanzuizhian/1367011.html