基于機器學習的國家沖突行為預測研究
發(fā)布時間:2021-08-01 10:35
國家沖突行為預測在國際關系研究領域是指對戰(zhàn)爭、武裝對抗、政治動蕩等問題的爆發(fā)、持續(xù)以及傷亡情況的預測分析,能夠為提前制定戰(zhàn)略決策提供一定的輔助支持。隨著大數(shù)據(jù)和自然語言處理等技術的發(fā)展,使得基于公開海量新聞數(shù)據(jù)進行沖突行為預測成為可能。國家沖突行為量化預測研究中廣泛采用的“事件數(shù)據(jù)分析法”具有對領域?qū)<抑R依賴強、時效性差等問題,本文綜合利用人工智能領域相關技術,從互聯(lián)網(wǎng)抓取海量新聞數(shù)據(jù)進行文本特征提取與預測模型構建,通過動態(tài)貝葉斯網(wǎng)絡模型構建了南海問題中我國與其它七大參與國家間的沖突預測模型,論文主要研究內(nèi)容如下:首先,提出了一種融合層次聚類、單詞貢獻度(Term Contribution,TC)與潛在狄利克雷分布(Latent Dirichlet Allocation,LDA)主題模型的特征自動抽取算法,采用多項式邏輯回歸構建沖突預測模型。所提算法采用層次聚類解決了LDA主題模型需要確定主題數(shù)目的問題,融合TC與LDA從海量新聞數(shù)據(jù)中提取更具表征性的主題詞特征;谔崛〉闹黝}詞構建主題向量,將主題向量依次輸入多項式邏輯回歸模型迭代訓練,得到國家沖突行為趨勢預測模型。通過對朝鮮核行為...
【文章來源】:杭州電子科技大學浙江省
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【部分圖文】:
爬取頁面展示圖
杭州電子科技大學碩士學位論文39表4.6南海爭端事件分值表部分內(nèi)容大類事件小類事件事件分值公開聲明消極評論-0.4積極評論0.4承認或聲明負責0.0商議進行訪問1.9主持訪問2.8參與磋商和對話7.0進行實質(zhì)合作軍事合作7.4進行司法合作7.4共享情報或信息7.0展示軍事姿態(tài)閱兵演練-5.0巡洋艦航行-6.0驅(qū)逐艦航行-5.0將20大類事件和511類事件存入數(shù)據(jù)庫,結果如圖4.5所示。圖4.5事件分值表展示根據(jù)事件分值表中的事件類型構建事件抽取規(guī)則模板。因為主客體及觸發(fā)詞
杭州電子科技大學碩士學位論文40在句子中的表達方式存在多樣性,由中國電子科技集團第二十八研究所專家定義了603個事件抽取匹配規(guī)則,對于給定任意包含511小類事件的事件句,均有唯一的事件類型與之對應。將新聞數(shù)據(jù)按條輸入,進行事件抽取后,輸出對應事件句、時間、發(fā)起者、承受者、事件類型、事件得分等內(nèi)容,并存入數(shù)據(jù)庫。從35445條新聞中總共匹配出74530個事件,匹配模式如表4.7所示。其中,source表示事件句中的發(fā)起者,target表示事件句中的承受者。表4.7部分事件匹配結果事件句時間發(fā)起者承受者匹配規(guī)則事件類型越南要求中國撤走南沙導彈,稱侵犯其“主權”。2018.05越南中國source(要求敦促)target+{V}要求(其它)澳大利亞首次邀請中國參加這一軍演,和美國撤銷邀請中國參加“環(huán)太平洋2018”軍演形成鮮明對比。2018.08澳大利亞中國source(邀請)target{參加}{演習軍演}表達軍事合作意向美國軍艦卻屢次進入中國南海島礁12海里是別有用心。2018.10美國中國source+(進入闖闖入駛入巡航硬闖進入巡)target+{12}{海里}展示軍事姿態(tài)將所有抽取結果存入數(shù)據(jù)庫,部分結果如圖4.6所示。圖4.6事件抽取結果展示圖
【參考文獻】:
期刊論文
[1]基于BI-GRU-CRF模型的中文分詞法[J]. 車金立,唐力偉,鄧士杰,蘇續(xù)軍. 火力與指揮控制. 2019(09)
[2]基于Scrapy爬蟲框架的安居客租房數(shù)據(jù)爬取[J]. 陳燕. 輕工科技. 2019(09)
[3]從歷史邏輯與人文哲學看“構建人類命運共同體”[J]. 凌均衛(wèi). 南華大學學報(社會科學版). 2019(03)
[4]基于Python的網(wǎng)絡爬蟲與反爬蟲技術研究[J]. 李培. 計算機與數(shù)字工程. 2019(06)
[5]基于Word2vec和改進型TF-IDF的卷積神經(jīng)網(wǎng)絡文本分類模型[J]. 王根生,黃學堅. 小型微型計算機系統(tǒng). 2019(05)
[6]基于動態(tài)貝葉斯網(wǎng)絡的網(wǎng)絡輿情危機等級預測模型[J]. 楊靜,鄒梅,黃微. 情報科學. 2019(05)
[7]朝鮮核行為預測:變化無常還是有章可循[J]. 曹瑋,劉倩,劉子夜. 國際安全研究. 2019(01)
[8]基于改進的K-means算法在文本挖掘中的應用[J]. 楊丹,朱世玲,卞正宇. 計算機技術與發(fā)展. 2019(04)
[9]美菲同盟對中菲南海爭端的影響論析[J]. 李途. 東南亞研究. 2018(05)
[10]中文分詞算法研究綜述[J]. 汪文妃,徐豪杰,楊文珍,吳新麗. 成組技術與生產(chǎn)現(xiàn)代化. 2018(03)
博士論文
[1]自由文本的信息抽取模式獲取的研究[D]. 姜吉發(fā).中國科學院研究生院(計算技術研究所) 2004
碩士論文
[1]面向文本的空間信息抽取方法研究[D]. 施林鋒.南京大學 2019
[2]基于條件隨機場的中文分詞技術的研究與實現(xiàn)[D]. 徐曉芳.南京郵電大學 2018
[3]面向突發(fā)事件的事件要素識別研究[D]. 張鵬.安徽理工大學 2018
[4]K-means算法的改進及其在文本聚類中的應用研究[D]. 李敏.江南大學 2018
[5]多媒體網(wǎng)絡輿情危機監(jiān)測指標體系構建研究[D]. 金鑫.吉林大學 2017
[6]文本表示模型和特征選擇算法研究[D]. 陳磊.中國科學技術大學 2017
[7]基于邏輯回歸的金融數(shù)據(jù)分類系統(tǒng)的設計與實現(xiàn)[D]. 劉展.山東大學 2017
[8]基于事件抽取的日漢新聞語料庫構建研究[D]. 楊健.北京交通大學 2016
[9]統(tǒng)計學視角下的國家雙邊關系[D]. 劉晏榕.云南大學 2015
[10]基于主題的微博網(wǎng)頁爬蟲研究[D]. 曾小虎.武漢理工大學 2014
本文編號:3315373
【文章來源】:杭州電子科技大學浙江省
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【部分圖文】:
爬取頁面展示圖
杭州電子科技大學碩士學位論文39表4.6南海爭端事件分值表部分內(nèi)容大類事件小類事件事件分值公開聲明消極評論-0.4積極評論0.4承認或聲明負責0.0商議進行訪問1.9主持訪問2.8參與磋商和對話7.0進行實質(zhì)合作軍事合作7.4進行司法合作7.4共享情報或信息7.0展示軍事姿態(tài)閱兵演練-5.0巡洋艦航行-6.0驅(qū)逐艦航行-5.0將20大類事件和511類事件存入數(shù)據(jù)庫,結果如圖4.5所示。圖4.5事件分值表展示根據(jù)事件分值表中的事件類型構建事件抽取規(guī)則模板。因為主客體及觸發(fā)詞
杭州電子科技大學碩士學位論文40在句子中的表達方式存在多樣性,由中國電子科技集團第二十八研究所專家定義了603個事件抽取匹配規(guī)則,對于給定任意包含511小類事件的事件句,均有唯一的事件類型與之對應。將新聞數(shù)據(jù)按條輸入,進行事件抽取后,輸出對應事件句、時間、發(fā)起者、承受者、事件類型、事件得分等內(nèi)容,并存入數(shù)據(jù)庫。從35445條新聞中總共匹配出74530個事件,匹配模式如表4.7所示。其中,source表示事件句中的發(fā)起者,target表示事件句中的承受者。表4.7部分事件匹配結果事件句時間發(fā)起者承受者匹配規(guī)則事件類型越南要求中國撤走南沙導彈,稱侵犯其“主權”。2018.05越南中國source(要求敦促)target+{V}要求(其它)澳大利亞首次邀請中國參加這一軍演,和美國撤銷邀請中國參加“環(huán)太平洋2018”軍演形成鮮明對比。2018.08澳大利亞中國source(邀請)target{參加}{演習軍演}表達軍事合作意向美國軍艦卻屢次進入中國南海島礁12海里是別有用心。2018.10美國中國source+(進入闖闖入駛入巡航硬闖進入巡)target+{12}{海里}展示軍事姿態(tài)將所有抽取結果存入數(shù)據(jù)庫,部分結果如圖4.6所示。圖4.6事件抽取結果展示圖
【參考文獻】:
期刊論文
[1]基于BI-GRU-CRF模型的中文分詞法[J]. 車金立,唐力偉,鄧士杰,蘇續(xù)軍. 火力與指揮控制. 2019(09)
[2]基于Scrapy爬蟲框架的安居客租房數(shù)據(jù)爬取[J]. 陳燕. 輕工科技. 2019(09)
[3]從歷史邏輯與人文哲學看“構建人類命運共同體”[J]. 凌均衛(wèi). 南華大學學報(社會科學版). 2019(03)
[4]基于Python的網(wǎng)絡爬蟲與反爬蟲技術研究[J]. 李培. 計算機與數(shù)字工程. 2019(06)
[5]基于Word2vec和改進型TF-IDF的卷積神經(jīng)網(wǎng)絡文本分類模型[J]. 王根生,黃學堅. 小型微型計算機系統(tǒng). 2019(05)
[6]基于動態(tài)貝葉斯網(wǎng)絡的網(wǎng)絡輿情危機等級預測模型[J]. 楊靜,鄒梅,黃微. 情報科學. 2019(05)
[7]朝鮮核行為預測:變化無常還是有章可循[J]. 曹瑋,劉倩,劉子夜. 國際安全研究. 2019(01)
[8]基于改進的K-means算法在文本挖掘中的應用[J]. 楊丹,朱世玲,卞正宇. 計算機技術與發(fā)展. 2019(04)
[9]美菲同盟對中菲南海爭端的影響論析[J]. 李途. 東南亞研究. 2018(05)
[10]中文分詞算法研究綜述[J]. 汪文妃,徐豪杰,楊文珍,吳新麗. 成組技術與生產(chǎn)現(xiàn)代化. 2018(03)
博士論文
[1]自由文本的信息抽取模式獲取的研究[D]. 姜吉發(fā).中國科學院研究生院(計算技術研究所) 2004
碩士論文
[1]面向文本的空間信息抽取方法研究[D]. 施林鋒.南京大學 2019
[2]基于條件隨機場的中文分詞技術的研究與實現(xiàn)[D]. 徐曉芳.南京郵電大學 2018
[3]面向突發(fā)事件的事件要素識別研究[D]. 張鵬.安徽理工大學 2018
[4]K-means算法的改進及其在文本聚類中的應用研究[D]. 李敏.江南大學 2018
[5]多媒體網(wǎng)絡輿情危機監(jiān)測指標體系構建研究[D]. 金鑫.吉林大學 2017
[6]文本表示模型和特征選擇算法研究[D]. 陳磊.中國科學技術大學 2017
[7]基于邏輯回歸的金融數(shù)據(jù)分類系統(tǒng)的設計與實現(xiàn)[D]. 劉展.山東大學 2017
[8]基于事件抽取的日漢新聞語料庫構建研究[D]. 楊健.北京交通大學 2016
[9]統(tǒng)計學視角下的國家雙邊關系[D]. 劉晏榕.云南大學 2015
[10]基于主題的微博網(wǎng)頁爬蟲研究[D]. 曾小虎.武漢理工大學 2014
本文編號:3315373
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3315373.html
最近更新
教材專著