天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于海量新聞數(shù)據(jù)的重大事件趨勢預測研究

發(fā)布時間:2020-12-19 03:17
  重大事件趨勢預測是指對影響國家或地區(qū)和平穩(wěn)定的時政或軍事事件演化規(guī)律的預測,是國際關系領域的一個熱點研究問題。大數(shù)據(jù)時代的來臨以及人工智能技術的發(fā)展,使得基于公開新聞數(shù)據(jù)的重大事件趨勢預測成為可能。本文借鑒國際關系研究領域“事件數(shù)據(jù)分析法”的量化思想,為滿足現(xiàn)有研究方法存在的特征指標構建以及事件趨勢因果溯源上的需求,針對朝鮮核行為的趨勢預測,南海爭端中的征候事件檢測與預測兩方面開展研究;诰W(wǎng)絡爬蟲技術獲取海量事件專題新聞數(shù)據(jù),利用自然語言處理(Nature Language Processing,NLP)、機器學習等技術進行處理,構建預測模型并進行實驗結果分析。論文主要內容如下:首先,由于當前基于海量新聞數(shù)據(jù)的重大事件趨勢預測方法在特征指標構建方面嚴重依賴專家知識,這極大制約了相關方法的普適性與時效性。針對這一問題,本文提出一種融合語義與事件特征的重大事件趨勢預測方法。分別利用潛在狄利克雷分布(Latent Dirichlet Allocation,LDA)模型與基于模式匹配規(guī)則的事件抽取技術從語義及事件兩方面進行相關特征指標的自動化構建,針對LDA主題模型在特征詞提取上存在偏向性的... 

【文章來源】:杭州電子科技大學浙江省

【文章頁數(shù)】:73 頁

【學位級別】:碩士

【部分圖文】:

基于海量新聞數(shù)據(jù)的重大事件趨勢預測研究


KBS中文網(wǎng)北韓專題新聞列表頁

新聞,頁表,字段,網(wǎng)站


杭州電子科技大學碩士學位論文(b)中新網(wǎng)國際專題新聞列表頁展示圖4.1部分數(shù)據(jù)源網(wǎng)站新聞列表頁表4.1新聞數(shù)據(jù)表字段說明字段名類型長度備注TIMEdate0新聞發(fā)布時間URLvarchar255新聞鏈接(主鍵索引)NEWSTYPEvarchar255新聞類型TITLEvarchar255新聞標題CONTENTvarchar8192新聞報道正文利用SQL查詢語句對獲取新聞數(shù)據(jù)進行噪聲過濾,基于項目合作單位分析結果,設計了5類查詢語句進行數(shù)據(jù)過濾,用于抽取更加細粒度的南海專題新聞數(shù)據(jù)集,5類查詢過濾語句如表4.2所示。表4.25類查詢過濾語句SELECT*FROMnanhai_ztWHERECONTENTLIKE"%中國%南海%島礁建設%"ORCONTENTLIKE"%中國%5G技術%美國%"ORCONTENTLIKE"%中國%軍演%美國%"ORDERBYTIMESELECT*FROMnanhai_ztWHERECONTENTLIKE"%美國%司令%南海%派遣%"ORCONTENTLIKE"%美國%將軍%南海%巡航%"ORDERBYTIMESELECT*FROMnanhai_ztWHERECONTENTLIKE"%中美%部長級%對話%"ORCONTENTLIKE"%中美%貿易戰(zhàn)%制裁%"ORDERBYTIMESELECT*FROMnanhai_ztWHERECONTENTLIKE"%朝鮮%核實驗%"ORCONTENTLIKE"%朝美%威脅%美國%"ORDERBYTIMESELECT*FROMnanhai_ztWHERECONTENTLIKE"%菲律賓%南海%主權%爭端%"ORCONTENTLIKE"%越南%南海%主權%"ORDERBYTIME37

新聞,分類體系,事件,數(shù)據(jù)表


杭州電子科技大學碩士學位論文結合SQL查詢語句噪聲過濾的南海專題新聞數(shù)據(jù)表共包含10萬條數(shù)據(jù),數(shù)據(jù)表存儲內容展示如圖4.2所示。圖4.2南海專題新聞數(shù)據(jù)表內容展示參照CAMEO(ConflictandMediationEventObservations)事件分類體系編碼規(guī)范[78]以及項目合作單位領域先驗知識定義20類可能引發(fā)南海爭端的征候事件類型,并對事件類型進行編碼,征候事件類型編碼與事件描述如表4.3所示。表4.3定義征候事件類型編碼與事件描述01公開聲明02呼吁03表達合作意向04商議05進行外交合作06進行實質合作07提供援助08讓步09調查10要求11不贊成12拒絕13威脅14集會抗議15展示軍事姿態(tài)16降低關系17強迫18侵犯19作戰(zhàn)20大規(guī)模暴力基于相關事件句在句法規(guī)則搭配上的不同,為每類征候事件設計一組模式匹配規(guī)則模板用于新聞報道中的事件句識別,各征候事件類型對應模式匹配規(guī)則如表4.4所示。表4.4各征候事件類型對應模式匹配規(guī)則事件類型模式匹配規(guī)則01公開聲明source(宣布宣稱){負責}、source{向}target(求證承諾表示)、source(祝賀)target{就任當選}、source{就}{向}target(表示致以){慰問哀悼}、…02呼吁(希望)source{與和同}target{進行}{協(xié)商合作}、source(呼吁鼓勵希望)target{和平}{解決}{問題}、…03表達合作意向(期待希望愿愿意)srctgt{合作}、source(歡迎希望愿愿意)target{投資開發(fā)}、source(邀請歡迎)target{出席}{會議峰會論壇}、…04商議(主持參加舉行)srctgt+{事務}{磋商}、source(抵達到達位)evtloc{與}target{會見磋商討論}、source(率){團}{訪問拜會訪到訪出訪}target、…05進行外交合作source+{與和同跟}target+{在位}evtloc(簽署簽簽訂達成簽定)、source{與同和跟}target(建立){合作}{伙伴}{關系}、source{與和同}target(?


本文編號:2925152

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2925152.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶6cb60***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com