天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于自然語言處理的互聯(lián)網(wǎng)輿情高危信息處理模塊的研究

發(fā)布時間:2021-01-20 10:22
  進入互聯(lián)網(wǎng)2.0的時代以來,進入到互聯(lián)網(wǎng)信息井噴的時代,互聯(lián)網(wǎng)媒體的迅速發(fā)展使其成為社會信息流通傳遞、參與社會公共事務(wù)的重要渠道,網(wǎng)絡(luò)輿論監(jiān)督、大數(shù)據(jù)分析與應(yīng)用業(yè)已成為政府社會治理的重要途徑。目前傳統(tǒng)的輿情分析是建立在統(tǒng)計與規(guī)則之下的系統(tǒng)架構(gòu),通過長期的詞表篩選和人工審核來建立更加完善的規(guī)則機制。但互聯(lián)網(wǎng)信息量呈指數(shù)級發(fā)展,繼續(xù)加大人力投入,基本成為不可能的事情。因此,探索與尋找一條智能化信息處理方式,能夠快速處理當前呈爆炸式增長的數(shù)據(jù),成為當前迫在眉睫的主要任務(wù)。本文著重對高危預(yù)警模塊進行研究,建立具有高召回率的模塊,分析如何將相關(guān)突發(fā)事件快速準確的推送給相關(guān)部門機構(gòu)是需要重點突破的研究方向。本文通過重新設(shè)計重要度模塊,重寫重要度預(yù)警規(guī)則,通過深度學(xué)習與機器學(xué)習算法結(jié)合的方式來提高召回率與準確率。具體完成的工作有以下幾點:(1)本文進行了語料的預(yù)處理以及粗標注,構(gòu)建“信息介入”模型的語料。構(gòu)建多模式字符串匹配算法AC自動機進行語料的篩選。(2)構(gòu)建深度學(xué)習模型BiLSTM神經(jīng)網(wǎng)絡(luò)對“信息介入”模型進行文本分類算法的訓(xùn)練,將語料文本分為三大類(介入、非介入、不相關(guān))。數(shù)據(jù)集采用2017... 

【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校

【文章頁數(shù)】:58 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于自然語言處理的互聯(lián)網(wǎng)輿情高危信息處理模塊的研究


Sgmoid曲線

袋模


將 one-hot 形式的詞向量輸入到單層神經(jīng)網(wǎng)絡(luò)模型當中,其中輸入層該和 one-hot 表示方式的詞向量維數(shù)相對應(yīng)。比如,輸入詞是“皇宮”,向量[0,1,0,0],那么,應(yīng)該設(shè)置輸入層的神經(jīng)元的數(shù)量就應(yīng)該是 4。通過神經(jīng)網(wǎng)絡(luò)中的映射層中的激活函數(shù),計算目標單詞與其他詞匯的關(guān),使用了負采樣的方式來提高其訓(xùn)練速度和正確率。通過使用隨機梯度下降算法來計算損失值。通過反向傳播算法更新每個神經(jīng)元節(jié)點的權(quán)重值和偏向值。ord2Vec 的本質(zhì)其實是一種降維操作,將 one-hot 形式的詞向量轉(zhuǎn)化為 ec 有兩種訓(xùn)練詞向量的方式。通過兩種不同的訓(xùn)練方式訓(xùn)練得到結(jié)果網(wǎng)絡(luò)進行詞關(guān)聯(lián)的訓(xùn)練是這兩種方法的相同的地方。BOW 模型(Continuous Bag-of-Words Model)

模型圖,模型,輿情,自然語言處理


基于自然語言處理的互聯(lián)網(wǎng)輿情高危信息處理模塊的研究型的特點是輸入已知上下文,輸出對當前單詞的預(yù)測。似然函數(shù)進行參數(shù)的估計:=wc logp(w|Context(w))示訓(xùn)練 Context 中任意一個詞。首先輸入的是 one-hot 向量,有激活函數(shù),輸出層是一個 softmax 層,輸出一個概率分布,。m 模型(Continuous Skip-gram Model)只是逆轉(zhuǎn)了 CBOW 的因果關(guān)系而已,即已知當前詞語,預(yù)測

【參考文獻】:
期刊論文
[1]基于AC自動機和貝葉斯方法的垃圾內(nèi)容識別[J]. 丁川蕓,蘭全祥.  黑龍江工業(yè)學(xué)院學(xué)報(綜合版). 2019(02)
[2]基于馬爾可夫鏈的涉警輿情預(yù)警方法研究[J]. 王敘然,張鵬.  武警學(xué)院學(xué)報. 2018(12)
[3]基于GBDT等數(shù)據(jù)挖掘算法的場景用戶識別方法[J]. 陳曉芳,張?zhí)祉?張儒申,皇甫俊偉,王征,趙琦琦.  電信科學(xué). 2018(S2)
[4]基于深度學(xué)習的文本分類系統(tǒng)關(guān)鍵技術(shù)研究與模型驗證[J]. 汪少敏,楊迪,任華.  電信科學(xué). 2018(12)
[5]國內(nèi)外網(wǎng)絡(luò)輿情演化、預(yù)警和應(yīng)對理論研究綜述[J]. 王蘭成,陳立富.  圖書館雜志. 2018(12)
[6]網(wǎng)絡(luò)輿情傳播事件預(yù)警機制與瀆職偵辦規(guī)制研究[J]. 苗玲玲,王飛,孫培炎.  新聞愛好者. 2018(11)
[7]基于LSTM的金融新聞傾向性[J]. 鄭國偉,呂學(xué)強,夏紅科,周建設(shè).  計算機工程與設(shè)計. 2018(11)
[8]梯度提升樹在月售電量預(yù)測中的應(yīng)用[J]. 李歡歡,王紫鵬,倪平波,張強.  電子世界. 2018(21)
[9]因子分解機應(yīng)用[J]. 張華南.  電子技術(shù)與軟件工程. 2018(19)
[10]基于XGBoost算法的用戶行為預(yù)測與風險分析[J]. 邱耀,楊國為.  工業(yè)控制計算機. 2018(09)

博士論文
[1]面向公共危機預(yù)警的網(wǎng)絡(luò)輿情分析研究[D]. 董堅峰.武漢大學(xué) 2013

碩士論文
[1]基于用戶畫像和因子分解機的推薦算法研究[D]. 楊捷.中北大學(xué) 2018
[2]基于LSTM模型分析的酒店智能推薦系統(tǒng)研究[D]. 劉燁.上海師范大學(xué) 2018
[3]基于機器學(xué)習的情感分析方法研究[D]. 張磊.電子科技大學(xué) 2018
[4]基于概率模型檢驗的車載無線自組織網(wǎng)絡(luò)路由協(xié)議研究[D]. 王峰.南京郵電大學(xué) 2017
[5]面向政務(wù)需求的網(wǎng)絡(luò)輿情分析方法研究[D]. 張祥.電子科技大學(xué) 2017
[6]基于EMD-XGBoost-AR模型的網(wǎng)絡(luò)輿情預(yù)測研究[D]. 黃艷瑩.廣東工業(yè)大學(xué) 2017
[7]基于自然語言處理的社交網(wǎng)絡(luò)數(shù)據(jù)挖掘研究[D]. 張培華.華北電力大學(xué) 2017
[8]基于貝葉斯算法的屏蔽策略優(yōu)化研究及手機助手系統(tǒng)實現(xiàn)[D]. 于杰.北京交通大學(xué) 2016
[9]基于比特并行的字典搜索的研究與實現(xiàn)[D]. 葉成東.吉林大學(xué) 2016
[10]微博文本情感分類研究[D]. 陳思.吉林大學(xué) 2016



本文編號:2988872

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2988872.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶062f8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com