天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 社科論文 > 新聞傳播論文 >

基于深度學(xué)習(xí)的突發(fā)事件新聞文本分類研究

發(fā)布時(shí)間:2024-01-21 08:20
  中國(guó)互聯(lián)網(wǎng)信息中心在第44次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》中提到截止2019年6月,中國(guó)網(wǎng)民人數(shù)超過(guò)8.5億,其中網(wǎng)絡(luò)新聞?dòng)脩粽伎偩W(wǎng)民數(shù)的80.3%[1];ヂ(lián)網(wǎng)絡(luò)因其無(wú)地域限制、傳播速度快等特點(diǎn),一旦發(fā)生突發(fā)事件,其便能通過(guò)網(wǎng)絡(luò)在全國(guó)范圍內(nèi)傳播開(kāi)。如果突發(fā)事件帶有負(fù)面情緒,被某些惡勢(shì)力所操縱,有可能造成社會(huì)恐慌。因此,網(wǎng)絡(luò)重大突發(fā)事件管理工作十分重要,時(shí)刻掌握網(wǎng)絡(luò)突發(fā)事件最新消息更是重中之重。網(wǎng)絡(luò)輿情監(jiān)控涵蓋多個(gè)方面,比如輿情識(shí)別、輿情分類、輿情預(yù)測(cè)等方面,從系統(tǒng)的角度監(jiān)管網(wǎng)絡(luò)輿情均具有重要的科研價(jià)值和社會(huì)價(jià)值。輿情分類主要涉及特征表達(dá)和文本分類技術(shù),特征表達(dá)技術(shù)中機(jī)器學(xué)習(xí)算法(如卡方檢驗(yàn)、信息交互等)仍然是研究主流,但均忽略了詞序信息和文本結(jié)構(gòu)信息。文本分類技術(shù)又主要分為兩種:基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法和基于深度學(xué)習(xí)的方法。傳統(tǒng)機(jī)器學(xué)習(xí)依賴較大的樣本容量,樣本容量較小時(shí)難以達(dá)到既定模型精度,樣本容量過(guò)大則容易造成資源浪費(fèi)。為提取文本中詞序信息,學(xué)者提出詞嵌入方法,從而使文本特征信息提取技術(shù)更完善;趥鹘y(tǒng)機(jī)器學(xué)習(xí)方法的分類模型因其自身特點(diǎn),容易達(dá)到模型瓶頸,難以...

【文章頁(yè)數(shù)】:75 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
中文摘要
Abstract
第1章 緒論
    1.1 研究背景與意義
        1.1.1 研究背景
        1.1.2 研究意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀及研究評(píng)述
        1.2.1 文本特征提取研究
        1.2.2 新聞文本分類算法研究
        1.2.3 研究評(píng)述
    1.3 研究?jī)?nèi)容與技術(shù)路線
        1.3.1 研究?jī)?nèi)容
        1.3.2 技術(shù)路線
第2章 相關(guān)理論與技術(shù)介紹
    2.1 特征選擇
        2.1.1 卡方檢驗(yàn)
        2.1.2 TF-IDF
        2.1.3 信息增益(IG)
    2.2 常用的機(jī)器學(xué)習(xí)方法
        2.2.1 支持向量機(jī)
        2.2.2 隨機(jī)森林
        2.2.3 樸素貝葉斯算法
    2.3 深度學(xué)習(xí)在文本分類中的應(yīng)用
        2.3.1 Word2vec模型
        2.3.2 MLP感知機(jī)
        2.3.3 卷積神經(jīng)網(wǎng)絡(luò)
        2.3.4 長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)
        2.3.5 注意力機(jī)制
    2.4 本章小結(jié)
第3章 基于樸素貝葉斯的突發(fā)事件新聞文本一級(jí)分類模型
    3.1 基于詞頻的關(guān)鍵詞聚類分析
    3.2 突發(fā)事件新聞文本一級(jí)分類流程
    3.3 突發(fā)事件新聞文本一級(jí)分類模型特征表示
        3.3.1 突發(fā)事件新聞文本特征篩選
        3.3.2 突發(fā)事件新聞文本特征表達(dá)
    3.4 基于樸素貝葉斯的一級(jí)分類模型
    3.5 本章小結(jié)
第4章 基于深度學(xué)習(xí)的突發(fā)事件新聞文本二級(jí)分類模型
    4.1 突發(fā)事件新聞文本二級(jí)分類流程
    4.2 突發(fā)事件新聞文本二級(jí)分類模型特征表示
        4.2.1 離散度向量特征表示
        4.2.2 詞向量特征表示
    4.3 基于Attention的 DCLSTM-MLP組合模型
        4.3.1 MLP模塊
        4.3.2 MCNN模塊
        4.3.3 LSTM模塊
        4.3.4 Attention機(jī)制
    4.4 本章小結(jié)
第5章 實(shí)驗(yàn)與分析
    5.1 實(shí)驗(yàn)設(shè)計(jì)
        5.1.1 實(shí)驗(yàn)環(huán)境
        5.1.2 實(shí)驗(yàn)數(shù)據(jù)集
        5.1.3 評(píng)價(jià)指標(biāo)
    5.2 突發(fā)事件新聞文本一級(jí)模型分析
    5.3 突發(fā)事件新聞文本二級(jí)輸入向量分析——以事故災(zāi)難新聞文本為例
        5.3.1 離散度向量分析
        5.3.2 文本長(zhǎng)度分析
        5.3.3 詞向量維度分析
    5.4 突發(fā)事件新聞文本二級(jí)模型分析——以事故災(zāi)難新聞文本為例
        5.4.1 MLP模型參數(shù)調(diào)整
        5.4.2 Text-CNN模型參數(shù)調(diào)整
        5.4.3 Text-RNN模型調(diào)參
        5.4.4 分類模型對(duì)比實(shí)驗(yàn)
    5.5 結(jié)果分析
    5.6 本章小結(jié)
第6章 總結(jié)與展望
    6.1 本文總結(jié)
    6.2 未來(lái)展望
致謝
參考文獻(xiàn)
攻讀碩士期間獲得與學(xué)位論文相關(guān)的科研成果
攻讀碩士學(xué)位期間參與的科研項(xiàng)目



本文編號(hào):3881580

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/xinwenchuanbolunwen/3881580.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7a696***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com