天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向網(wǎng)絡敏感信息的主題識別及其情感分析技術研究

發(fā)布時間:2024-07-05 02:39
  隨著網(wǎng)絡和互聯(lián)網(wǎng)設備的快速發(fā)展,人們訪問互聯(lián)網(wǎng)信息的方式正在從被動接受轉(zhuǎn)變?yōu)橹鲃觿?chuàng)建和分享。網(wǎng)絡的開放性、便捷性使得越來越多的網(wǎng)絡用戶選擇在網(wǎng)絡上發(fā)布一些信息,或表達看法,或僅僅宣泄一種情緒。這些信息在輿論的形成和傳播中起著重要作用,也存在一定的潛在安全威脅。因此,如何在大量網(wǎng)絡文本中挖掘潛在主題及對人們所發(fā)表文本的情感傾向進行分析是一個很有研究價值的課題。本文將針對網(wǎng)絡文本進行以下研究:1)針對目前主題識別模型對一些帶有敏感傾向性的詞匯或領域詞匯識別率不高、生成的主題詞不準確等問題,本文提出了一種基于Key word weighted-LDA模型的網(wǎng)絡文本信息主題識別模型。該模型將構(gòu)建的關鍵詞詞表嵌入到LDA主題模型中,以改善LDA模型對敏感傾向詞匯或領域詞匯的語義理解和識別能力,提升生成的主題詞質(zhì)量,另一方面也可以提高主題詞與相關主題的關聯(lián)度,發(fā)現(xiàn)更多細粒度主題詞。實驗結(jié)果表明,Key word weighted-LDA模型可以有效提升關鍵詞的識別數(shù)量和質(zhì)量,提升主題識別能力。2)網(wǎng)絡文本情感分析研究。本文的情感分析任務在特定主題下進行,基于此,本文提出了一種融合主題語義信息的文本...

【文章頁數(shù)】:68 頁

【學位級別】:碩士

【部分圖文】:

圖1-1本文主要研究內(nèi)容??可以概括為以下兩個方面:??1)對主題識別技術進行深入研究,提出了基于KeyWordweighted-LDA模型的網(wǎng)絡??

圖1-1本文主要研究內(nèi)容??可以概括為以下兩個方面:??1)對主題識別技術進行深入研究,提出了基于KeyWordweighted-LDA模型的網(wǎng)絡??

1.3本文主要研究內(nèi)容??本文主要研宄對象是網(wǎng)絡新聞文本,對網(wǎng)絡新聞文本中所包含的隱含主題進行識別,??進而對主題下的評論文本進行情感傾向性分析。本文總體研究內(nèi)容如圖1-1所示。??|?.?I?:??主題識別?i?i?情感分析??1?1??|?\?^?\?I?/?\?!??|?I....


圖2-2?LDA的圖形模型表示??圖中的框線表示內(nèi)部是可重復的過程,外部的框線表示文檔,內(nèi)部的框線表示文檔??

圖2-2?LDA的圖形模型表示??圖中的框線表示內(nèi)部是可重復的過程,外部的框線表示文檔,內(nèi)部的框線表示文檔??

CBOW模型示意圖?Skip-Gram模型示意圖??圖2-1?CBOW和Skip-Gram模型示意圖??CBOW模型和Skip-gram模型都包括輸入層、投影層和輸出層。CBOW模型是基于上??下文的分布對目標詞進行預測,對于詞w(A:),其上下文為其前后的各(個特征詞:??co....


圖2-3包含四個層的CNN模型??

圖2-3包含四個層的CNN模型??

@?r-Q--|???桃人]?丨以[i,j??圖2-2?LDA的圖形模型表示??圖中的框線表示內(nèi)部是可重復的過程,外部的框線表示文檔,內(nèi)部的框線表示文檔??中主題和特征詞的重復選擇過程。??2.3深度學習相關理論??深度學習己成為一種強大的機器學習技術,其可以學習數(shù)據(jù)的多層表示或....


圖2-4基礎RNN模型??

圖2-4基礎RNN模型??

行卷積?輸出??圖2-3包含四個層的CNN模型??每層的表7JK為:??輸入層(Inputlayer):長度為n的句子表不為:??xb,?=?X】十x2十…十xn?(2-5)??其中,x1:?表示詞:^至七的連接,jc,.?表示第i個詞的詞向量,詞向量維度為d,??十表示連接運算....



本文編號:4000915

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/4000915.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c8f0c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com