基于深度學習和CTM模型的文本情感分析研究
【文章頁數】:64 頁
【學位級別】:碩士
【部分圖文】:
圖2.1?pLSA概率圖??
之作,LSA模型在詞袋中引入了主題的概念,通過奇異值分解的方式??將大規(guī)模、高維度的稀疏文本降維到了一個低煒的空間,得到文檔的潛在語義,??加快了信息檢索,該研宂發(fā)現(xiàn)在低維空間中,同義詞會被聚類在一起。??2.1.2?pLSA?模型??然而,LSA模型并沒有建立統(tǒng)計學概念,所以,....
圖2.2?LDA模型圖??
后,它無法生成新的未知文檔,而且,隨著d和w的增??力口,該模型的計算復雜度也線性增加。??于是,針對這種問題,在2003年,Blei等人提出了?LDA模型,模型圖如圖??2.2所示,可以看到,LDA己經從pLSA的兩層貝葉斯模型變成了三層,下圖中,??a、#分別為文檔-主題、主....
圖2.3?CTM模型圖??和LDA中從狄利克雷分布中采樣生成文檔的主題多項式分布不同,在CTM??
?碩士學位論文??MASTER'S?THESIS??(3)從主題分布0中采樣生成文檔d的第J'個詞分布2。??(4)從詞分布0中米樣生成詞w。??對于LDA的求解,主要是需要估計其主題分布0和詞分布心首先,對文檔??的每個詞隨機給一個編號;然后,遍歷預料,對于每個詞,使用吉布斯采....
圖2.4?NNLM模型圖
?碩士學位論文??MASTER'S?THESIS??2.?2預訓練詞向置理論??詞向量作為自然語言處理中詞的一種表示方法,經歷了從統(tǒng)計方法到語言模??型方法的過渡,本小節(jié)主要介紹使用語言模型得到的詞向量表示。??所謂語言模型,就是指找出一個概率分布f,而對于給定的長為m的序列,?....
本文編號:3912329
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3912329.html