基于電商在線評(píng)論的文本情感傾向性分析
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1CBOW和Skip-gram模型的網(wǎng)絡(luò)結(jié)構(gòu)示意圖
2文本挖掘與情感分析理論11是位置索引。訓(xùn)練好的CBOW和Skip-gram模型并不用來(lái)進(jìn)行進(jìn)一步的測(cè)試,而是選取此時(shí)輸入層和隱藏層之間的權(quán)重矩陣進(jìn)行下一步的文本分析。而Skip-gram模型的思路則與CBOW不同,其區(qū)別在于,將一個(gè)特定詞的詞向量作為輸入,特定詞對(duì)應(yīng)的上下文詞向....
圖2.2隨機(jī)森林算法流程圖
重慶理工大學(xué)碩士學(xué)位論文14決定輸入的樣本應(yīng)該屬于哪一類,最多決策樹選擇的那一類就認(rèn)為是該輸入樣本的類別,隨機(jī)森林可以既可以處理屬性為離散值的量,如ID3算法,也可以處理屬性為連續(xù)值的量,如C4.5算法[37]。隨機(jī)森林的基礎(chǔ)模型是決策樹模型。決策樹(decisiontree)模....
圖2.3LDA模型
重慶理工大學(xué)碩士學(xué)位論文16Ng,AndrewY.,Jordan[46]于2003年提出,該模型的基本思想是:在一篇文檔中可能包含多個(gè)主題,意味著一個(gè)主題會(huì)在多個(gè)文檔中出現(xiàn),但出現(xiàn)在每篇文檔的概率有所差別。而對(duì)每個(gè)主題來(lái)說(shuō),會(huì)包含多個(gè)關(guān)鍵詞,同一個(gè)關(guān)鍵詞也會(huì)在多個(gè)主題中出現(xiàn),但出....
圖4.1基于情感詞典的文本情感傾向分類混淆矩陣
4文本情感傾向分類27圖4.1基于情感詞典的文本情感傾向分類混淆矩陣4.1.2基于機(jī)器學(xué)習(xí)的情感分類(1)特征提取及計(jì)算在構(gòu)建分類器之前,需要把分詞轉(zhuǎn)換成計(jì)算機(jī)可以處理的詞向量,本節(jié)將采用三種不同的文本特征提取方法對(duì)分詞文本進(jìn)行向量化,即TF-IDF方法,Word2vec方法,以....
本文編號(hào):3969912
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3969912.html