基于Doc2vec和深度學(xué)習(xí)的文本情感分析研究
發(fā)布時間:2021-11-04 11:11
情感分析作為自然語言處理的重要組成部分之一,其主要任務(wù)是識別和處理給定文本中包含的情感極性、強(qiáng)度等信息。目前情感分析技術(shù)廣泛用于輿論監(jiān)測、金融分析、決策支持等任務(wù)當(dāng)中,對政府、金融、商業(yè)等領(lǐng)域產(chǎn)生了重要影響。以往的研究將重點放在情感詞典的構(gòu)造和特征提取方法的改進(jìn)上,但其采用的方法耗時耗力不宜維護(hù)且遷移性差。近年來深度學(xué)習(xí)因其可自動學(xué)習(xí)數(shù)據(jù)特征的優(yōu)勢成為了自然語言處理的主流研究方法,然而該方法在處理情感分析時忽略了詞序信息對分類結(jié)果的影響,且在提取句子結(jié)構(gòu)和過濾無效信息方面也有不足。因此,通過改進(jìn)深度學(xué)習(xí)模型來解決上述問題對于提高文本情感分析的性能有著重要意義;谝陨系目紤],首先,本文為了解決深度學(xué)習(xí)情感分析方法在獲取詞序信息和句子結(jié)構(gòu)信息方面的不足,設(shè)計了一種結(jié)合Doc2vec的卷積神經(jīng)網(wǎng)絡(luò)模型CMCNN。一方面,將Doc2vec模型訓(xùn)練得到的段落向量作為卷積神經(jīng)網(wǎng)絡(luò)連接層的附加向量來提供傳統(tǒng)詞向量所欠缺的詞序信息。另一方面,本文的CNN模型在池化層上與傳統(tǒng)的CNN不同,采用Chunk Max Pooling策略保證CNN模型在訓(xùn)練過程中獲取重要特征的同時保留其位置信息,從而使得該模...
【文章來源】:華北電力大學(xué)河北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
017.12-2018.06中國網(wǎng)民各類互聯(lián)網(wǎng)應(yīng)用使用率
圖 1-2 基于情感詞典和規(guī)則的文本情感分析流程基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法則是一種有監(jiān)督的分類方法,它與上一類解決辦法的不同之處在于:機(jī)器學(xué)習(xí)方法并不關(guān)心文本中相關(guān)詞的情感極性,它是通過對已經(jīng)被標(biāo)注了情感類別的文本進(jìn)行學(xué)習(xí)來獲取分類能力。采用機(jī)器學(xué)習(xí)來處理情感分析需要將一些已標(biāo)注好情感類型的文本作為訓(xùn)練集,輸入到諸如支持向量機(jī)(SVM)、邏輯回歸、樸素貝葉斯等機(jī)器學(xué)習(xí)算法中進(jìn)行分類訓(xùn)練,再通過已標(biāo)注情感類別的測試集對分類模型進(jìn)行性能評估,最終獲得一個可以進(jìn)行正確分類的情感分類器。分類器訓(xùn)練成功后就可以對未標(biāo)記類別的待分類文本進(jìn)行分類處理了。其工作流程如圖 1-3 所示。
圖 1-2 基于情感詞典和規(guī)則的文本情感分析流程基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法則是一種有監(jiān)督的分類方法,它與上一類解決辦法的不同之處在于:機(jī)器學(xué)習(xí)方法并不關(guān)心文本中相關(guān)詞的情感極性,它是通過對已經(jīng)被標(biāo)注了情感類別的文本進(jìn)行學(xué)習(xí)來獲取分類能力。采用機(jī)器學(xué)習(xí)來處理情感分析需要將一些已標(biāo)注好情感類型的文本作為訓(xùn)練集,輸入到諸如支持向量機(jī)(SVM)、邏輯回歸、樸素貝葉斯等機(jī)器學(xué)習(xí)算法中進(jìn)行分類訓(xùn)練,再通過已標(biāo)注情感類別的測試集對分類模型進(jìn)行性能評估,最終獲得一個可以進(jìn)行正確分類的情感分類器。分類器訓(xùn)練成功后就可以對未標(biāo)記類別的待分類文本進(jìn)行分類處理了。其工作流程如圖 1-3 所示。
【參考文獻(xiàn)】:
期刊論文
[1]分段卷積神經(jīng)網(wǎng)絡(luò)在文本情感分析中的應(yīng)用[J]. 杜昌順,黃磊. 計算機(jī)工程與科學(xué). 2017(01)
博士論文
[1]文本情感分類及觀點摘要關(guān)鍵問題研究[D]. 張冬梅.山東大學(xué) 2012
碩士論文
[1]目標(biāo)函數(shù)與策略優(yōu)化的文本情感分析研究[D]. 鞏世兵.浙江大學(xué) 2017
[2]聚類算法和卷積神經(jīng)網(wǎng)絡(luò)在文本情感分析中的應(yīng)用研究[D]. 何云超.云南大學(xué) 2016
[3]基于深度學(xué)習(xí)的情感詞向量及文本情感分析的研究[D]. 張志華.華東師范大學(xué) 2016
[4]面向英文電影評論的文本情感傾向性分類研究[D]. 馮莉.大連海事大學(xué) 2013
本文編號:3475608
【文章來源】:華北電力大學(xué)河北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
017.12-2018.06中國網(wǎng)民各類互聯(lián)網(wǎng)應(yīng)用使用率
圖 1-2 基于情感詞典和規(guī)則的文本情感分析流程基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法則是一種有監(jiān)督的分類方法,它與上一類解決辦法的不同之處在于:機(jī)器學(xué)習(xí)方法并不關(guān)心文本中相關(guān)詞的情感極性,它是通過對已經(jīng)被標(biāo)注了情感類別的文本進(jìn)行學(xué)習(xí)來獲取分類能力。采用機(jī)器學(xué)習(xí)來處理情感分析需要將一些已標(biāo)注好情感類型的文本作為訓(xùn)練集,輸入到諸如支持向量機(jī)(SVM)、邏輯回歸、樸素貝葉斯等機(jī)器學(xué)習(xí)算法中進(jìn)行分類訓(xùn)練,再通過已標(biāo)注情感類別的測試集對分類模型進(jìn)行性能評估,最終獲得一個可以進(jìn)行正確分類的情感分類器。分類器訓(xùn)練成功后就可以對未標(biāo)記類別的待分類文本進(jìn)行分類處理了。其工作流程如圖 1-3 所示。
圖 1-2 基于情感詞典和規(guī)則的文本情感分析流程基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法則是一種有監(jiān)督的分類方法,它與上一類解決辦法的不同之處在于:機(jī)器學(xué)習(xí)方法并不關(guān)心文本中相關(guān)詞的情感極性,它是通過對已經(jīng)被標(biāo)注了情感類別的文本進(jìn)行學(xué)習(xí)來獲取分類能力。采用機(jī)器學(xué)習(xí)來處理情感分析需要將一些已標(biāo)注好情感類型的文本作為訓(xùn)練集,輸入到諸如支持向量機(jī)(SVM)、邏輯回歸、樸素貝葉斯等機(jī)器學(xué)習(xí)算法中進(jìn)行分類訓(xùn)練,再通過已標(biāo)注情感類別的測試集對分類模型進(jìn)行性能評估,最終獲得一個可以進(jìn)行正確分類的情感分類器。分類器訓(xùn)練成功后就可以對未標(biāo)記類別的待分類文本進(jìn)行分類處理了。其工作流程如圖 1-3 所示。
【參考文獻(xiàn)】:
期刊論文
[1]分段卷積神經(jīng)網(wǎng)絡(luò)在文本情感分析中的應(yīng)用[J]. 杜昌順,黃磊. 計算機(jī)工程與科學(xué). 2017(01)
博士論文
[1]文本情感分類及觀點摘要關(guān)鍵問題研究[D]. 張冬梅.山東大學(xué) 2012
碩士論文
[1]目標(biāo)函數(shù)與策略優(yōu)化的文本情感分析研究[D]. 鞏世兵.浙江大學(xué) 2017
[2]聚類算法和卷積神經(jīng)網(wǎng)絡(luò)在文本情感分析中的應(yīng)用研究[D]. 何云超.云南大學(xué) 2016
[3]基于深度學(xué)習(xí)的情感詞向量及文本情感分析的研究[D]. 張志華.華東師范大學(xué) 2016
[4]面向英文電影評論的文本情感傾向性分類研究[D]. 馮莉.大連海事大學(xué) 2013
本文編號:3475608
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3475608.html
最近更新
教材專著