基于機(jī)器學(xué)習(xí)的中文豆瓣影評(píng)情感強(qiáng)度分析
發(fā)布時(shí)間:2023-11-12 16:14
文本情感傾向和情感強(qiáng)度分類一直是自然語(yǔ)言處理領(lǐng)域中的研究熱點(diǎn)。文本情感分類是一門綜合語(yǔ)言學(xué)、生理學(xué)、計(jì)算機(jī)學(xué)、自然語(yǔ)言處理的交叉性研究課題。本文基于中文豆瓣短影評(píng)的語(yǔ)料,從傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)兩個(gè)重要的文本挖掘方法出發(fā),研究中文豆瓣影評(píng)的情感極性和情感強(qiáng)度分類,提出結(jié)合深度神經(jīng)網(wǎng)絡(luò)CNN-CRFs的機(jī)器學(xué)習(xí)模型結(jié)構(gòu),情感分類效果得到顯著提升。主要研究?jī)?nèi)容和創(chuàng)新點(diǎn)介紹如下:1、闡述了自然語(yǔ)言處理領(lǐng)域文本挖掘的研究背景與意義;谥形挠霸u(píng)情感分類,研究了時(shí)下熱門的技術(shù)與理論知識(shí)。結(jié)合深度學(xué)習(xí)方法的研究現(xiàn)狀以及意義,分析了深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn)以及在處理文本挖掘方面的常用方法。2、基于本文提取的觀點(diǎn)句,比較傳統(tǒng)機(jī)器學(xué)習(xí)模型和深度神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)模型的情感強(qiáng)度分類效果,提出兩種方法相融合的分類模型。3、構(gòu)建三分類的情感知識(shí)庫(kù),將領(lǐng)域無(wú)關(guān)情感詞、領(lǐng)域有關(guān)情感詞和網(wǎng)絡(luò)用語(yǔ)收入其中并擴(kuò)充詞量。比較文本特征與情感特征、基于規(guī)則的與基于機(jī)器學(xué)習(xí)的方法以及算法模型之間在辨別觀點(diǎn)句時(shí)的分類效果。4、提出基于層級(jí)的傳統(tǒng)機(jī)器學(xué)習(xí)分類方法,將情感傾向性分類和情感強(qiáng)度分類單獨(dú)處理。先將SVM模型用于情感傾向性三分...
【文章頁(yè)數(shù)】:80 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究的背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 對(duì)文本情感分析的研究
1.2.2 基于電影評(píng)論的情感分析的研究
1.2.3 基于深度學(xué)習(xí)文本挖掘的研究
1.3 本文的貢獻(xiàn)
1.4 論文結(jié)構(gòu)
第二章 相關(guān)理論和工具
2.1 文本特征提取方法
2.2 分類算法分析
2.3 常用工具介紹
2.4 本章小結(jié)
第三章 基于觀點(diǎn)句提取的特征比較方法
3.1 預(yù)處理
3.1.1 分詞與標(biāo)注
3.1.2 三分類情感詞典構(gòu)建
3.2 基于規(guī)則的觀點(diǎn)句提取方法
3.2.1 觀點(diǎn)句提取基本步驟
3.2.2 消除無(wú)指代的規(guī)則處理方法
3.3 基于機(jī)器學(xué)習(xí)的觀點(diǎn)句提取算法
3.3.1 三種方法的實(shí)現(xiàn)
3.3.2 文本特征
3.3.3 情感特征
3.4 基于規(guī)則和機(jī)器學(xué)習(xí)的觀點(diǎn)句提取方法
3.5 實(shí)驗(yàn)結(jié)果和討論
3.5.1 實(shí)驗(yàn)數(shù)據(jù)
3.5.2 實(shí)驗(yàn)標(biāo)準(zhǔn)
3.5.3 實(shí)驗(yàn)結(jié)果與討論
3.6 本章小結(jié)
第四章 基于層級(jí)統(tǒng)計(jì)分類方法的情感傾向性和情感強(qiáng)度分析
4.1 情感極性相關(guān)研究
4.2 情感傾向性分析
4.2.1 特征選取
4.2.2 分類器選取
4.3 情感強(qiáng)度分析
4.4 實(shí)驗(yàn)結(jié)果和討論
4.5 本章小結(jié)
第五章 基于CNN-CRFs的文本情感強(qiáng)度分析
5.1 深度學(xué)習(xí)的實(shí)現(xiàn)
5.1.1 深度神經(jīng)網(wǎng)絡(luò)
5.1.2 深度學(xué)習(xí)理論
5.1.3 深度學(xué)習(xí)常用實(shí)現(xiàn)方法
5.2 卷積神經(jīng)網(wǎng)絡(luò)
5.2.1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
5.3 基于CNN-CRFs的文本情感強(qiáng)度分析
5.4 實(shí)驗(yàn)結(jié)果和討論
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
本文編號(hào):3863498
【文章頁(yè)數(shù)】:80 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究的背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 對(duì)文本情感分析的研究
1.2.2 基于電影評(píng)論的情感分析的研究
1.2.3 基于深度學(xué)習(xí)文本挖掘的研究
1.3 本文的貢獻(xiàn)
1.4 論文結(jié)構(gòu)
第二章 相關(guān)理論和工具
2.1 文本特征提取方法
2.2 分類算法分析
2.3 常用工具介紹
2.4 本章小結(jié)
第三章 基于觀點(diǎn)句提取的特征比較方法
3.1 預(yù)處理
3.1.1 分詞與標(biāo)注
3.1.2 三分類情感詞典構(gòu)建
3.2 基于規(guī)則的觀點(diǎn)句提取方法
3.2.1 觀點(diǎn)句提取基本步驟
3.2.2 消除無(wú)指代的規(guī)則處理方法
3.3 基于機(jī)器學(xué)習(xí)的觀點(diǎn)句提取算法
3.3.1 三種方法的實(shí)現(xiàn)
3.3.2 文本特征
3.3.3 情感特征
3.4 基于規(guī)則和機(jī)器學(xué)習(xí)的觀點(diǎn)句提取方法
3.5 實(shí)驗(yàn)結(jié)果和討論
3.5.1 實(shí)驗(yàn)數(shù)據(jù)
3.5.2 實(shí)驗(yàn)標(biāo)準(zhǔn)
3.5.3 實(shí)驗(yàn)結(jié)果與討論
3.6 本章小結(jié)
第四章 基于層級(jí)統(tǒng)計(jì)分類方法的情感傾向性和情感強(qiáng)度分析
4.1 情感極性相關(guān)研究
4.2 情感傾向性分析
4.2.1 特征選取
4.2.2 分類器選取
4.3 情感強(qiáng)度分析
4.4 實(shí)驗(yàn)結(jié)果和討論
4.5 本章小結(jié)
第五章 基于CNN-CRFs的文本情感強(qiáng)度分析
5.1 深度學(xué)習(xí)的實(shí)現(xiàn)
5.1.1 深度神經(jīng)網(wǎng)絡(luò)
5.1.2 深度學(xué)習(xí)理論
5.1.3 深度學(xué)習(xí)常用實(shí)現(xiàn)方法
5.2 卷積神經(jīng)網(wǎng)絡(luò)
5.2.1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
5.3 基于CNN-CRFs的文本情感強(qiáng)度分析
5.4 實(shí)驗(yàn)結(jié)果和討論
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
本文編號(hào):3863498
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3863498.html
最近更新
教材專著