英文評論文本的情感分類和評價對象識別研究
發(fā)布時間:2021-08-12 19:06
近年來隨著電子商務(wù)和社交媒體的迅速發(fā)展,越來越多的人活躍于網(wǎng)絡(luò)中并產(chǎn)生海量文本數(shù)據(jù),其中包含著大量的情感信息,為了挖掘和獲取文本中有價值的情感信息,產(chǎn)品評論文本的情感分析研究受到越來越多的關(guān)注。文本情感分析是挖掘人們在主觀性網(wǎng)絡(luò)文本中表達的態(tài)度、情緒。本文考慮到在判斷文本的情感傾向時不同句子的重要程度不同,對英文評論文本進行基于關(guān)鍵句抽取的情感分類。同時,本文對評論文本中細粒度的評價對象進行識別,使情感分析工作更加細化。具體研究工作如下:在基于關(guān)鍵句抽取的情感分類研究中,針對已有的方法大都是基于特征屬性權(quán)重抽取情感關(guān)鍵句,忽略了Title和上下文信息的問題,本文提出了基于Title和加權(quán)TextRank抽取關(guān)鍵句的情感分類研究。首先通過兩個途徑抽取情感關(guān)鍵句,一方面構(gòu)建擴展語義規(guī)則模板和情感詞典,基于此計算Title的情感得分,從而判斷Title的貢獻度,以此來決定Title作為情感關(guān)鍵句的條數(shù);另一方面,根據(jù)加權(quán)TextRank算法思想,在文本正文中構(gòu)建一個情感句加權(quán)有向圖來提取關(guān)鍵句,并詳細介紹了四個影響有向邊權(quán)重的因素。然后將情感關(guān)鍵句、細節(jié)句和全文句得到的情感分類結(jié)果分別作為特...
【文章來源】:安徽大學安徽省 211工程院校
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
線性可分支持向量機D={(x,y),(x,y),...,(x,y)}
第二章相關(guān)內(nèi)容和方法介紹12接近線性可分時,引入松弛變量讓模型能容忍一些錯誤,稱為線性支持向量機,見圖2.2。圖2.2線性支持向量機現(xiàn)實生活中還有很多數(shù)據(jù)是線性不可分時,比如二維空間中的異或問題,利用高維映射方法可以將其轉(zhuǎn)換為線性可分問題,如將其映射到三維空間中再進行線性分類。支持向量機中核函數(shù)就是這個原理,當數(shù)據(jù)在初始空間中無法線性劃分時,通過核技巧將其映射到更高維空間中進行線性劃分,稱為非線性支持向量機,見圖2.3。圖2.3非線性支持向量機2.3.3概率圖模型概率圖模型(ProbabilisticGraphicalModel,PGM)是將變量之間依賴關(guān)系用圖表示,樣本數(shù)據(jù)用圖G(V,E)建模,節(jié)點V為隨機變量,邊E為概率依賴關(guān)系,通常用Y=(y1,y2,...,yn)為隨機變量建模,具有聯(lián)合概率分布P(Y)。概率圖模型是一個統(tǒng)稱,其中經(jīng)典的標注模型有隱馬爾可夫模型(HiddenMarkov
第二章相關(guān)內(nèi)容和方法介紹12接近線性可分時,引入松弛變量讓模型能容忍一些錯誤,稱為線性支持向量機,見圖2.2。圖2.2線性支持向量機現(xiàn)實生活中還有很多數(shù)據(jù)是線性不可分時,比如二維空間中的異或問題,利用高維映射方法可以將其轉(zhuǎn)換為線性可分問題,如將其映射到三維空間中再進行線性分類。支持向量機中核函數(shù)就是這個原理,當數(shù)據(jù)在初始空間中無法線性劃分時,通過核技巧將其映射到更高維空間中進行線性劃分,稱為非線性支持向量機,見圖2.3。圖2.3非線性支持向量機2.3.3概率圖模型概率圖模型(ProbabilisticGraphicalModel,PGM)是將變量之間依賴關(guān)系用圖表示,樣本數(shù)據(jù)用圖G(V,E)建模,節(jié)點V為隨機變量,邊E為概率依賴關(guān)系,通常用Y=(y1,y2,...,yn)為隨機變量建模,具有聯(lián)合概率分布P(Y)。概率圖模型是一個統(tǒng)稱,其中經(jīng)典的標注模型有隱馬爾可夫模型(HiddenMarkov
【參考文獻】:
期刊論文
[1]基于LSTM網(wǎng)絡(luò)的評價對象和評價詞抽取[J]. 李盛秋,趙妍妍,秦兵,劉挺. 智能計算機與應(yīng)用. 2017(05)
[2]基于加權(quán)TextRank的新聞關(guān)鍵事件主題句提取[J]. 蒲梅,周楓,周晶晶,嚴馨,周蘭江. 計算機工程. 2017(08)
[3]PORSC:融合用戶個性化特征的在線評論情感分類模型[J]. 宋曉勇,呂品,陳年生. 復旦學報(自然科學版). 2017(03)
[4]情感傾向分析在輿情監(jiān)控方面的研究[J]. 王林,李昀澤. 微型機與應(yīng)用. 2017(05)
[5]基于迭代兩步CRF模型的評價對象與極性抽取研究[J]. 張盛,李芳. 中文信息學報. 2015(01)
[6]基于情感關(guān)鍵句抽取的情感分類研究[J]. 林政,譚松波,程學旗. 計算機研究與發(fā)展. 2012(11)
[7]基于主題情感混合模型的無監(jiān)督文本情感分析[J]. 孫艷,周學廣,付偉. 北京大學學報(自然科學版). 2013(01)
[8]文本情感分析[J]. 趙妍妍,秦兵,劉挺. 軟件學報. 2010(08)
本文編號:3338898
【文章來源】:安徽大學安徽省 211工程院校
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
線性可分支持向量機D={(x,y),(x,y),...,(x,y)}
第二章相關(guān)內(nèi)容和方法介紹12接近線性可分時,引入松弛變量讓模型能容忍一些錯誤,稱為線性支持向量機,見圖2.2。圖2.2線性支持向量機現(xiàn)實生活中還有很多數(shù)據(jù)是線性不可分時,比如二維空間中的異或問題,利用高維映射方法可以將其轉(zhuǎn)換為線性可分問題,如將其映射到三維空間中再進行線性分類。支持向量機中核函數(shù)就是這個原理,當數(shù)據(jù)在初始空間中無法線性劃分時,通過核技巧將其映射到更高維空間中進行線性劃分,稱為非線性支持向量機,見圖2.3。圖2.3非線性支持向量機2.3.3概率圖模型概率圖模型(ProbabilisticGraphicalModel,PGM)是將變量之間依賴關(guān)系用圖表示,樣本數(shù)據(jù)用圖G(V,E)建模,節(jié)點V為隨機變量,邊E為概率依賴關(guān)系,通常用Y=(y1,y2,...,yn)為隨機變量建模,具有聯(lián)合概率分布P(Y)。概率圖模型是一個統(tǒng)稱,其中經(jīng)典的標注模型有隱馬爾可夫模型(HiddenMarkov
第二章相關(guān)內(nèi)容和方法介紹12接近線性可分時,引入松弛變量讓模型能容忍一些錯誤,稱為線性支持向量機,見圖2.2。圖2.2線性支持向量機現(xiàn)實生活中還有很多數(shù)據(jù)是線性不可分時,比如二維空間中的異或問題,利用高維映射方法可以將其轉(zhuǎn)換為線性可分問題,如將其映射到三維空間中再進行線性分類。支持向量機中核函數(shù)就是這個原理,當數(shù)據(jù)在初始空間中無法線性劃分時,通過核技巧將其映射到更高維空間中進行線性劃分,稱為非線性支持向量機,見圖2.3。圖2.3非線性支持向量機2.3.3概率圖模型概率圖模型(ProbabilisticGraphicalModel,PGM)是將變量之間依賴關(guān)系用圖表示,樣本數(shù)據(jù)用圖G(V,E)建模,節(jié)點V為隨機變量,邊E為概率依賴關(guān)系,通常用Y=(y1,y2,...,yn)為隨機變量建模,具有聯(lián)合概率分布P(Y)。概率圖模型是一個統(tǒng)稱,其中經(jīng)典的標注模型有隱馬爾可夫模型(HiddenMarkov
【參考文獻】:
期刊論文
[1]基于LSTM網(wǎng)絡(luò)的評價對象和評價詞抽取[J]. 李盛秋,趙妍妍,秦兵,劉挺. 智能計算機與應(yīng)用. 2017(05)
[2]基于加權(quán)TextRank的新聞關(guān)鍵事件主題句提取[J]. 蒲梅,周楓,周晶晶,嚴馨,周蘭江. 計算機工程. 2017(08)
[3]PORSC:融合用戶個性化特征的在線評論情感分類模型[J]. 宋曉勇,呂品,陳年生. 復旦學報(自然科學版). 2017(03)
[4]情感傾向分析在輿情監(jiān)控方面的研究[J]. 王林,李昀澤. 微型機與應(yīng)用. 2017(05)
[5]基于迭代兩步CRF模型的評價對象與極性抽取研究[J]. 張盛,李芳. 中文信息學報. 2015(01)
[6]基于情感關(guān)鍵句抽取的情感分類研究[J]. 林政,譚松波,程學旗. 計算機研究與發(fā)展. 2012(11)
[7]基于主題情感混合模型的無監(jiān)督文本情感分析[J]. 孫艷,周學廣,付偉. 北京大學學報(自然科學版). 2013(01)
[8]文本情感分析[J]. 趙妍妍,秦兵,劉挺. 軟件學報. 2010(08)
本文編號:3338898
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3338898.html
最近更新
教材專著