面向社交網(wǎng)絡(luò)文本的情緒分析方法研究
發(fā)布時間:2021-03-31 07:25
隨著互聯(lián)網(wǎng)技術(shù)與社交網(wǎng)絡(luò)平臺的迅猛發(fā)展,人們通過網(wǎng)絡(luò)發(fā)表觀點、分享信息,產(chǎn)生了大量含有情緒信息的文本數(shù)據(jù)。這些數(shù)據(jù)中蘊藏著豐富的社會價值與商業(yè)價值,吸引了眾多學者對文本情緒分析研究的關(guān)注。但由于網(wǎng)絡(luò)文本大多篇幅較短且形式多樣,使得情緒分析工作變得較為困難。另外,伴隨文化交流的日益增加,多種語言混合的表達方式也被廣泛應(yīng)用在知乎、微博、Twitter等網(wǎng)絡(luò)平臺。若將此類文本轉(zhuǎn)換為同種語言進行情緒分析,可能會造成語義變化、信息丟失等問題。為此,本文對句子級文本以及中英文混合文本的情緒分析方法展開深入研究,主要工作分為以下兩個方面:(1)提出基于情緒認知模型(OCC模型)和貝葉斯網(wǎng)絡(luò)的情緒句分類方法。本文從認知心理學的角度分析OCC模型的情緒生成過程,從中提取一組情緒評估變量,并通過對文本進行句法、語義分析,提出基于語義關(guān)系的情緒評估變量賦值算法。為避免句中信息缺失所帶來的影響,本文將情緒評估變量作為貝葉斯網(wǎng)絡(luò)的節(jié)點并結(jié)合表情符號特征,經(jīng)結(jié)構(gòu)、參數(shù)學習得到情緒分類貝葉斯網(wǎng)絡(luò)(ECBN)。在公開評測數(shù)據(jù)集上進行實驗,結(jié)果表明在添加表情特征后,寬松標準與嚴格標準條件下的平均精度分別提升5.5%、4...
【文章來源】:鄭州大學河南省 211工程院校
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【部分圖文】:
情緒生成規(guī)則示例圖
圖 2.2 聯(lián)合樹的建立過程基本思想是通過在樣本面能將不同類別的數(shù)據(jù)的決策面為直線 A,右線,即它們在二維空間射至三維空間再次尋找核函數(shù)可在一定程度上據(jù)映射至高維空間中,
該平面能將不同類別的數(shù)據(jù)點分隔開以實現(xiàn)分類。如圖2.3 所示,左圖(a)中數(shù)據(jù)的決策面為直線 A,右圖(b)中顯示的數(shù)據(jù)無法找到能夠?qū)⑵鋭澐譃閮深惖闹本,即它們在二維空間中是非線性可分的,對于這種情況則需要將這些數(shù)據(jù)映射至三維空間再次尋找決策面。當空間維數(shù)過高時會帶來龐大的計算量,引入核函數(shù)可在一定程度上緩解計算困難,它能將低維空間中非線性可分的兩類數(shù)據(jù)映射至高維空間中,使其變得線性可分。(a) (b)圖 2.3 線性可分與線性不可分
【參考文獻】:
期刊論文
[1]多語言文本情緒分析模型MF-CSEL[J]. 徐源音,柴玉梅,王黎明,劉箴. 小型微型計算機系統(tǒng). 2019(05)
[2]文本情緒分析綜述[J]. 李然,林政,林海倫,王偉平,孟丹. 計算機研究與發(fā)展. 2018(01)
[3]一種基于OCC模型的文本情感挖掘方法[J]. 皇甫璐雯,毛文吉. 智能系統(tǒng)學報. 2017(05)
[4]Twitter推文與情感詞典SentiWordNet匹配算法研究[J]. 易順明,周洪斌,周國棟. 南京師范大學學報(工程技術(shù)版). 2016(03)
[5]基于雙語詞典的微博多類情感分析方法[J]. 栗雨晴,禮欣,韓煦,宋丹丹,廖樂健. 電子學報. 2016(09)
[6]基于同義詞詞林信息特征的語義角色自動標注[J]. 李國臣,呂雷,王瑞波,李濟洪,李茹. 中文信息學報. 2016(01)
[7]代價敏感分類算法的實驗比較[J]. 閆明松,周志華. 模式識別與人工智能. 2005(05)
[8]情緒研究中的若干問題綜述[J]. 石林. 心理學動態(tài). 2000(01)
[9]漢語自動分詞研究中的苦干理論問題[J]. 孫茂松,鄒嘉彥. 語言文字應(yīng)用. 1995(04)
[10]情感詞匯本體的構(gòu)造[J]. 徐琳宏,林鴻飛,潘宇,任惠,陳建美. 情報學報. 2008 (02)
碩士論文
[1]基于OCC模型的文本情感識別方法的研究[D]. 龐娜.太原理工大學 2008
本文編號:3111046
【文章來源】:鄭州大學河南省 211工程院校
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【部分圖文】:
情緒生成規(guī)則示例圖
圖 2.2 聯(lián)合樹的建立過程基本思想是通過在樣本面能將不同類別的數(shù)據(jù)的決策面為直線 A,右線,即它們在二維空間射至三維空間再次尋找核函數(shù)可在一定程度上據(jù)映射至高維空間中,
該平面能將不同類別的數(shù)據(jù)點分隔開以實現(xiàn)分類。如圖2.3 所示,左圖(a)中數(shù)據(jù)的決策面為直線 A,右圖(b)中顯示的數(shù)據(jù)無法找到能夠?qū)⑵鋭澐譃閮深惖闹本,即它們在二維空間中是非線性可分的,對于這種情況則需要將這些數(shù)據(jù)映射至三維空間再次尋找決策面。當空間維數(shù)過高時會帶來龐大的計算量,引入核函數(shù)可在一定程度上緩解計算困難,它能將低維空間中非線性可分的兩類數(shù)據(jù)映射至高維空間中,使其變得線性可分。(a) (b)圖 2.3 線性可分與線性不可分
【參考文獻】:
期刊論文
[1]多語言文本情緒分析模型MF-CSEL[J]. 徐源音,柴玉梅,王黎明,劉箴. 小型微型計算機系統(tǒng). 2019(05)
[2]文本情緒分析綜述[J]. 李然,林政,林海倫,王偉平,孟丹. 計算機研究與發(fā)展. 2018(01)
[3]一種基于OCC模型的文本情感挖掘方法[J]. 皇甫璐雯,毛文吉. 智能系統(tǒng)學報. 2017(05)
[4]Twitter推文與情感詞典SentiWordNet匹配算法研究[J]. 易順明,周洪斌,周國棟. 南京師范大學學報(工程技術(shù)版). 2016(03)
[5]基于雙語詞典的微博多類情感分析方法[J]. 栗雨晴,禮欣,韓煦,宋丹丹,廖樂健. 電子學報. 2016(09)
[6]基于同義詞詞林信息特征的語義角色自動標注[J]. 李國臣,呂雷,王瑞波,李濟洪,李茹. 中文信息學報. 2016(01)
[7]代價敏感分類算法的實驗比較[J]. 閆明松,周志華. 模式識別與人工智能. 2005(05)
[8]情緒研究中的若干問題綜述[J]. 石林. 心理學動態(tài). 2000(01)
[9]漢語自動分詞研究中的苦干理論問題[J]. 孫茂松,鄒嘉彥. 語言文字應(yīng)用. 1995(04)
[10]情感詞匯本體的構(gòu)造[J]. 徐琳宏,林鴻飛,潘宇,任惠,陳建美. 情報學報. 2008 (02)
碩士論文
[1]基于OCC模型的文本情感識別方法的研究[D]. 龐娜.太原理工大學 2008
本文編號:3111046
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3111046.html
最近更新
教材專著