中文微博細粒度情感判別研究
本文關(guān)鍵詞:中文微博細粒度情感判別研究
更多相關(guān)文章: 中文微博 細粒度情感 多特征 向量機 判別
【摘要】:微博作為一種新型的社交網(wǎng)絡(luò)平臺,能隨時隨地發(fā)布簡短且內(nèi)容豐富的文本,這些信息有可能代表用戶的觀點或喜好,挖掘用戶這些信息對輿情監(jiān)控、市場營銷、謠言控制等都有重要意義。目前,對文本的情感分析側(cè)重于簡單的積極、消極二值分類。由于微博文本存在口語化嚴重,數(shù)據(jù)稀疏等問題,因此對情感深層次的細粒度判別是十分重要且必要的。本文工作包括以下兩個方面:(1)針對有明顯情感詞的微博,設(shè)計了一種基于情感元素模型的微博細粒度情感判別方法。根據(jù)依存句法,分析出句子中詞語間的依存關(guān)系,找出副詞、否定詞等詞語級情感影響因子,建立情感元素模型并計算分值,對每種粒度分別進行求和,將最大值所對應(yīng)的細粒度作為微博的情感的策略。(2)針對無明顯情感詞的微博,設(shè)計了一種多特征支持向量機的微博細粒度情感判別的方法。首先,在特征選擇階段進行改進,針對傳統(tǒng)卡方檢驗(CHI)特征選擇不穩(wěn)定性,只考慮微博條數(shù)而未考慮詞頻,提出一種卡方檢驗-詞頻逆文檔詞頻(CHI-TFIDF)的特征抽取方法,將詞頻、逆文檔詞頻引入到CHI算法中。實驗表明改進的CHI算法相比傳統(tǒng)CHI穩(wěn)定性和有效性均有所提高。將上述得到的特征詞再結(jié)合微博句子結(jié)構(gòu)和語義等特征引入到支持向量機算法中,訓(xùn)練模型最終得到細粒度判別結(jié)果。將本文提出的方法與傳統(tǒng)的機器學(xué)習(xí)算法支持向量機進行實驗比較,準確率和F值均高于支持向量機的,原因在于對有多重情感傾向的微博使用情感元素模型判別方式判別更準確。2014年以本文提供的方法參加第三屆自然語言處理與中文計算會議發(fā)布的中文微博情緒識別與分類評測任務(wù),在五個隊伍提交的七組結(jié)果中取得第二名好成績。
【關(guān)鍵詞】:中文微博 細粒度情感 多特征 向量機 判別
【學(xué)位授予單位】:南華大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1;TP393.092
【目錄】:
- 摘要4-6
- Abstract6-12
- 第1章 緒論12-20
- 1.1 課題研究背景及意義12-15
- 1.2 國內(nèi)外研究現(xiàn)狀15-17
- 1.3 本文的主要研究內(nèi)容17-18
- 1.4 論文組織結(jié)構(gòu)18-20
- 第2章 微博情感分類相關(guān)技術(shù)20-28
- 2.1 微博情感分類流程20-21
- 2.2 文本預(yù)處理21-22
- 2.2.1 中文分詞21-22
- 2.2.2 微博去噪22
- 2.3 特征選擇與權(quán)重計算22-25
- 2.3.1 特征選擇22-25
- 2.3.2 特征權(quán)重計算25
- 2.4 基于機器學(xué)習(xí)的文本分類算法25-26
- 2.5 本章小結(jié)26-28
- 第3章 中文微博細粒度情感判別方法28-44
- 3.1 中文微博情感細粒度判別流程28-29
- 3.2 基于情感元素模型的微博細粒度情感判別方法29-36
- 3.2.1 情感詞來源29-30
- 3.2.2 情感影響因子30-32
- 3.2.2.1 詞語級影響因子30-31
- 3.2.2.2 句子級影響因子31-32
- 3.2.3 情感元素模型32-34
- 3.2.3.1 依存句法32-33
- 3.2.3.2 情感元素模型33-34
- 3.2.4 微博細粒度情感判別34-36
- 3.2.4.1 情感權(quán)重值計算34-35
- 3.2.4.2 微博細粒度情感判別35-36
- 3.3 基于多特征支持向量機的微博細粒度情感判別方法36-43
- 3.3.1 基于卡方算法的微博情感特征選擇37-38
- 3.3.2 基于改進的卡方統(tǒng)計的微博情感特征選擇38-39
- 3.3.3 微博情感分類特征39-40
- 3.3.4 基于支持向量機的細粒度判別40-43
- 3.4 本章小結(jié)43-44
- 第4章 實驗44-52
- 4.1 實驗數(shù)據(jù)44
- 4.2 評價指標44-45
- 4.3 特征選擇實驗45-47
- 4.4 特征組合實驗47-48
- 4.5 NLPCC評測48-49
- 4.5.1 評測指標48-49
- 4.5.2 結(jié)果與分析49
- 4.6 情感分類對比實驗49-50
- 4.7 本章小結(jié)50-52
- 第5章 總結(jié)與展望52-54
- 5.1 本文總結(jié)52
- 5.2 工作展望52-54
- 參考文獻54-58
- 作者攻讀學(xué)位期間的科研成果58-59
- 致謝59
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 孫偉;李艷靈;周文勇;;細粒度基于傳遞功能的約束委托模型[J];信陽師范學(xué)院學(xué)報(自然科學(xué)版);2013年03期
2 夏汛;陳玲;;基于攔截器的細粒度權(quán)限設(shè)計[J];福建電腦;2012年11期
3 歐陽純萍;陽小華;雷龍艷;徐強;余穎;劉志明;;多策略中文微博細粒度情緒分析研究[J];北京大學(xué)學(xué)報(自然科學(xué)版);2014年01期
4 史大偉;袁天偉;;一種粗細粒度結(jié)合的動態(tài)污點分析方法[J];計算機工程;2014年03期
5 原子;于莉莉;劉超;;引入缺陷的細粒度軟件變更識別方法[J];北京航空航天大學(xué)學(xué)報;2014年09期
6 戢彥泓,郭常杰,鐘玉琢,孫立峰;基于細粒度可擴展編碼的多源視頻流化方案[J];清華大學(xué)學(xué)報(自然科學(xué)版);2004年04期
7 涂登彪;譚光明;孫凝暉;;無鎖同步的細粒度并行介度中心算法[J];軟件學(xué)報;2011年05期
8 張宇軒;魏廷存;樊曉椏;張萌;;面向流體系的細粒度異步訪存調(diào)度[J];計算機應(yīng)用研究;2012年03期
9 王寬;;基于細粒度調(diào)整的同步播放控制算法[J];山西電子技術(shù);2008年05期
10 華秀麗;徐凡;王中卿;李培峰;;細粒度科技論文摘要句子分類方法[J];計算機工程;2012年14期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 葉蘊芳;楊榆;羅鑫;徐國愛;;Appfuse系統(tǒng)中細粒度權(quán)限控制的研究與實現(xiàn)[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會通信與信息技術(shù)會議論文集(上冊)[C];2008年
2 江偉玉;高能;劉澤藝;林雪燕;;一種云計算中的多重身份認證與授權(quán)方案[A];第27次全國計算機安全學(xué)術(shù)交流會論文集[C];2012年
3 郭磊;唐玉華;周杰;董亞卓;;基于FPGA的Cholesky分解細粒度并行結(jié)構(gòu)與實現(xiàn)[A];2010年第16屆全國信息存儲技術(shù)大會(IST2010)論文集[C];2010年
4 李俊青;謝圣獻;劉廣亮;陳晨;;P2P網(wǎng)絡(luò)基于蟻群優(yōu)化的動態(tài)細粒度訪問控制框架[A];2008年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(下冊)[C];2008年
5 盛振華;吳羽;江錦華;壽黎但;陳剛;;InfoSigs:一種面向WEB對象的細粒度聚類算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(A輯)[C];2009年
中國重要報紙全文數(shù)據(jù)庫 前2條
1 趙曉濤;巡展中的三大熱門[N];網(wǎng)絡(luò)世界;2007年
2 樂天邋編譯;編織一張更好的Web[N];計算機世界;2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 付興兵;基于屬性基加密的細粒度訪問控制機制研究[D];電子科技大學(xué);2016年
2 時杰;關(guān)系數(shù)據(jù)庫細粒度訪問控制研究[D];華中科技大學(xué);2010年
3 朱倩;面向自由文本的細粒度關(guān)系抽取的關(guān)鍵技術(shù)研究[D];江蘇大學(xué);2011年
4 余a\;基于Simulink模型的細粒度多線程技術(shù)研究[D];浙江大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 趙黎光;基于依存句法的句子級細粒度情感計算[D];華南理工大學(xué);2015年
2 李星宇;一種細粒度Cloud-RAN框架與關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2014年
3 酈麗珍;基于Open vSwitch虛擬網(wǎng)絡(luò)的細粒度訪問控制[D];復(fù)旦大學(xué);2013年
4 姚亮;數(shù)據(jù)訪問控制中基于中間代理的用戶撤銷方法[D];西安電子科技大學(xué);2014年
5 占文平;面向產(chǎn)品評論的情感分析技術(shù)研究[D];浙江工商大學(xué);2015年
6 樓弘;基于深度神經(jīng)網(wǎng)絡(luò)的傳感器覆蓋細粒度優(yōu)化研究[D];浙江工業(yè)大學(xué);2015年
7 蔡雅雅;基于半監(jiān)督集成剪枝算法的細粒度城市空氣質(zhì)量估計[D];浙江大學(xué);2016年
8 何東梅;細粒度物體分類算法研究與實現(xiàn)[D];北京交通大學(xué);2016年
9 廖純;基于句法和語義的話題細粒度情感分析的研究[D];北京理工大學(xué);2016年
10 李毅;屬性層級觀點挖掘技術(shù)的研究與應(yīng)用[D];石家莊鐵道大學(xué);2016年
,本文編號:1111330
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1111330.html