基于三元詞組模式的微博情感分類方法
本文關(guān)鍵詞:基于三元詞組模式的微博情感分類方法 出處:《山西大學(xué)學(xué)報(bào)(自然科學(xué)版)》2015年02期 論文類型:期刊論文
【摘要】:針對(duì)微博的傾向性分析問題,提出了一種基于三元詞組模式的情感分類方法。該方法通過構(gòu)造情感詞典及微博的三元詞組模式,對(duì)未標(biāo)注語(yǔ)料自動(dòng)進(jìn)行情感評(píng)分并標(biāo)注情感極性,然后使用自動(dòng)標(biāo)注的語(yǔ)料訓(xùn)練得到情感分類器。在測(cè)試集上的實(shí)驗(yàn)結(jié)果表明,使用無人工參與標(biāo)注的訓(xùn)練語(yǔ)料達(dá)到了79.26%的測(cè)試正確率。
【作者單位】: 山西大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院;山西大學(xué)計(jì)算智能與中文信息處理教育部重點(diǎn)實(shí)驗(yàn)室;中國(guó)科學(xué)院高能物理研究所;
【基金】:國(guó)家自然科學(xué)基金(No.61373082) 國(guó)家語(yǔ)委“十二五”科研規(guī)劃項(xiàng)目(YB125-19) 山西省回國(guó)留學(xué)人員科研資助項(xiàng)目(2013-015)
【分類號(hào)】:TP393.092;TP391.1
【正文快照】: 0引言在Web2.0時(shí)代,涌現(xiàn)出大量?jī)?yōu)秀的互聯(lián)網(wǎng)產(chǎn)品,使得人們的互動(dòng)方式越來越多樣化。微博作為其中之一,消除了時(shí)間和空間的限制,為人們提供了表現(xiàn)自我、抒發(fā)情感、展示個(gè)性的大眾網(wǎng)絡(luò)平臺(tái)。目前,很多研究者開始著眼于微博數(shù)據(jù)的分析,相關(guān)工作有:熱點(diǎn)話題發(fā)現(xiàn)、輿情監(jiān)控、情感分
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前8條
1 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語(yǔ)義傾向計(jì)算[J];中文信息學(xué)報(bào);2006年01期
2 王根;趙軍;;基于多重冗余標(biāo)記CRFs的句子情感分析研究[J];中文信息學(xué)報(bào);2007年05期
3 王素格;楊安娜;;基于混合語(yǔ)言信息的詞語(yǔ)搭配傾向判別方法[J];中文信息學(xué)報(bào);2010年03期
4 黃萱菁;張奇;吳苑斌;;文本情感傾向分析[J];中文信息學(xué)報(bào);2011年06期
5 謝麗星;周明;孫茂松;;基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J];中文信息學(xué)報(bào);2012年01期
6 龐磊;李壽山;周國(guó)棟;;基于情緒知識(shí)的中文微博情感分類方法[J];計(jì)算機(jī)工程;2012年13期
7 韓忠明;張玉沙;張慧;萬月亮;黃今慧;;有效的中文微博短文本傾向性分類算法[J];計(jì)算機(jī)應(yīng)用與軟件;2012年10期
8 張珊;于留寶;胡長(zhǎng)軍;;基于表情圖片與情感詞的中文微博情感分析[J];計(jì)算機(jī)科學(xué);2012年S3期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 李榮軍;王小捷;周延泉;;PageRank模型在中文情感詞極性判別中的應(yīng)用[J];北京郵電大學(xué)學(xué)報(bào);2010年05期
2 龐娜;;增量學(xué)習(xí)算法對(duì)文本情感識(shí)別模型的改進(jìn)[J];電腦開發(fā)與應(yīng)用;2011年07期
3 梁坤;古麗拉·阿東別克;;基于SVM的中文新聞評(píng)論的情感自動(dòng)分類研究[J];電腦知識(shí)與技術(shù);2009年13期
4 張彬;楊志曉;;基于基準(zhǔn)詞的文本情感傾向性研究[J];電腦知識(shí)與技術(shù);2011年08期
5 李藝紅;蔣秀鳳;;中文句子傾向性分析[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年04期
6 廖祥文;張小琴;;基于句型結(jié)構(gòu)的領(lǐng)域傾向詞表構(gòu)建[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年04期
7 李迎凱;徐小良;;一種改進(jìn)的基于知網(wǎng)的句子相似度計(jì)算方法[J];電子科技;2012年07期
8 羅安;王勇;張福浩;劉紀(jì)平;;基于角色標(biāo)注的中文POI名稱語(yǔ)義分類方法[J];測(cè)繪通報(bào);2012年S1期
9 孫建旺;呂學(xué)強(qiáng);郭嵡秀;;基于微博轉(zhuǎn)發(fā)集的微博過濾研究[J];北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年03期
10 許星;席鵬富;秦天;;社會(huì)網(wǎng)絡(luò)的輿情信息分析與可視化——以新浪微博為例[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2013年12期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 吳蘇紅;王素格;;基于依存關(guān)系的旅游景點(diǎn)評(píng)論的特征-觀點(diǎn)對(duì)抽取[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
2 邊海容;萬常選;李國(guó)林;楊莉;;Web金融信息情感傾向與上市公司財(cái)務(wù)危機(jī)的關(guān)系研究[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計(jì)算機(jī)模擬與信息技術(shù)學(xué)術(shù)會(huì)議論文集[C];2011年
3 朱宏博;張芊;趙海;宋純賀;;基于貝葉斯網(wǎng)絡(luò)英文電影對(duì)白的潛在語(yǔ)義分析[A];第八屆沈陽(yáng)科學(xué)學(xué)術(shù)年會(huì)論文集[C];2011年
4 ;Comparing Chinese reviews based on Fuzzy PROMETHEE: A new approach to sentiment analysis[A];第六屆(2011)中國(guó)管理學(xué)年會(huì)——商務(wù)智能分會(huì)場(chǎng)論文集[C];2011年
5 王根;趙軍;;中文褒貶義詞語(yǔ)傾向性的分析[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
6 徐琳宏;林鴻飛;楊志豪;;基于語(yǔ)義理解的文本傾向性識(shí)別機(jī)制[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
7 姚天f ;聶青陽(yáng);李建超;李林琳;婁德成;陳珂;付宇;;一個(gè)用于漢語(yǔ)汽車評(píng)論的意見挖掘系統(tǒng)[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
8 李斌;盧俊之;章成志;陳小荷;;基于聚類引擎的話題褒貶度計(jì)算[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
9 倪茂樹;林鴻飛;;基于關(guān)聯(lián)規(guī)則和極性分析的商品評(píng)論挖掘[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
10 蔡健平;林世平;;基于機(jī)器學(xué)習(xí)的詞語(yǔ)和句子極性分析[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 鄧斌;B2C在線評(píng)論中的客戶知識(shí)管理研究[D];電子科技大學(xué);2010年
2 侯鋒;中文報(bào)業(yè)出版的文字質(zhì)量智能輔助控制技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
3 張長(zhǎng)利;面向特定領(lǐng)域的互聯(lián)網(wǎng)輿情分析技術(shù)研究[D];吉林大學(xué);2011年
4 楊峰;本體映射關(guān)鍵技術(shù)研究[D];吉林大學(xué);2011年
5 李榮軍;中文商品評(píng)論傾向性分析研究[D];北京郵電大學(xué);2011年
6 徐軍;面向金融信息檢索的體裁分類與情感分析技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2011年
7 楊卉;Web文本觀點(diǎn)挖掘及隱含情感傾向的研究[D];吉林大學(xué);2011年
8 羅芳;意見挖掘中若干關(guān)鍵問題研究[D];武漢理工大學(xué);2011年
9 王素格;基于Web的評(píng)論文本情感分類問題研究[D];上海大學(xué);2008年
10 何慧;WEB文本挖掘中關(guān)鍵問題的研究[D];北京郵電大學(xué);2009年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 郭明;基于文本分類技術(shù)的文本情感傾向性研究[D];鄭州大學(xué);2010年
2 左維松;規(guī)則和統(tǒng)計(jì)相結(jié)合的篇章情感傾向性分析研究[D];鄭州大學(xué);2010年
3 邢鑫巖;基于序列模型的情感分析研究[D];大連理工大學(xué);2010年
4 楊鼎;基于樸素貝葉斯的中文文本情感傾向分類研究[D];湖南工業(yè)大學(xué);2010年
5 鄧忠瑩;中文文本傾向性分類系統(tǒng)研究[D];昆明理工大學(xué);2009年
6 周杰;網(wǎng)絡(luò)輿情話題情感傾向性分析技術(shù)研究[D];解放軍信息工程大學(xué);2010年
7 李海林;網(wǎng)絡(luò)輿情熱點(diǎn)信息發(fā)現(xiàn)及其傾向性研究[D];武漢理工大學(xué);2010年
8 汪前秀;基于改進(jìn)的VSM的不良文本過濾模型研究[D];東北財(cái)經(jīng)大學(xué);2010年
9 羅亞平;面向網(wǎng)絡(luò)輿情的中文評(píng)論文本情感傾向分析研究[D];東北財(cái)經(jīng)大學(xué);2010年
10 戴霖;網(wǎng)絡(luò)輿情信息挖掘關(guān)鍵技術(shù)研究與應(yīng)用[D];浙江工商大學(xué);2011年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 王素格;楊安娜;李德玉;魏英杰;李偉;張武;;基于支持向量機(jī)的文本傾向性分類研究[J];中北大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年05期
2 潘宇;林鴻飛;;基于語(yǔ)義極性分析的餐館評(píng)論挖掘[J];計(jì)算機(jī)工程;2008年17期
3 昝紅英;郭明;柴玉梅;吳云芳;;新聞報(bào)道文本的情感傾向性研究[J];計(jì)算機(jī)工程;2010年15期
4 丁建立;慈祥;黃劍雄;;網(wǎng)絡(luò)評(píng)論傾向性分析[J];計(jì)算機(jī)應(yīng)用;2010年11期
5 何鳳英;;基于語(yǔ)義理解的中文博文傾向性分析[J];計(jì)算機(jī)應(yīng)用;2011年08期
6 王素格;楊軍玲;張武;;自動(dòng)獲取漢語(yǔ)詞語(yǔ)搭配[J];中文信息學(xué)報(bào);2006年06期
7 王根;趙軍;;基于多重冗余標(biāo)記CRFs的句子情感分析研究[J];中文信息學(xué)報(bào);2007年05期
8 唐慧豐;譚松波;程學(xué)旗;;基于監(jiān)督學(xué)習(xí)的中文情感分類技術(shù)比較研究[J];中文信息學(xué)報(bào);2007年06期
9 李成偉;彭勤科;徐濤;;基于信息推理的網(wǎng)絡(luò)新聞在線評(píng)論情緒分類[J];中文信息學(xué)報(bào);2009年05期
10 李壽山;黃居仁;;基于Stacking組合分類方法的中文情感分類研究[J];中文信息學(xué)報(bào);2010年05期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 宋光鵬;文本的情感傾向分析研究[D];北京郵電大學(xué);2008年
,本文編號(hào):1310693
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1310693.html