中文文本情感詞典構建方法
本文關鍵詞:中文文本情感詞典構建方法
【摘要】:互聯(lián)網(wǎng)海量文本的情感分析是當前的一個研究熱點。介紹了一種中文文本情感詞典構建方法,該方法選用若干個情感種子詞,利用搜索引擎返回的共現(xiàn)數(shù),通過改進的PMI(pointwise mutual information)算法計算情感詞的情感權值。將構建的情感詞典應用到文本情感分類實驗中,在不同的語料環(huán)境下,對比基于情感詞典和樸素貝葉斯分類器下的文本情感分類效果,實驗結果表明,構建的情感詞典,可有效用于情感特征選擇和直接用于情感分類,并且分類性能穩(wěn)定。
【作者單位】: 廣東外語外貿(mào)大學思科信息學院;廣東外語外貿(mào)大學國際工商管理學院;
【基金】:國家社會科學基金項目 教育部新世紀優(yōu)秀人才支持計劃 教育部人文社會科學研究青年基金項目 廣東省科技計劃項目 廣東省社科規(guī)劃項目 廣東外語外貿(mào)大學校級項目 廣東外語外貿(mào)大學研究生科研創(chuàng)新項目~~
【分類號】:TP391.1
【正文快照】: 1引言互聯(lián)網(wǎng)上的海量文本情感挖掘,有利于產(chǎn)品推薦、觀點抽取和輿情監(jiān)控等研究。現(xiàn)有的文本情感分析方法,以基于機器學習方法的分類方法為主[1],典型的有樸素貝葉斯(na ve Bayes,NB)[2-3]、支持向量機(support vector machine,SVM)[4-5]和最大信息熵(maximum entropy,ME)[6]等
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前5條
1 柳位平;朱艷輝;栗春亮;向華政;文志強;;中文基礎情感詞詞典構建方法研究[J];計算機應用;2009年10期
2 常曉龍;張暉;;融合語素特征的中文褒貶詞典構建[J];計算機應用;2012年07期
3 張劍峰;夏云慶;姚建民;;微博文本處理研究綜述[J];中文信息學報;2012年04期
4 林江豪;陽愛民;周詠梅;陳錦;蔡澤鍵;;一種基于樸素貝葉斯的微博情感分類[J];計算機工程與科學;2012年09期
5 朱艷輝;栗春亮;徐葉強;柳位平;;一種基于多重詞典的中文文本情感特征抽取方法[J];湖南工業(yè)大學學報;2011年02期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王銀;吳新玲;;中文微博情感分析方法研究[J];廣東技術師范學院學報;2014年03期
2 歐陽純萍;陽小華;雷龍艷;徐強;余穎;劉志明;;多策略中文微博細粒度情緒分析研究[J];北京大學學報(自然科學版);2014年01期
3 饒潔;;基于內容的移動社交網(wǎng)絡審計分析引擎[J];電腦知識與技術;2014年10期
4 楊霞;;基于同義詞詞林的微博客評論情感分類研究[J];電子科技;2014年07期
5 左榮欣;;一種分層多算法集成的微博情感分類方法[J];電子世界;2014年17期
6 金宇;朱洪波;王亞強;陳黎;于中華;;基于直推式學習的中文情感詞極性判別[J];計算機工程與應用;2011年34期
7 丁建立;慈祥;黃劍雄;;網(wǎng)絡評論傾向性分析[J];計算機應用;2010年11期
8 何鳳英;;基于語義理解的中文博文傾向性分析[J];計算機應用;2011年08期
9 魏椺;向陽;陳千;;中文文本情感分析綜述[J];計算機應用;2011年12期
10 楊鼎;陽愛民;;一種基于情感詞典和樸素貝葉斯的中文文本情感分類方法[J];計算機應用研究;2010年10期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 王明元;賈焰;周斌;黃九鳴;;一種基于主題相關性分類的微博話題立場研判方法[A];第29次全國計算機安全學術交流會論文集[C];2014年
中國博士學位論文全文數(shù)據(jù)庫 前7條
1 劉玉國;基于內容的互聯(lián)網(wǎng)輿情信息挖掘關鍵技術研究[D];山東大學;2011年
2 萬源;基于語義統(tǒng)計分析的網(wǎng)絡輿情挖掘技術研究[D];武漢理工大學;2012年
3 施寒瀟;細粒度情感分析研究[D];蘇州大學;2013年
4 王寶勛;面向網(wǎng)絡社區(qū)問答對的語義挖掘研究[D];哈爾濱工業(yè)大學;2013年
5 段亞娟;微博搜索的關鍵技術研究[D];中國科學技術大學;2014年
6 薛利;面向證券應用的WEB主題觀點挖掘若干關鍵問題研究[D];復旦大學;2013年
7 董穎紅;微博客社會情緒的測量及其與社會風險感知和風險決策的關系[D];南開大學;2014年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 楊鼎;基于樸素貝葉斯的中文文本情感傾向分類研究[D];湖南工業(yè)大學;2010年
2 白麗娟;基于文本挖掘的性別分類研究[D];哈爾濱工業(yè)大學;2011年
3 方明;基于Web的評論文本傾向性分析技術研究[D];山東師范大學;2012年
4 孫麗偉;基于在線評論的消費者非理性購買行為模糊推理研究[D];大連理工大學;2012年
5 張義;網(wǎng)絡社區(qū)熱點話題識別方法及其應用研究[D];合肥工業(yè)大學;2012年
6 劉瑋楠;基于HNC理論的網(wǎng)購評論情感傾向性分析研究[D];大連理工大學;2013年
7 劉彥偉;微博話題追蹤系統(tǒng)的研究與實現(xiàn)[D];北京交通大學;2013年
8 姚娜娜;基于機器學習的產(chǎn)品評論情感分類研究[D];首都師范大學;2013年
9 王靜;突發(fā)事件網(wǎng)絡輿情的情感傾向及演化分析[D];哈爾濱工業(yè)大學;2012年
10 陳其俊;基于在線評論的品牌關系型態(tài)模糊推理研究[D];大連理工大學;2013年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王鵬;樊興華;;中文文本分類中利用依存關系的實驗研究[J];計算機工程與應用;2010年03期
2 彭京;楊冬青;唐世渭;付艷;蔣漢奎;;一種基于語義內積空間模型的文本聚類算法[J];計算機學報;2007年08期
3 柳位平;朱艷輝;栗春亮;向華政;文志強;;中文基礎情感詞詞典構建方法研究[J];計算機應用;2009年10期
4 焦慶爭;蔚承建;;一種可靠信任推薦文本分類特征權重算法[J];計算機應用研究;2010年02期
5 楊鼎;陽愛民;;一種基于情感詞典和樸素貝葉斯的中文文本情感分類方法[J];計算機應用研究;2010年10期
6 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語義傾向計算[J];中文信息學報;2006年01期
7 黃永光;劉挺;車萬翔;胡曉光;;面向變異短文本的快速聚類算法[J];中文信息學報;2007年02期
8 彭澤映;俞曉明;許洪波;劉春陽;;大規(guī)模短文本的不完全聚類[J];中文信息學報;2011年01期
9 謝麗星;周明;孫茂松;;基于層次結構的多策略中文微博情感分析和特征抽取[J];中文信息學報;2012年01期
10 趙妍妍;秦兵;車萬翔;劉挺;;基于句法路徑的情感評價單元識別[J];軟件學報;2011年05期
中國博士學位論文全文數(shù)據(jù)庫 前3條
1 李榮陸;文本分類及其相關技術研究[D];復旦大學;2005年
2 龔才春;短文本語言計算的關鍵技術研究[D];中國科學院研究生院(計算技術研究所);2008年
3 杜偉夫;文本傾向性分析中的情感詞典構建技術研究[D];哈爾濱工業(yè)大學;2010年
中國碩士學位論文全文數(shù)據(jù)庫 前1條
1 吳薇;大規(guī)模短文本的分類過濾方法研究[D];北京郵電大學;2007年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 許璐蕾;;網(wǎng)絡評論中情感詞的獲取及極性判斷方法比較[J];電腦與電信;2011年01期
2 肖健;徐建;朱姝;萬纓;許亮;;基于翻譯和語義方法的情感詞挖掘研究[J];計算機工程與應用;2011年32期
3 趙鵬;趙志偉;卓景文;;一種情感詞語義加權的句子傾向性識別方法[J];計算機工程與應用;2011年35期
4 代大明;李壽山;李培峰;朱巧明;;基于情緒詞與情感詞協(xié)作學習的情感分類方法研究[J];計算機科學;2012年12期
5 李勇敢;周學廣;孫艷;張煥國;;結合依存關聯(lián)分析和規(guī)則統(tǒng)計分析的情感詞庫構建方法[J];武漢大學學報(理學版);2013年05期
6 彭慶喜;錢鐵云;;基于量化情感的網(wǎng)店垃圾評論檢測[J];山東大學學報(理學版);2013年11期
7 杜嘉忠;徐健;劉穎;;網(wǎng)絡商品評論的特征 情感詞本體構建與情感分析方法研究[J];現(xiàn)代圖書情報技術;2014年05期
8 張清亮;徐健;;網(wǎng)絡情感詞自動識別方法研究[J];現(xiàn)代圖書情報技術;2011年10期
9 黃俊;田生偉;禹龍;馮冠軍;;基于維吾爾語情感詞的句子情感分析[J];計算機工程;2012年09期
10 孫勁光;馬志芳;孟祥福;;基于情感詞屬性和云模型的文本情感分類方法[J];計算機工程;2013年12期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 陳奇哲;劉全升;姚天f ;;漢語意見型語句主題與情感關系抽取的研究[A];第五屆全國信息檢索學術會議論文集[C];2009年
2 孫慧;關毅;董喜雙;;中文情感詞傾向消歧[A];第六屆全國信息檢索學術會議論文集[C];2010年
3 段秀婷;何婷婷;宋樂;;基于PMI-IR算法的Blog情感分類研究[A];第五屆全國青年計算語言學研討會論文集[C];2010年
4 李先斌;袁平波;俞能海;;基于局部最優(yōu)的情感標簽圖像自動標注算法[A];第六屆和諧人機環(huán)境聯(lián)合學術會議(HHME2010)、第19屆全國多媒體學術會議(NCMT2010)、第6屆全國人機交互學術會議(CHCI2010)、第5屆全國普適計算學術會議(PCC2010)論文集[C];2010年
5 王樅;涂序彥;劉嘉;;注意-情緒協(xié)調的個性化信息推薦模型[A];2006年首屆ICT大會信息、知識、智能及其轉換理論第一次高峰論壇會議論文集[C];2006年
中國博士學位論文全文數(shù)據(jù)庫 前7條
1 董喜雙;基于免疫多詞主體自治學習的情感分析研究[D];哈爾濱工業(yè)大學;2013年
2 寇廣增;基于意見挖掘通用框架的情感極性強度模糊性研究[D];武漢大學;2010年
3 楊玉珍;基于Web評論信息的傾向性分析關鍵技術研究[D];山東師范大學;2014年
4 黃勝;Web評論文本的細粒度意見挖掘技術研究[D];北京理工大學;2014年
5 施寒瀟;細粒度情感分析研究[D];蘇州大學;2013年
6 李榮軍;中文商品評論傾向性分析研究[D];北京郵電大學;2011年
7 李芳;面向中文Web評論的觀點挖掘關鍵技術研究[D];華中師范大學;2013年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 孫博;關于情感詞的意義用法[D];遼寧大學;2012年
2 張玉杰;情感詞的傾向性研究[D];北京郵電大學;2011年
3 周曉;基于互聯(lián)網(wǎng)的情感詞庫擴展與優(yōu)化研究[D];東北大學;2011年
4 任望;基于股價的情感詞庫獲取[D];西南財經(jīng)大學;2014年
5 趙文婧;產(chǎn)品描述詞及情感詞抽取模式的研究[D];北京郵電大學;2010年
6 羅艷;基于情感詞的產(chǎn)品評論挖掘研究[D];華中科技大學;2010年
7 喻琦;中文微博情感分析技術研究[D];浙江工商大學;2013年
8 劉邵博;社會網(wǎng)絡新媒體的信息獲取與情感分類關鍵技術研究及實現(xiàn)[D];河北科技大學;2013年
9 時迎超;面向網(wǎng)絡的用戶觀點評價報告的自動生成研究[D];東北大學;2011年
10 陳碩;基于詞性與句法的產(chǎn)品評論特征及情感詞挖掘[D];河北大學;2012年
,本文編號:1231431
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1231431.html