中文文本情感詞典構(gòu)建方法
本文關(guān)鍵詞:中文文本情感詞典構(gòu)建方法
更多相關(guān)文章: 情感詞典 情感分類 PMI算法 樸素貝葉斯
【摘要】:互聯(lián)網(wǎng)海量文本的情感分析是當(dāng)前的一個(gè)研究熱點(diǎn)。介紹了一種中文文本情感詞典構(gòu)建方法,該方法選用若干個(gè)情感種子詞,利用搜索引擎返回的共現(xiàn)數(shù),通過改進(jìn)的PMI(pointwise mutual information)算法計(jì)算情感詞的情感權(quán)值。將構(gòu)建的情感詞典應(yīng)用到文本情感分類實(shí)驗(yàn)中,在不同的語料環(huán)境下,對比基于情感詞典和樸素貝葉斯分類器下的文本情感分類效果,實(shí)驗(yàn)結(jié)果表明,構(gòu)建的情感詞典,可有效用于情感特征選擇和直接用于情感分類,并且分類性能穩(wěn)定。
【作者單位】: 廣東外語外貿(mào)大學(xué)思科信息學(xué)院;廣東外語外貿(mào)大學(xué)國際工商管理學(xué)院;
【基金】:國家社會科學(xué)基金項(xiàng)目 教育部新世紀(jì)優(yōu)秀人才支持計(jì)劃 教育部人文社會科學(xué)研究青年基金項(xiàng)目 廣東省科技計(jì)劃項(xiàng)目 廣東省社科規(guī)劃項(xiàng)目 廣東外語外貿(mào)大學(xué)校級項(xiàng)目 廣東外語外貿(mào)大學(xué)研究生科研創(chuàng)新項(xiàng)目~~
【分類號】:TP391.1
【正文快照】: 1引言互聯(lián)網(wǎng)上的海量文本情感挖掘,有利于產(chǎn)品推薦、觀點(diǎn)抽取和輿情監(jiān)控等研究。現(xiàn)有的文本情感分析方法,以基于機(jī)器學(xué)習(xí)方法的分類方法為主[1],典型的有樸素貝葉斯(na ve Bayes,NB)[2-3]、支持向量機(jī)(support vector machine,SVM)[4-5]和最大信息熵(maximum entropy,ME)[6]等
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前5條
1 柳位平;朱艷輝;栗春亮;向華政;文志強(qiáng);;中文基礎(chǔ)情感詞詞典構(gòu)建方法研究[J];計(jì)算機(jī)應(yīng)用;2009年10期
2 常曉龍;張暉;;融合語素特征的中文褒貶詞典構(gòu)建[J];計(jì)算機(jī)應(yīng)用;2012年07期
3 張劍峰;夏云慶;姚建民;;微博文本處理研究綜述[J];中文信息學(xué)報(bào);2012年04期
4 林江豪;陽愛民;周詠梅;陳錦;蔡澤鍵;;一種基于樸素貝葉斯的微博情感分類[J];計(jì)算機(jī)工程與科學(xué);2012年09期
5 朱艷輝;栗春亮;徐葉強(qiáng);柳位平;;一種基于多重詞典的中文文本情感特征抽取方法[J];湖南工業(yè)大學(xué)學(xué)報(bào);2011年02期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王銀;吳新玲;;中文微博情感分析方法研究[J];廣東技術(shù)師范學(xué)院學(xué)報(bào);2014年03期
2 歐陽純萍;陽小華;雷龍艷;徐強(qiáng);余穎;劉志明;;多策略中文微博細(xì)粒度情緒分析研究[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
3 饒潔;;基于內(nèi)容的移動社交網(wǎng)絡(luò)審計(jì)分析引擎[J];電腦知識與技術(shù);2014年10期
4 楊霞;;基于同義詞詞林的微博客評論情感分類研究[J];電子科技;2014年07期
5 左榮欣;;一種分層多算法集成的微博情感分類方法[J];電子世界;2014年17期
6 金宇;朱洪波;王亞強(qiáng);陳黎;于中華;;基于直推式學(xué)習(xí)的中文情感詞極性判別[J];計(jì)算機(jī)工程與應(yīng)用;2011年34期
7 丁建立;慈祥;黃劍雄;;網(wǎng)絡(luò)評論傾向性分析[J];計(jì)算機(jī)應(yīng)用;2010年11期
8 何鳳英;;基于語義理解的中文博文傾向性分析[J];計(jì)算機(jī)應(yīng)用;2011年08期
9 魏椺;向陽;陳千;;中文文本情感分析綜述[J];計(jì)算機(jī)應(yīng)用;2011年12期
10 楊鼎;陽愛民;;一種基于情感詞典和樸素貝葉斯的中文文本情感分類方法[J];計(jì)算機(jī)應(yīng)用研究;2010年10期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 王明元;賈焰;周斌;黃九鳴;;一種基于主題相關(guān)性分類的微博話題立場研判方法[A];第29次全國計(jì)算機(jī)安全學(xué)術(shù)交流會論文集[C];2014年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 劉玉國;基于內(nèi)容的互聯(lián)網(wǎng)輿情信息挖掘關(guān)鍵技術(shù)研究[D];山東大學(xué);2011年
2 萬源;基于語義統(tǒng)計(jì)分析的網(wǎng)絡(luò)輿情挖掘技術(shù)研究[D];武漢理工大學(xué);2012年
3 施寒瀟;細(xì)粒度情感分析研究[D];蘇州大學(xué);2013年
4 王寶勛;面向網(wǎng)絡(luò)社區(qū)問答對的語義挖掘研究[D];哈爾濱工業(yè)大學(xué);2013年
5 段亞娟;微博搜索的關(guān)鍵技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2014年
6 薛利;面向證券應(yīng)用的WEB主題觀點(diǎn)挖掘若干關(guān)鍵問題研究[D];復(fù)旦大學(xué);2013年
7 董穎紅;微博客社會情緒的測量及其與社會風(fēng)險(xiǎn)感知和風(fēng)險(xiǎn)決策的關(guān)系[D];南開大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 楊鼎;基于樸素貝葉斯的中文文本情感傾向分類研究[D];湖南工業(yè)大學(xué);2010年
2 白麗娟;基于文本挖掘的性別分類研究[D];哈爾濱工業(yè)大學(xué);2011年
3 方明;基于Web的評論文本傾向性分析技術(shù)研究[D];山東師范大學(xué);2012年
4 孫麗偉;基于在線評論的消費(fèi)者非理性購買行為模糊推理研究[D];大連理工大學(xué);2012年
5 張義;網(wǎng)絡(luò)社區(qū)熱點(diǎn)話題識別方法及其應(yīng)用研究[D];合肥工業(yè)大學(xué);2012年
6 劉瑋楠;基于HNC理論的網(wǎng)購評論情感傾向性分析研究[D];大連理工大學(xué);2013年
7 劉彥偉;微博話題追蹤系統(tǒng)的研究與實(shí)現(xiàn)[D];北京交通大學(xué);2013年
8 姚娜娜;基于機(jī)器學(xué)習(xí)的產(chǎn)品評論情感分類研究[D];首都師范大學(xué);2013年
9 王靜;突發(fā)事件網(wǎng)絡(luò)輿情的情感傾向及演化分析[D];哈爾濱工業(yè)大學(xué);2012年
10 陳其俊;基于在線評論的品牌關(guān)系型態(tài)模糊推理研究[D];大連理工大學(xué);2013年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王鵬;樊興華;;中文文本分類中利用依存關(guān)系的實(shí)驗(yàn)研究[J];計(jì)算機(jī)工程與應(yīng)用;2010年03期
2 彭京;楊冬青;唐世渭;付艷;蔣漢奎;;一種基于語義內(nèi)積空間模型的文本聚類算法[J];計(jì)算機(jī)學(xué)報(bào);2007年08期
3 柳位平;朱艷輝;栗春亮;向華政;文志強(qiáng);;中文基礎(chǔ)情感詞詞典構(gòu)建方法研究[J];計(jì)算機(jī)應(yīng)用;2009年10期
4 焦慶爭;蔚承建;;一種可靠信任推薦文本分類特征權(quán)重算法[J];計(jì)算機(jī)應(yīng)用研究;2010年02期
5 楊鼎;陽愛民;;一種基于情感詞典和樸素貝葉斯的中文文本情感分類方法[J];計(jì)算機(jī)應(yīng)用研究;2010年10期
6 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語義傾向計(jì)算[J];中文信息學(xué)報(bào);2006年01期
7 黃永光;劉挺;車萬翔;胡曉光;;面向變異短文本的快速聚類算法[J];中文信息學(xué)報(bào);2007年02期
8 彭澤映;俞曉明;許洪波;劉春陽;;大規(guī)模短文本的不完全聚類[J];中文信息學(xué)報(bào);2011年01期
9 謝麗星;周明;孫茂松;;基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J];中文信息學(xué)報(bào);2012年01期
10 趙妍妍;秦兵;車萬翔;劉挺;;基于句法路徑的情感評價(jià)單元識別[J];軟件學(xué)報(bào);2011年05期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 李榮陸;文本分類及其相關(guān)技術(shù)研究[D];復(fù)旦大學(xué);2005年
2 龔才春;短文本語言計(jì)算的關(guān)鍵技術(shù)研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2008年
3 杜偉夫;文本傾向性分析中的情感詞典構(gòu)建技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 吳薇;大規(guī)模短文本的分類過濾方法研究[D];北京郵電大學(xué);2007年
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 許璐蕾;;網(wǎng)絡(luò)評論中情感詞的獲取及極性判斷方法比較[J];電腦與電信;2011年01期
2 肖健;徐建;朱姝;萬纓;許亮;;基于翻譯和語義方法的情感詞挖掘研究[J];計(jì)算機(jī)工程與應(yīng)用;2011年32期
3 趙鵬;趙志偉;卓景文;;一種情感詞語義加權(quán)的句子傾向性識別方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年35期
4 代大明;李壽山;李培峰;朱巧明;;基于情緒詞與情感詞協(xié)作學(xué)習(xí)的情感分類方法研究[J];計(jì)算機(jī)科學(xué);2012年12期
5 李勇敢;周學(xué)廣;孫艷;張煥國;;結(jié)合依存關(guān)聯(lián)分析和規(guī)則統(tǒng)計(jì)分析的情感詞庫構(gòu)建方法[J];武漢大學(xué)學(xué)報(bào)(理學(xué)版);2013年05期
6 彭慶喜;錢鐵云;;基于量化情感的網(wǎng)店垃圾評論檢測[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2013年11期
7 杜嘉忠;徐健;劉穎;;網(wǎng)絡(luò)商品評論的特征 情感詞本體構(gòu)建與情感分析方法研究[J];現(xiàn)代圖書情報(bào)技術(shù);2014年05期
8 張清亮;徐健;;網(wǎng)絡(luò)情感詞自動識別方法研究[J];現(xiàn)代圖書情報(bào)技術(shù);2011年10期
9 黃俊;田生偉;禹龍;馮冠軍;;基于維吾爾語情感詞的句子情感分析[J];計(jì)算機(jī)工程;2012年09期
10 孫勁光;馬志芳;孟祥福;;基于情感詞屬性和云模型的文本情感分類方法[J];計(jì)算機(jī)工程;2013年12期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 陳奇哲;劉全升;姚天f ;;漢語意見型語句主題與情感關(guān)系抽取的研究[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
2 孫慧;關(guān)毅;董喜雙;;中文情感詞傾向消歧[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
3 段秀婷;何婷婷;宋樂;;基于PMI-IR算法的Blog情感分類研究[A];第五屆全國青年計(jì)算語言學(xué)研討會論文集[C];2010年
4 李先斌;袁平波;俞能海;;基于局部最優(yōu)的情感標(biāo)簽圖像自動標(biāo)注算法[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2010)、第19屆全國多媒體學(xué)術(shù)會議(NCMT2010)、第6屆全國人機(jī)交互學(xué)術(shù)會議(CHCI2010)、第5屆全國普適計(jì)算學(xué)術(shù)會議(PCC2010)論文集[C];2010年
5 王樅;涂序彥;劉嘉;;注意-情緒協(xié)調(diào)的個(gè)性化信息推薦模型[A];2006年首屆ICT大會信息、知識、智能及其轉(zhuǎn)換理論第一次高峰論壇會議論文集[C];2006年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 董喜雙;基于免疫多詞主體自治學(xué)習(xí)的情感分析研究[D];哈爾濱工業(yè)大學(xué);2013年
2 寇廣增;基于意見挖掘通用框架的情感極性強(qiáng)度模糊性研究[D];武漢大學(xué);2010年
3 楊玉珍;基于Web評論信息的傾向性分析關(guān)鍵技術(shù)研究[D];山東師范大學(xué);2014年
4 黃勝;Web評論文本的細(xì)粒度意見挖掘技術(shù)研究[D];北京理工大學(xué);2014年
5 施寒瀟;細(xì)粒度情感分析研究[D];蘇州大學(xué);2013年
6 李榮軍;中文商品評論傾向性分析研究[D];北京郵電大學(xué);2011年
7 李芳;面向中文Web評論的觀點(diǎn)挖掘關(guān)鍵技術(shù)研究[D];華中師范大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 孫博;關(guān)于情感詞的意義用法[D];遼寧大學(xué);2012年
2 張玉杰;情感詞的傾向性研究[D];北京郵電大學(xué);2011年
3 周曉;基于互聯(lián)網(wǎng)的情感詞庫擴(kuò)展與優(yōu)化研究[D];東北大學(xué);2011年
4 任望;基于股價(jià)的情感詞庫獲取[D];西南財(cái)經(jīng)大學(xué);2014年
5 趙文婧;產(chǎn)品描述詞及情感詞抽取模式的研究[D];北京郵電大學(xué);2010年
6 羅艷;基于情感詞的產(chǎn)品評論挖掘研究[D];華中科技大學(xué);2010年
7 喻琦;中文微博情感分析技術(shù)研究[D];浙江工商大學(xué);2013年
8 劉邵博;社會網(wǎng)絡(luò)新媒體的信息獲取與情感分類關(guān)鍵技術(shù)研究及實(shí)現(xiàn)[D];河北科技大學(xué);2013年
9 時(shí)迎超;面向網(wǎng)絡(luò)的用戶觀點(diǎn)評價(jià)報(bào)告的自動生成研究[D];東北大學(xué);2011年
10 陳碩;基于詞性與句法的產(chǎn)品評論特征及情感詞挖掘[D];河北大學(xué);2012年
,本文編號:1231431
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1231431.html