基于極性詞典的中文微博客情感分類
本文關(guān)鍵詞:基于極性詞典的中文微博客情感分類
更多相關(guān)文章: 微博客 情感分類 詞典 語言學特征
【摘要】:微博客是近年來自然語言處理領(lǐng)域研究的熱點。主要針對中文微博客中的情感分類展開研究。結(jié)合網(wǎng)絡(luò)新詞和基礎(chǔ)情感詞,同時考慮了情感詞的極性情感強弱,構(gòu)建四個詞典,分別是基礎(chǔ)情感詞典、表情符號詞典、否定詞詞典和雙重否定詞詞典;在情感詞典的基礎(chǔ)上,融合漢語語言學特征和微博情感表達特征,提出一種新的基于極性詞典的情感分類方法。實驗準確率達到82.2%。實驗結(jié)果表明,提出的方法可以對中文微博進行較好的情感分類,有一定的應用價值。
【作者單位】: 北京信息科技大學網(wǎng)絡(luò)文化與數(shù)字傳播北京市重點實驗室;新華網(wǎng)絡(luò)股份有限公司;
【關(guān)鍵詞】: 微博客 情感分類 詞典 語言學特征
【基金】:國家自然科學基金項目(61271304) 國家科技支撐計劃課題(2011BAH11B03) 北京市教委科技發(fā)展計劃項目(KM201211232023)
【分類號】:TP391.1;TP393.092
【正文快照】: 0引言互聯(lián)網(wǎng)的興起,特別是Web2.0時代的到來,使網(wǎng)民不再只是互聯(lián)網(wǎng)的“消費者”,也成為了互聯(lián)網(wǎng)的“生產(chǎn)者”。隨著Web應用的增多,用戶產(chǎn)生內(nèi)容也呈爆炸式的增長,人們越來越多的在論壇、BBS、博客和微博等應用上表達自己的情感。其中,微博作為新生代應用的佼佼者,在近幾年來取
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前7條
1 劉志明;劉魯;;基于機器學習的中文微博情感分類實證研究[J];計算機工程與應用;2012年01期
2 陸文星;王燕飛;;中文文本情感分析研究綜述[J];計算機應用研究;2012年06期
3 徐軍;丁宇新;王曉龍;;使用機器學習方法進行新聞的情感自動分類[J];中文信息學報;2007年06期
4 李壽山;黃居仁;;基于Stacking組合分類方法的中文情感分類研究[J];中文信息學報;2010年05期
5 謝麗星;周明;孫茂松;;基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J];中文信息學報;2012年01期
6 趙妍妍;秦兵;劉挺;;文本情感分析[J];軟件學報;2010年08期
7 張成功;劉培玉;朱振方;方明;;一種基于極性詞典的情感分析方法[J];山東大學學報(理學版);2012年03期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 潘文富;郭友實;;網(wǎng)絡(luò)輿情監(jiān)測技術(shù)研究綜述[J];福建電腦;2011年08期
2 來亮;錢屹;;文本情感分析綜述[J];計算機光盤軟件與應用;2012年18期
3 孫建旺;呂學強;郭嵡秀;;基于微博轉(zhuǎn)發(fā)集的微博過濾研究[J];北京信息科技大學學報(自然科學版);2013年03期
4 許星;席鵬富;秦天;;社會網(wǎng)絡(luò)的輿情信息分析與可視化——以新浪微博為例[J];計算機光盤軟件與應用;2013年12期
5 吳維;肖詩斌;;基于多特征與復合分類法的中文微博情感分析[J];北京信息科技大學學報(自然科學版);2013年04期
6 李愛清;何爍;郗亞輝;;產(chǎn)品評論挖掘可視化實驗平臺的開發(fā)[J];河北大學學報(自然科學版);2012年02期
7 吳瓊;譚松波;許洪波;段m#毅;程學旗;;基于隨機游走模型的跨領(lǐng)域傾向性分析研究[J];計算機研究與發(fā)展;2010年12期
8 王素格;李德玉;魏英杰;;基于賦權(quán)粗糙隸屬度的文本情感分類方法[J];計算機研究與發(fā)展;2011年05期
9 白鴿;左萬利;趙乾坤;曲仁鏡;;使用機器學習對漢語評論進行情感分類[J];吉林大學學報(理學版);2009年06期
10 李培;何中市;黃永文;;基于依存關(guān)系分析的網(wǎng)絡(luò)評論極性分類研究[J];計算機工程與應用;2010年11期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 王中卿;李壽山;朱巧明;李培峰;周國棟;;基于不平衡數(shù)據(jù)的中文情感分類[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
2 王克;張春良;高曉興;朱靖波;;基于三類訓練兩類判別框架的主客觀性句子識別[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
3 曾青青;楊爾弘;;突發(fā)事件文本的信息結(jié)構(gòu)分析[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
4 周軍;何力;韓偉紅;鄧璐;;基于機器學習的中文評論傾向性分類實證研究[A];第28次全國計算機安全學術(shù)交流會論文集[C];2013年
5 朱浩然;梁循;馬躍峰;紀陽;李啟東;馬超;;金融領(lǐng)域中文微博情感分析[A];第八屆(2013)中國管理學年會論文集(選編)[C];2013年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 張長利;面向特定領(lǐng)域的互聯(lián)網(wǎng)輿情分析技術(shù)研究[D];吉林大學;2011年
2 劉玉國;基于內(nèi)容的互聯(lián)網(wǎng)輿情信息挖掘關(guān)鍵技術(shù)研究[D];山東大學;2011年
3 李榮軍;中文商品評論傾向性分析研究[D];北京郵電大學;2011年
4 陳博;WEB文本情感分類中關(guān)鍵問題的研究[D];北京郵電大學;2008年
5 何慧;WEB文本挖掘中關(guān)鍵問題的研究[D];北京郵電大學;2009年
6 李實;中文網(wǎng)絡(luò)客戶評論中的產(chǎn)品特征挖掘方法研究[D];哈爾濱工業(yè)大學;2009年
7 胡明涵;面向領(lǐng)域的文本分類與挖掘關(guān)鍵技術(shù)研究[D];東北大學 ;2009年
8 杜偉夫;文本傾向性分析中的情感詞典構(gòu)建技術(shù)研究[D];哈爾濱工業(yè)大學;2010年
9 田野;基于微博平臺的事件趨勢分析及預測研究[D];武漢大學;2012年
10 萬源;基于語義統(tǒng)計分析的網(wǎng)絡(luò)輿情挖掘技術(shù)研究[D];武漢理工大學;2012年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 郭明;基于文本分類技術(shù)的文本情感傾向性研究[D];鄭州大學;2010年
2 鄧忠瑩;中文文本傾向性分類系統(tǒng)研究[D];昆明理工大學;2009年
3 周杰;網(wǎng)絡(luò)輿情話題情感傾向性分析技術(shù)研究[D];解放軍信息工程大學;2010年
4 楊玉珍;基于統(tǒng)計與規(guī)則的特征權(quán)重計算方法研究與應用[D];山東師范大學;2011年
5 吳秀梅;基于潛在語義分析和最大熵的中文情感分析研究[D];北京交通大學;2011年
6 徐淑坦;基于改進RBF神經(jīng)網(wǎng)絡(luò)的文本情感分類研究[D];吉林大學;2011年
7 周利娟;基于情感語義相似度的音樂檢索模型研究[D];大連理工大學;2011年
8 張博;基于SVM的中文觀點句抽取[D];北京郵電大學;2011年
9 張浩;多粒度下的多分類情感分析研究[D];北京郵電大學;2011年
10 史麗君;基于特征強化的中文產(chǎn)品評價挖掘研究[D];合肥工業(yè)大學;2011年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 單松巍,馮是聰,李曉明;幾種典型特征選取方法在中文網(wǎng)頁分類上的效果比較[J];計算機工程與應用;2003年22期
2 李鈍;曹付元;曹元大;萬月亮;;基于短語模式的文本情感分類研究[J];計算機科學;2008年04期
3 周立柱;賀宇凱;王建勇;;情感分析研究綜述[J];計算機應用;2008年11期
4 代六玲,黃河燕,陳肇雄;中文文本分類中特征抽取方法的比較研究[J];中文信息學報;2004年01期
5 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語義傾向計算[J];中文信息學報;2006年01期
6 徐琳宏;林鴻飛;楊志豪;;基于語義理解的文本傾向性識別機制[J];中文信息學報;2007年01期
7 王根;趙軍;;基于多重冗余標記CRFs的句子情感分析研究[J];中文信息學報;2007年05期
8 唐慧豐;譚松波;程學旗;;基于監(jiān)督學習的中文情感分類技術(shù)比較研究[J];中文信息學報;2007年06期
9 徐軍;丁宇新;王曉龍;;使用機器學習方法進行新聞的情感自動分類[J];中文信息學報;2007年06期
10 徐琳宏;林鴻飛;趙晶;;情感語料庫的構(gòu)建和分析[J];中文信息學報;2008年01期
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 尹洪波;否定詞與副詞共現(xiàn)的句法語義研究[D];中國社會科學院研究生院;2008年
中國碩士學位論文全文數(shù)據(jù)庫 前5條
1 呂韶華;面向中文評論文本的情感傾向性研究[D];大連理工大學;2010年
2 郝雷紅;現(xiàn)代漢語否定副詞研究[D];首都師范大學;2003年
3 楊勇濤;WEB輿情觀點挖掘關(guān)鍵技術(shù)研究[D];電子科技大學;2009年
4 朱力;中文詞語情感傾向研究[D];哈爾濱工業(yè)大學;2009年
5 譚俊武;面向網(wǎng)絡(luò)輿情分析的文本傾向性分類技術(shù)的研究與實現(xiàn)[D];國防科學技術(shù)大學;2009年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 祝啟波;一部專業(yè)技術(shù)雙語詞典的計算機轉(zhuǎn)換及其結(jié)果分析[J];辭書研究;1997年05期
2 林浩;韓冰;楊樂華;;一種基于改進最大匹配快速中文分詞算法[J];科技創(chuàng)新導報;2009年09期
3 菠蘿王;;帶你體驗有道詞典3.4正式版[J];電腦知識與技術(shù)(經(jīng)驗技巧);2010年12期
4 施建軍;機器單詞詞典和日語單詞的自動切分[J];外語電化教學;1994年04期
5 王峰;給您的電腦配本好詞典[J];市場與電腦;1997年11期
6 孫巍;;一種面向中文信息檢索的漢語自動分詞方法[J];現(xiàn)代圖書情報技術(shù);2006年07期
7 沉迷的石頭;;擴展有道詞典取詞翻譯功能[J];電腦迷;2009年21期
8 黃德根;劉小華;李麗雙;;漢英機器翻譯中趨向動詞處理研究[J];大連理工大學學報;2006年05期
9 劉志杰,劉倬;英漢機器翻譯系統(tǒng)中基本詞典與專業(yè)詞典的關(guān)系[J];語言文字應用;1997年03期
10 賴翔飛,吳利夫;TRS-80MMS FORTH系統(tǒng)結(jié)構(gòu)介紹[J];小型微型計算機系統(tǒng);1983年05期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 曾華琳;李堂秋;曹冬林;;機器輔助翻譯系統(tǒng)用詞典的管理[A];第二屆全國學生計算語言學研討會論文集[C];2004年
2 德·薩日娜;那順烏日圖;;《蒙古語語義信息詞典》的初步構(gòu)建[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
3 羅娜;左萬利;袁福宇;張靖波;張慧杰;;使用本體語義提高文本聚類(英文)[A];全國語域web與本體能研討會論文集[C];2006年
4 張紫瓊;李一軍;葉強;;漢語商品評論情感分析——一種基于搜索引擎的無監(jiān)督方法(英文)[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
5 左維松;昝紅英;張坤麗;吳云芳;;規(guī)則和統(tǒng)計相結(jié)合的情感分析研究[A];第五屆全國信息檢索學術(shù)會議論文集[C];2009年
6 何慧;陳博;郭軍;;基于流形學習的半監(jiān)督文本情感分類算法[A];第五屆全國信息檢索學術(shù)會議論文集[C];2009年
7 趙世奇;劉挺;李生;;一種基于主題的文本聚類方法[A];第三屆學生計算語言學研討會論文集[C];2006年
8 賈玉祥;俞士汶;;基于詞典的名詞性隱喻識別[A];第五屆全國青年計算語言學研討會論文集[C];2010年
9 李江波;周強;陳祖舜;;漢語詞典快速查詢算法研究[A];第二屆全國學生計算語言學研討會論文集[C];2004年
10 王東波;陳小荷;年洪東;;基于條件隨機場的有標記聯(lián)合結(jié)構(gòu)自動識別[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 范力;有道推出桌面詞典企業(yè)版[N];科技日報;2009年
2 本報記者 李響;丁磊:全力打造中文搜索引擎[N];計算機世界;2008年
3 本報記者 廖劍鋒;詞典軟件告別盒裝 用戶盡享免費翻譯服務(wù)[N];通信信息報;2011年
4 寧海偉;名人CE開啟嶄新的windows學英語時代[N];中國電腦教育報;2006年
5 余海玲 本報記者 馬里;金山詞霸用十年典藏版賀歲[N];大眾科技報;2006年
6 中科院計算技術(shù)研究所 呂雅娟邋付雷 黃瑾 何中軍 劉群;化繁為簡的統(tǒng)計機器翻譯技術(shù)[N];中國計算機報;2007年
7 ;原版VS Remux[N];中國電腦教育報;2008年
8 俞士汶;語言信息處理的基石[N];計算機世界;2007年
9 記者 王坤寧;商務(wù)印書館信息化建設(shè)邁出新步伐[N];中國新聞出版報;2006年
10 沈建苗邋編譯;IE插件各顯神通[N];計算機世界;2008年
中國博士學位論文全文數(shù)據(jù)庫 前9條
1 劉健;基于近似文本分析的意見挖掘[D];上海大學;2007年
2 陳博;WEB文本情感分類中關(guān)鍵問題的研究[D];北京郵電大學;2008年
3 何慧;WEB文本挖掘中關(guān)鍵問題的研究[D];北京郵電大學;2009年
4 杜偉夫;文本傾向性分析中的情感詞典構(gòu)建技術(shù)研究[D];哈爾濱工業(yè)大學;2010年
5 趙瓊;基于視頻和三維動作捕捉數(shù)據(jù)的人體動作識別方法的研究[D];中國科學技術(shù)大學;2013年
6 龍騰;旋轉(zhuǎn)方向無關(guān)的無約束手寫中文詞組識別[D];華南理工大學;2008年
7 余振山;自然語言文本中數(shù)字水印的設(shè)計與研究[D];中國科學技術(shù)大學;2009年
8 唐振軍;感知圖像Hash框架、方法及性能測評指標[D];上海大學;2010年
9 范冬梅;基于統(tǒng)計學習的詞義識別方法研究[D];哈爾濱工程大學;2011年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 段恩澤;基于統(tǒng)計的漢語自動分詞系統(tǒng)[D];電子科技大學;2005年
2 馬月珠;基于短語模式的評論性文章情感抽取方法研究[D];北京郵電大學;2009年
3 曲曉航;統(tǒng)計與語言學相結(jié)合的詞對齊及相關(guān)融合策略研究[D];哈爾濱工業(yè)大學;2008年
4 劉春輝;基于優(yōu)化最大匹配的中文分詞方法研究[D];燕山大學;2009年
5 趙曉南;字符串理論研究與應用探討[D];吉林大學;2008年
6 羅準辰;關(guān)鍵詞抽取的研究與實現(xiàn)[D];國防科學技術(shù)大學;2008年
7 張永臣;基于互聯(lián)網(wǎng)文本數(shù)據(jù)的特定領(lǐng)域雙語詞典抽取[D];中國科學院研究生院(軟件研究所);2005年
8 卿太杰;基于動態(tài)詞典的文本壓縮研究[D];北京郵電大學;2006年
9 來火堯;基于主題相關(guān)性的中文文本情感分類研究[D];上海交通大學;2009年
10 鄭文英;旅行目的地中文評論的情感分析研究[D];哈爾濱工業(yè)大學;2010年
,本文編號:646248
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/646248.html