基于詞語相關(guān)度的微博新情感詞自動識別
[Abstract]:In order to solve the problem of recognition of new emotional words in Weibo, an automatic recognition method of Weibo new emotional words based on word correlation degree is proposed. First of all, for the problem that a new word is misdivided into several words by word segmentation software, the adjacent words are merged as candidates for new words by using the combination idea. Secondly, in order to make full use of the semantic information of word context, neural network is used to train the corpus to obtain the spatial representation vector of candidate new words. Finally, using the existing emotion dictionary as the guide, the correlation degree sorting and the maximum correlation degree sorting algorithm based on thesaurus set are combined to screen the candidate words and obtain the final emotional new words. Based on the task 3 corpus of COAE2014 (sixth Chinese tendency Analysis and Evaluation), the proposed fusion algorithm and point mutual information (PMI), enhance the distance (MED), of (EMI), multi-word expression with mutual information. Compared with the new word probability (NWP) and the new word recognition method based on word vector, the accuracy of the new word recognition method is improved by at least 22%, which shows that this method is better than the other five methods in automatically recognizing Weibo new emotional words.
【作者單位】: 山西大學計算機與信息技術(shù)學院;計算智能與中文信息處理教育部重點實驗室(山西大學);
【基金】:國家863計劃項目(2015AA015407) 國家自然科學基金資助項目(61175067,61272095,61432011,61573231,U1435212) 山西省科技基礎條件平臺計劃項目(2015091001-0102) 山西省回國留學人員科研項目(2013-014)~~
【分類號】:TP391.1
【參考文獻】
相關(guān)期刊論文 前1條
1 鄭家恒,李文花;基于構(gòu)詞法的網(wǎng)絡新詞自動識別初探[J];山西大學學報(自然科學版);2002年02期
【共引文獻】
相關(guān)期刊論文 前10條
1 羅智勇;宋柔;;基于多特征的自適應新詞識別[J];北京工業(yè)大學學報;2007年07期
2 林自芳;蔣秀鳳;;基于改進位置成詞概率的新詞識別[J];福州大學學報(自然科學版);2011年01期
3 梁韜;張瑞;;基于詞語條件信息量的新詞發(fā)現(xiàn)[J];電子技術(shù)與軟件工程;2014年11期
4 車飛;;近十余年來漢語網(wǎng)絡新詞語研究述略[J];重慶工商大學學報(社會科學版);2015年03期
5 李新福;趙杰;梁巍;;基于互信息的宋史語料庫詞表的提取[J];河北大學學報(自然科學版);2006年05期
6 黃東平,田芳;BBS信息過濾技術(shù)研究[J];長江大學學報(自科版);2004年01期
7 張海軍;史樹敏;朱朝勇;黃河燕;;中文新詞識別技術(shù)綜述[J];計算機科學;2010年03期
8 丁建立;慈祥;黃劍雄;;一種基于免疫遺傳算法的網(wǎng)絡新詞識別方法[J];計算機科學;2011年01期
9 張海軍;欒靜;李勇;齊向偉;;基于統(tǒng)計學習框架的中文新詞檢測方法[J];計算機科學;2012年02期
10 廖豪;陳潔;譚建龍;;大規(guī)模語料中頻繁模式增量發(fā)現(xiàn)算法[J];計算機工程;2011年23期
相關(guān)博士學位論文 前5條
1 張海軍;基于大規(guī)模語料的中文新詞識別技術(shù)研究[D];中國科學技術(shù)大學;2011年
2 高紅;基于統(tǒng)計語言模型的漢語淺層分析研究[D];大連理工大學;2007年
3 孫凌云;面向產(chǎn)品概念設計的專利地圖技術(shù)研究[D];浙江大學;2008年
4 龔才春;短文本語言計算的關(guān)鍵技術(shù)研究[D];中國科學院研究生院(計算技術(shù)研究所);2008年
5 孫曉;中文詞法分析的研究及其應用[D];大連理工大學;2010年
相關(guān)碩士學位論文 前10條
1 史迎馨;建筑圖中有限自然語言的分析與理解的研究[D];長春工業(yè)大學;2010年
2 魏莎莎;一種中文未登錄詞識別及詞典設計新方法[D];西南大學;2011年
3 丁溪源;基于大規(guī)模語料的中文新詞抽取算法的設計與實現(xiàn)[D];南京理工大學;2011年
4 劉衛(wèi)秋;專利信息檢索系統(tǒng)的研究與實現(xiàn)[D];中南大學;2010年
5 高超;一種基于綜合背景概念格的中文自動文摘方法[D];中南大學;2011年
6 李婷婷;網(wǎng)絡詞語造詞法及語用義研究[D];安徽大學;2011年
7 周春波;面向WI輸入法的新詞發(fā)現(xiàn)技術(shù)研究與實現(xiàn)[D];哈爾濱工業(yè)大學;2011年
8 陳浩;網(wǎng)絡信息采集技術(shù)及中文未登錄詞算法研究[D];北京郵電大學;2012年
9 崔世起;中文新詞檢測與分析[D];中國科學院研究生院(計算技術(shù)研究所);2006年
10 鄒綱;中文新詞語自動檢測研究[D];中國科學院研究生院(計算技術(shù)研究所);2004年
【相似文獻】
相關(guān)期刊論文 前10條
1 許璐蕾;;網(wǎng)絡評論中情感詞的獲取及極性判斷方法比較[J];電腦與電信;2011年01期
2 肖健;徐建;朱姝;萬纓;許亮;;基于翻譯和語義方法的情感詞挖掘研究[J];計算機工程與應用;2011年32期
3 趙鵬;趙志偉;卓景文;;一種情感詞語義加權(quán)的句子傾向性識別方法[J];計算機工程與應用;2011年35期
4 代大明;李壽山;李培峰;朱巧明;;基于情緒詞與情感詞協(xié)作學習的情感分類方法研究[J];計算機科學;2012年12期
5 李勇敢;周學廣;孫艷;張煥國;;結(jié)合依存關(guān)聯(lián)分析和規(guī)則統(tǒng)計分析的情感詞庫構(gòu)建方法[J];武漢大學學報(理學版);2013年05期
6 彭慶喜;錢鐵云;;基于量化情感的網(wǎng)店垃圾評論檢測[J];山東大學學報(理學版);2013年11期
7 杜嘉忠;徐健;劉穎;;網(wǎng)絡商品評論的特征 情感詞本體構(gòu)建與情感分析方法研究[J];現(xiàn)代圖書情報技術(shù);2014年05期
8 張清亮;徐健;;網(wǎng)絡情感詞自動識別方法研究[J];現(xiàn)代圖書情報技術(shù);2011年10期
9 黃俊;田生偉;禹龍;馮冠軍;;基于維吾爾語情感詞的句子情感分析[J];計算機工程;2012年09期
10 孫勁光;馬志芳;孟祥福;;基于情感詞屬性和云模型的文本情感分類方法[J];計算機工程;2013年12期
相關(guān)會議論文 前5條
1 陳奇哲;劉全升;姚天f ;;漢語意見型語句主題與情感關(guān)系抽取的研究[A];第五屆全國信息檢索學術(shù)會議論文集[C];2009年
2 孫慧;關(guān)毅;董喜雙;;中文情感詞傾向消歧[A];第六屆全國信息檢索學術(shù)會議論文集[C];2010年
3 段秀婷;何婷婷;宋樂;;基于PMI-IR算法的Blog情感分類研究[A];第五屆全國青年計算語言學研討會論文集[C];2010年
4 李先斌;袁平波;俞能海;;基于局部最優(yōu)的情感標簽圖像自動標注算法[A];第六屆和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2010)、第19屆全國多媒體學術(shù)會議(NCMT2010)、第6屆全國人機交互學術(shù)會議(CHCI2010)、第5屆全國普適計算學術(shù)會議(PCC2010)論文集[C];2010年
5 王樅;涂序彥;劉嘉;;注意-情緒協(xié)調(diào)的個性化信息推薦模型[A];2006年首屆ICT大會信息、知識、智能及其轉(zhuǎn)換理論第一次高峰論壇會議論文集[C];2006年
相關(guān)博士學位論文 前7條
1 董喜雙;基于免疫多詞主體自治學習的情感分析研究[D];哈爾濱工業(yè)大學;2013年
2 寇廣增;基于意見挖掘通用框架的情感極性強度模糊性研究[D];武漢大學;2010年
3 楊玉珍;基于Web評論信息的傾向性分析關(guān)鍵技術(shù)研究[D];山東師范大學;2014年
4 黃勝;Web評論文本的細粒度意見挖掘技術(shù)研究[D];北京理工大學;2014年
5 施寒瀟;細粒度情感分析研究[D];蘇州大學;2013年
6 李榮軍;中文商品評論傾向性分析研究[D];北京郵電大學;2011年
7 李芳;面向中文Web評論的觀點挖掘關(guān)鍵技術(shù)研究[D];華中師范大學;2013年
相關(guān)碩士學位論文 前10條
1 孫博;關(guān)于情感詞的意義用法[D];遼寧大學;2012年
2 王銀;中文微博情感分析方法研究[D];廣東技術(shù)師范學院;2015年
3 崔連超;互聯(lián)網(wǎng)評論文本情感分析研究[D];山東大學;2015年
4 杜雪峰;藏文句子傾向性分析研究[D];中央民族大學;2015年
5 孫建超;微博輿情挖掘技術(shù)的研究與應用[D];電子科技大學;2015年
6 張圣聲;基于微博平臺的產(chǎn)品評論情感分類研究[D];廣東外語外貿(mào)大學;2015年
7 何天翔;基于情感詞網(wǎng)的短文本情感分類方法研究[D];西南科技大學;2015年
8 丁星;基于文本傾向性分析技術(shù)的微博監(jiān)控系統(tǒng)[D];江蘇科技大學;2015年
9 李茜;博客意見檢索關(guān)鍵問題研究[D];北京理工大學;2015年
10 李瑞靜;漢語情感詞模糊語義的量化分析及應用研究[D];北京理工大學;2015年
,本文編號:2494395
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2494395.html