一種基于特征簇的微博短文本情感分類方法
本文關(guān)鍵詞:一種基于特征簇的微博短文本情感分類方法
更多相關(guān)文章: 微博情感 數(shù)據(jù)稀疏 詞向量 特征簇 機(jī)器學(xué)習(xí)
【摘要】:針對由微博短文本特征規(guī)模大、自身特征較少等特點(diǎn)導(dǎo)致的數(shù)據(jù)稀疏性,提出一種基于特征簇的微博情感分類方法.提出的分類方法以大規(guī)模語料庫為基礎(chǔ),利用word2vec模型學(xué)習(xí)詞語之間潛在的語義關(guān)聯(lián),將單個(gè)詞語表示成多維向量的形式;結(jié)合情感詞典,提取出微博文本的情感特征集,在基于詞向量計(jì)算詞語相似度方法的基礎(chǔ)上,將情感特征合并為特征簇,以此構(gòu)造低維的文本向量;最后利用機(jī)器學(xué)習(xí)算法,構(gòu)建情感分類器,實(shí)現(xiàn)微博短文本的情感分類.實(shí)驗(yàn)結(jié)果表明,本文提出的方法對情感特征的降維是可行和有效的,并且取得很好的情感分類效果.
【作者單位】: 廣東外語外貿(mào)大學(xué)思科信息學(xué)院;廣東外語外貿(mào)大學(xué)語言工程與計(jì)算實(shí)驗(yàn)室;廣東外語外貿(mào)大學(xué)財(cái)務(wù)處;
【關(guān)鍵詞】: 微博情感 數(shù)據(jù)稀疏 詞向量 特征簇 機(jī)器學(xué)習(xí)
【基金】:國家社會(huì)科學(xué)基金項(xiàng)目(12BYY045)資助 廣東外語外貿(mào)大學(xué)研究生科研創(chuàng)新項(xiàng)目(14GWCXXM-36)資助;廣東外語外貿(mào)大學(xué)創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(201511846021)資助
【分類號(hào)】:TP391.1
【正文快照】: 1引言互聯(lián)網(wǎng)的蓬勃發(fā)展,方便了網(wǎng)民觀點(diǎn)的表達(dá)與傳播,在線文本呈現(xiàn)爆炸式增長.針對主觀性文本中所包含的用戶觀點(diǎn)、情感和情緒等進(jìn)行分析的研究,已成為自然語言處理技術(shù)的一個(gè)熱點(diǎn)方向.微博往往以短文本形式存在,存在用詞隨意、文本格式較不規(guī)范和表意方式多樣等特點(diǎn),而且由于
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張明玉,倪志偉;基于機(jī)器學(xué)習(xí)的智能決策支持系統(tǒng)[J];淮南師范學(xué)院學(xué)報(bào);2005年03期
2 楊凌霄;武建平;;機(jī)器學(xué)習(xí)方法在人臉檢測中的應(yīng)用[J];計(jì)算機(jī)與數(shù)字工程;2008年03期
3 ;第十一屆中國機(jī)器學(xué)習(xí)會(huì)議[J];智能系統(tǒng)學(xué)報(bào);2008年02期
4 ;第14屆中國機(jī)器學(xué)習(xí)會(huì)議[J];智能系統(tǒng)學(xué)報(bào);2012年06期
5 費(fèi)宗銘;呂建;王志堅(jiān);陳道蓄;徐家福;;機(jī)器學(xué)習(xí)[J];計(jì)算機(jī)科學(xué);1991年01期
6 趙沁平;魏華;王軍玲;;機(jī)器學(xué)習(xí)技術(shù)與機(jī)器學(xué)習(xí)系統(tǒng)[J];計(jì)算機(jī)科學(xué);1993年05期
7 姚敏;機(jī)器學(xué)習(xí)及其發(fā)展方向[J];計(jì)算機(jī)時(shí)代;1994年04期
8 ;第31屆機(jī)器學(xué)習(xí)國際會(huì)議(英文)[J];智能系統(tǒng)學(xué)報(bào);2014年01期
9 黃海濱;機(jī)器學(xué)習(xí)及其主要策略[J];河池師范高等?茖W(xué)校學(xué)報(bào)(自然科學(xué)版);2000年04期
10 佘玉梅;一種協(xié)調(diào)機(jī)器學(xué)習(xí)方法研究[J];云南民族學(xué)院學(xué)報(bào)(自然科學(xué)版);2000年03期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 王玨;;歸納機(jī)器學(xué)習(xí)[A];2001年中國智能自動(dòng)化會(huì)議論文集(上冊)[C];2001年
2 王昊;李銀波;紀(jì)志梁;;利用機(jī)器學(xué)習(xí)方法預(yù)測嚴(yán)重藥物不良反應(yīng)-呼吸困難[A];中國化學(xué)會(huì)第28屆學(xué)術(shù)年會(huì)第13分會(huì)場摘要集[C];2012年
3 吳滄浦;;智能系統(tǒng)與機(jī)器學(xué)習(xí)的新領(lǐng)域[A];西部大開發(fā) 科教先行與可持續(xù)發(fā)展——中國科協(xié)2000年學(xué)術(shù)年會(huì)文集[C];2000年
4 周晴杰;徐立鴻;吳啟迪;;機(jī)器學(xué)習(xí)串級(jí)結(jié)構(gòu)的初步探討[A];1998年中國控制會(huì)議論文集[C];1998年
5 李剛;郭崇慧;林鴻飛;楊志豪;唐煥文;;基于詞典法和機(jī)器學(xué)習(xí)法相結(jié)合的蛋白質(zhì)名識(shí)別[A];大連理工大學(xué)生物醫(yī)學(xué)工程學(xué)術(shù)論文集(第2卷)[C];2005年
6 徐禮勝;李乃民;王寬全;張冬雨;耿斌;姜曉睿;陳超海;羅貴存;;機(jī)器學(xué)習(xí)在中醫(yī)計(jì)算機(jī)診斷識(shí)別系統(tǒng)中的應(yīng)用思考[A];第一屆全國中西醫(yī)結(jié)合診斷學(xué)術(shù)會(huì)議論文選集[C];2006年
7 蔡健平;林世平;;基于機(jī)器學(xué)習(xí)的詞語和句子極性分析[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
8 黃金鐵;李景銀;周建常;;對高爐爐況評(píng)價(jià)模型參數(shù)的機(jī)器學(xué)習(xí)——一個(gè)三類線性模式分類器的實(shí)現(xiàn)[A];1995中國控制與決策學(xué)術(shù)年會(huì)論文集[C];1995年
9 程國建;蔡磊;潘華賢;;核向量機(jī)在大規(guī)模機(jī)器學(xué)習(xí)中的應(yīng)用[A];第十一屆中國青年信息與管理學(xué)者大會(huì)論文集[C];2009年
10 張鈸;張鈴;;統(tǒng)計(jì)學(xué)習(xí)理論及其應(yīng)用[A];2001年中國智能自動(dòng)化會(huì)議論文集(上冊)[C];2001年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 黎驪/文 [美] Tom M.Mitchell 著;機(jī)器學(xué)習(xí)與智能化社會(huì)[N];中國郵政報(bào);2003年
2 IBM大數(shù)據(jù)專家 James Kobielus 范范 編譯;機(jī)器學(xué)習(xí)已成為大數(shù)據(jù)基石[N];網(wǎng)絡(luò)世界;2014年
3 本報(bào)記者 房琳琳;合久必分:分布式“機(jī)器學(xué)習(xí)”應(yīng)運(yùn)而生[N];科技日報(bào);2014年
4 雨辰;機(jī)器學(xué)習(xí)類圖書為什么火爆[N];中華讀書報(bào);2014年
5 百度公司技術(shù)副總監(jiān) 多媒體部負(fù)責(zé)人 余凱;深度學(xué)習(xí)與多媒體搜索技術(shù)演進(jìn)[N];中國信息化周報(bào);2013年
6 本報(bào)記者 余建斌;機(jī)器學(xué)習(xí)與互聯(lián)網(wǎng)搜索[N];人民日報(bào);2011年
7 本報(bào)記者 張曄邋通訊員 李瑋;周志華:永不墨守成規(guī)[N];科技日報(bào);2008年
8 記者 彭德倩;機(jī)器學(xué)習(xí)精度提升近6個(gè)百分點(diǎn)[N];解放日報(bào);2006年
9 本報(bào)記者 閔杰;大數(shù)據(jù)熱 高端人才缺[N];中國電子報(bào);2013年
10 沈建苗 編譯;如何成為大數(shù)據(jù)科學(xué)家[N];計(jì)算機(jī)世界;2013年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 董春茹;機(jī)器學(xué)習(xí)中的權(quán)重學(xué)習(xí)與差分演化[D];華南理工大學(xué);2015年
2 姚明臣;機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中的若干問題研究[D];大連理工大學(xué);2016年
3 趙玉鵬;機(jī)器學(xué)習(xí)的哲學(xué)探索[D];大連理工大學(xué);2010年
4 胡巍;面向格結(jié)構(gòu)的機(jī)器學(xué)習(xí)[D];上海交通大學(xué);2009年
5 張義榮;基于機(jī)器學(xué)習(xí)的入侵檢測技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2005年
6 錢線;快速精確的結(jié)構(gòu)化機(jī)器學(xué)習(xí)方法研究[D];復(fù)旦大學(xué);2010年
7 梁錫軍;稀疏優(yōu)化在機(jī)器學(xué)習(xí)中的若干應(yīng)用[D];大連理工大學(xué);2013年
8 蔣剛;核機(jī)器學(xué)習(xí)方法若干問題研究[D];西南交通大學(xué);2006年
9 陳慧靈;面向智能決策問題的機(jī)器學(xué)習(xí)方法研究[D];吉林大學(xué);2012年
10 周偉達(dá);核機(jī)器學(xué)習(xí)方法研究[D];西安電子科技大學(xué);2003年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 毛海斌;基于半監(jiān)督機(jī)器學(xué)習(xí)的情感分類領(lǐng)域適應(yīng)問題研究[D];南京理工大學(xué);2015年
2 安軍輝;基于微博數(shù)據(jù)的微博用戶性別判斷研究[D];華中師范大學(xué);2015年
3 陳召陽;基于機(jī)器學(xué)習(xí)的改性麥槽吸附重金屬構(gòu)效關(guān)系模型研究[D];江西理工大學(xué);2014年
4 王成;基于半監(jiān)督機(jī)器學(xué)習(xí)的文本情感分析技術(shù)[D];南京理工大學(xué);2015年
5 孫科;基于Spark的機(jī)器學(xué)習(xí)應(yīng)用框架研究與實(shí)現(xiàn)[D];上海交通大學(xué);2015年
6 劉江龍;基于機(jī)器學(xué)習(xí)的射頻指紋定位方法研究[D];電子科技大學(xué);2015年
7 張蕾;基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)輿情采集技術(shù)研究與設(shè)計(jì)[D];電子科技大學(xué);2014年
8 施宇;基于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的木馬檢測系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
9 施應(yīng)敏;基于機(jī)器學(xué)習(xí)的Femtocell信道頻譜與功率資源分配算法的研究[D];南京郵電大學(xué);2015年
10 張柯;基于機(jī)器學(xué)習(xí)的錯(cuò)誤定位方法研究[D];南京航空航天大學(xué);2015年
,本文編號(hào):565851
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/565851.html