基于混合高斯分布偽樣本生成的情感分析方法
本文關(guān)鍵詞:基于混合高斯分布偽樣本生成的情感分析方法,由筆耕文化傳播整理發(fā)布。
【摘要】:針對(duì)微博行文自由性大,情感傾向識(shí)別困難的問題,提出了一種基于混合高斯分布偽樣本生成技術(shù)和條件隨機(jī)場(chǎng)模型的新方法。該方法首先利用混合高斯分布模型來(lái)為訓(xùn)練集中的少數(shù)類生成偽樣本從而構(gòu)建一個(gè)情感傾向分布平衡的訓(xùn)練集,然后通過使用Word2vec來(lái)擴(kuò)展微博句子以豐富它的情感信息,從而緩解情感詞典不足夠大對(duì)情感分類的負(fù)面影響;最后將條件隨機(jī)場(chǎng)模型應(yīng)用在上面已經(jīng)平衡和擴(kuò)展后的訓(xùn)練集上.實(shí)驗(yàn)結(jié)果表明該方法比現(xiàn)有方法在數(shù)據(jù)集情感傾向分布不平衡時(shí)能更有效地識(shí)別微博的情感傾向.
【作者單位】: 廣東工業(yè)大學(xué)計(jì)算機(jī)學(xué)院;
【關(guān)鍵詞】: 情感分析 混合高斯分布 條件隨機(jī)場(chǎng) 情感傾向 不平衡性 Wordvec
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(61472089,61572143)
【分類號(hào)】:TP391.1
【正文快照】: 微博作為一個(gè)新的社交平臺(tái),承載了海量的信息,如何有效分析和挖掘用戶微博中的情感是非常有意義的[1].與傳統(tǒng)的情感分析工作一樣,對(duì)微博的情感分析方法可以分為兩類.一類是基于情感詞典和規(guī)則的方法,這類方法通過計(jì)算句子中負(fù)面情感詞和正面情感詞的個(gè)數(shù)來(lái)識(shí)別情感傾向[2-6].
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 劉玉超;馬于濤;張海粟;陳桂生;;高階高斯分布迭代的云模型及其數(shù)學(xué)性質(zhì)研究[J];電子學(xué)報(bào);2012年10期
2 邵葉秦;任明武;楊靜宇;;基于多高斯分布的背景生成算法[J];計(jì)算機(jī)工程;2008年13期
3 G.Eranna ,D.Kakali ,肖輝揚(yáng);硅中磷擴(kuò)散的工藝模擬試驗(yàn)——一種新的模型[J];微電子學(xué);1985年01期
4 周宏潮,朱炬波,王正明;混合泊松-高斯分布模型的參數(shù)估計(jì)[J];中國(guó)空間科學(xué)技術(shù);2005年02期
5 袁少鋒;王士同;;基于多元混合高斯分布的多分類人臉識(shí)別方法[J];計(jì)算機(jī)應(yīng)用研究;2013年09期
6 曾華;;基于混合高斯分布的紅外人臉分割研究[J];長(zhǎng)江工程職業(yè)技術(shù)學(xué)院學(xué)報(bào);2011年02期
7 ;數(shù)據(jù)處理、信息處理[J];電子科技文摘;1999年06期
8 ■曉平;;散粒噪聲分布探討[J];光通信研究;1986年02期
9 季鐸;王智超;蔡?hào)|風(fēng);張桂平;;基于高斯分布的簇間距離計(jì)算方法[J];中文信息學(xué)報(bào);2008年03期
10 李朝偉;王宏強(qiáng);黎湘;莊釗文;;多個(gè)斯威林4型目標(biāo)輸出信號(hào)近似服從高斯分布研究[J];電子與信息學(xué)報(bào);2006年02期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前3條
1 孫浩軍;孔令俊;劉志輝;;利用高斯分布生成數(shù)據(jù)對(duì)聚類算法的比較[A];2007'儀表,自動(dòng)化及先進(jìn)集成技術(shù)大會(huì)論文集(一)[C];2007年
2 王華;程侃;;逆高斯分布在可靠性中的應(yīng)用[A];2001年全國(guó)數(shù)學(xué)規(guī)劃及運(yùn)籌研討會(huì)論文集[C];2001年
3 蒲克塞;郭承軍;;基于混合高斯包絡(luò)法的偽碼-載波偏離度監(jiān)測(cè)器門限設(shè)計(jì)[A];第四屆中國(guó)衛(wèi)星導(dǎo)航學(xué)術(shù)年會(huì)論文集-S5 衛(wèi)星導(dǎo)航增強(qiáng)與完好性監(jiān)測(cè)[C];2013年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 林祥濤;上下文認(rèn)知計(jì)算技術(shù)研究[D];北京郵電大學(xué);2010年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前9條
1 李思明;基于復(fù)合高斯模型的雜波統(tǒng)計(jì)分析與建模[D];哈爾濱工業(yè)大學(xué);2015年
2 吳安勤;基于EM估計(jì)的正態(tài)逆高斯分布下中國(guó)股票收益率分布研究[D];南京大學(xué);2014年
3 馮曉利;單峰高斯分布適應(yīng)面上準(zhǔn)物種演化的研究[D];鄭州大學(xué);2006年
4 王淑華;逆高斯分布輸入下的Integrate-and-Fire模型[D];湖南師范大學(xué);2008年
5 鄧立鳳;逆高斯分布參數(shù)的Bayes 估計(jì)研究[D];廣西師范學(xué)院;2010年
6 周佩;基于高斯分布的率失真優(yōu)化方法[D];西安電子科技大學(xué);2012年
7 王剛;基于多變量亞高斯分布模型的圖像檢索的研究[D];揚(yáng)州大學(xué);2013年
8 張萌;對(duì)影響視頻精確跟蹤因素的研究及跟蹤模式的優(yōu)化[D];寧波大學(xué);2012年
9 李淑娟;高斯分布聲子腔對(duì)半導(dǎo)體納米線中聲子輸運(yùn)影響的研究[D];湖南大學(xué);2010年
本文關(guān)鍵詞:基于混合高斯分布偽樣本生成的情感分析方法,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):476192
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/476192.html