基于Stacking框架弱監(jiān)督深度學(xué)習(xí)情感分析研究
發(fā)布時(shí)間:2021-10-12 13:56
隨著互聯(lián)網(wǎng)的快速發(fā)展,互聯(lián)網(wǎng)社會(huì)化媒體已成為人們獲取信息、陳述觀點(diǎn)、表達(dá)情緒和情感的主要平臺(tái)。這些情感與觀點(diǎn)往往蘊(yùn)含了大量有價(jià)值的信息,對(duì)社會(huì)政治經(jīng)濟(jì)發(fā)展等各個(gè)方面都有著潛移默化的影響。如何研究并利用這些情感信息有著十分重要的意義。目前主流的情感分析研究方法包括情感詞典結(jié)合句法規(guī)則和利用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)方法構(gòu)造情感分析模型等。詞典法依賴于情感詞典的構(gòu)建,對(duì)新詞、不規(guī)范詞匯和變形詞要做到及時(shí)吸收,存在詞典更新要求高且精度不足等問題。利用機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的情感分析依賴于模型的構(gòu)建與特征的選取,在模型訓(xùn)練時(shí)需要提供有效的訓(xùn)練庫,傳統(tǒng)的監(jiān)督學(xué)習(xí)算法都需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)記,但隨著時(shí)代的發(fā)展,大量的無標(biāo)記數(shù)據(jù)的出現(xiàn)使得標(biāo)記成本越來越高,在處理海量數(shù)據(jù)時(shí)其標(biāo)記代價(jià)幾乎不可接受。針對(duì)這種問題,本文提出嘗試使用弱監(jiān)督的思路,在少量標(biāo)記的情況下通過使用預(yù)訓(xùn)練好的模型對(duì)無標(biāo)記數(shù)據(jù)進(jìn)行預(yù)測(cè),然后將預(yù)測(cè)結(jié)果作為訓(xùn)練數(shù)據(jù)再次輸入模型進(jìn)行訓(xùn)練,不斷提高模型的情感分類性能,以此解決標(biāo)記代價(jià)高,訓(xùn)練庫數(shù)據(jù)量不足的問題。鑒于目前主流的機(jī)器學(xué)習(xí)與深度學(xué)習(xí)情感分析算法都有其主要擅長的領(lǐng)域而同時(shí)也均存在自身的短板,如樸素貝葉...
【文章來源】:西南財(cái)經(jīng)大學(xué)四川省 211工程院校 教育部直屬院校
【文章頁數(shù)】:85 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
CBOW模型;
CBOW模型
Skip-gram模型
【參考文獻(xiàn)】:
期刊論文
[1]基于LSTM網(wǎng)絡(luò)的居民區(qū)供熱負(fù)荷短時(shí)預(yù)測(cè)[J]. 許裕栗,姜娜,陳卓,李檸,甘中學(xué). 自動(dòng)化儀表. 2018(10)
[2]高校圖書館紙質(zhì)圖書PDA模式中用戶權(quán)重芻議[J]. 李迪. 農(nóng)業(yè)圖書情報(bào)學(xué)刊. 2018(07)
[3]基于弱監(jiān)督預(yù)訓(xùn)練深度模型的微博情感分析[J]. 萬圣賢,蘭艷艷,郭嘉豐,程學(xué)旗. 中文信息學(xué)報(bào). 2017(03)
[4]一種基于改進(jìn)的TF-IDF和支持向量機(jī)的中文文本分類研究[J]. 郭太勇. 軟件. 2016(12)
[5]分類器集成算法研究[J]. 周星,丁立新,萬潤澤,葛強(qiáng). 武漢大學(xué)學(xué)報(bào)(理學(xué)版). 2015(06)
[6]改進(jìn)隨機(jī)子空間與決策樹相結(jié)合的不平衡數(shù)據(jù)分類方法[J]. 胡小生. 佛山科學(xué)技術(shù)學(xué)院學(xué)報(bào)(自然科學(xué)版). 2013(05)
[7]基于SVM的產(chǎn)品評(píng)論屬性特征的情感傾向分析[J]. 王文華,朱艷輝,徐葉強(qiáng),杜銳,魯琳,鄧程. 湖南工業(yè)大學(xué)學(xué)報(bào). 2012(05)
[8]基于Stacking算法的組合分類器及其應(yīng)用于中文組塊分析[J]. 李珩,朱靖波,姚天順. 計(jì)算機(jī)研究與發(fā)展. 2005(05)
本文編號(hào):3432711
【文章來源】:西南財(cái)經(jīng)大學(xué)四川省 211工程院校 教育部直屬院校
【文章頁數(shù)】:85 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
CBOW模型;
CBOW模型
Skip-gram模型
【參考文獻(xiàn)】:
期刊論文
[1]基于LSTM網(wǎng)絡(luò)的居民區(qū)供熱負(fù)荷短時(shí)預(yù)測(cè)[J]. 許裕栗,姜娜,陳卓,李檸,甘中學(xué). 自動(dòng)化儀表. 2018(10)
[2]高校圖書館紙質(zhì)圖書PDA模式中用戶權(quán)重芻議[J]. 李迪. 農(nóng)業(yè)圖書情報(bào)學(xué)刊. 2018(07)
[3]基于弱監(jiān)督預(yù)訓(xùn)練深度模型的微博情感分析[J]. 萬圣賢,蘭艷艷,郭嘉豐,程學(xué)旗. 中文信息學(xué)報(bào). 2017(03)
[4]一種基于改進(jìn)的TF-IDF和支持向量機(jī)的中文文本分類研究[J]. 郭太勇. 軟件. 2016(12)
[5]分類器集成算法研究[J]. 周星,丁立新,萬潤澤,葛強(qiáng). 武漢大學(xué)學(xué)報(bào)(理學(xué)版). 2015(06)
[6]改進(jìn)隨機(jī)子空間與決策樹相結(jié)合的不平衡數(shù)據(jù)分類方法[J]. 胡小生. 佛山科學(xué)技術(shù)學(xué)院學(xué)報(bào)(自然科學(xué)版). 2013(05)
[7]基于SVM的產(chǎn)品評(píng)論屬性特征的情感傾向分析[J]. 王文華,朱艷輝,徐葉強(qiáng),杜銳,魯琳,鄧程. 湖南工業(yè)大學(xué)學(xué)報(bào). 2012(05)
[8]基于Stacking算法的組合分類器及其應(yīng)用于中文組塊分析[J]. 李珩,朱靖波,姚天順. 計(jì)算機(jī)研究與發(fā)展. 2005(05)
本文編號(hào):3432711
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3432711.html
最近更新
教材專著