基于深度學(xué)習(xí)的中文短文本情感分析
發(fā)布時(shí)間:2021-12-02 10:23
隨著互聯(lián)網(wǎng)不斷發(fā)展,網(wǎng)絡(luò)評(píng)論平臺(tái)不斷增加,用戶評(píng)論數(shù)量也爆發(fā)式增長。利用情感分析技術(shù)能夠有效的挖掘文本包含的情感信息,目前已成為社會(huì)輿情監(jiān)督和廠家獲取反饋信息的重要途徑,具有很高的研究價(jià)值。本文的研究目的是探究中文短文本中所包含的情感信息,主要解決文本情感極性褒貶義分類問題。傳統(tǒng)的情感分析方法主要有兩種:基于情感詞典的方法和基于機(jī)器學(xué)習(xí)的方法。但由于文本語料簡短,含有大量未登錄詞使得上述方法存在數(shù)據(jù)稀疏問題,且過分依賴領(lǐng)域?qū)<业臉?biāo)注。近年來出現(xiàn)的深度學(xué)習(xí)技術(shù)能夠很好的解決上述問題。因此,本文采用深度學(xué)習(xí)的方法對(duì)中文短文本進(jìn)行情感分析。主要研究內(nèi)容如下:首先,在文本數(shù)據(jù)預(yù)處理過程,針對(duì)目前網(wǎng)絡(luò)上存在的大量未登錄詞,設(shè)計(jì)了一種新詞發(fā)現(xiàn)方法,主要是利用詞語的內(nèi)部凝固度、邊界自由度及語言規(guī)則對(duì)候選新詞進(jìn)行過濾。將識(shí)別的新詞加入詞庫,提高分詞的準(zhǔn)確率。其次,傳統(tǒng)的詞向量僅考慮了文本中的語義語法信息,會(huì)將語義相近,情感極性卻相反的詞語映射到相鄰的位置,導(dǎo)致最終分類結(jié)果錯(cuò)誤。為了解決此問題,本文在傳統(tǒng)詞向量的基礎(chǔ)上融合了情感信息,提出一種情感詞向量的生成方法。最后,針對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)在處理時(shí)序信息發(fā)生...
【文章來源】:沈陽工業(yè)大學(xué)遼寧省
【文章頁數(shù)】:56 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
向量空間模型
圖 2.2 向量空間模型Fig. 2.2 Vector space model中, (,,...,)1 2nT ttt為文本的特征, {,,...,}1 2mD ddd為包含 m 個(gè)文檔的文檔i 為 第 i 個(gè) 文 檔 的 特 征 空 間 向 量1 2{ , ,..., } ( 1, 2,..., )i i inV w w w ,i m,2,. . .m ,;j1,2,. . .n ,) 為文檔id 中的第 j 個(gè)詞條jt 的權(quán)值。這種模型可以滿足求,但由于 VSM 只考慮詞本身信息,幾乎完全忽視了詞語間的相關(guān)聯(lián)系析結(jié)果的準(zhǔn)確率產(chǎn)生一定的影響。概率主題模型篇文檔可以由許多主題構(gòu)成,每種主題都會(huì)按一定的概率呈現(xiàn),在文檔概率公式可由矩陣表示,如圖 2.3 所示。集..dm. . .. . .. . .wm1wm2... wmn文 檔文 檔
人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
【參考文獻(xiàn)】:
期刊論文
[1]基于雙重注意力模型的微博情感分析方法[J]. 張仰森,鄭佳,黃改娟,蔣玉茹. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(02)
[2]基于SVM和CRF多特征組合的微博情感分析[J]. 李婷婷,姬東鴻. 計(jì)算機(jī)應(yīng)用研究. 2015(04)
[3]基于SVM的文本詞句情感分析[J]. 楊經(jīng),林世平. 計(jì)算機(jī)應(yīng)用與軟件. 2011(09)
[4]國內(nèi)中文自動(dòng)分詞技術(shù)研究綜述[J]. 奉國和,鄭偉. 圖書情報(bào)工作. 2011(02)
[5]Internet中的新詞識(shí)別[J]. 李鈍,曹元大,萬月亮. 北京郵電大學(xué)學(xué)報(bào). 2008(01)
[6]面向Internet的中文新詞語檢測[J]. 鄒綱,劉洋,劉群,孟遙,于浩,西野文人,亢世勇. 中文信息學(xué)報(bào). 2004(06)
博士論文
[1]適應(yīng)于不同領(lǐng)域的中文分詞方法研究與實(shí)現(xiàn)[D]. 修馳.北京工業(yè)大學(xué) 2013
[2]基于遺傳算法優(yōu)化的中文分詞研究[D]. 何嘉.電子科技大學(xué) 2012
碩士論文
[1]基于文本流的中文新詞識(shí)別技術(shù)研究與應(yīng)用[D]. 方婷.北京郵電大學(xué) 2015
[2]中文分詞算法的研究與實(shí)現(xiàn)[D]. 朱世猛.電子科技大學(xué) 2011
本文編號(hào):3528250
【文章來源】:沈陽工業(yè)大學(xué)遼寧省
【文章頁數(shù)】:56 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
向量空間模型
圖 2.2 向量空間模型Fig. 2.2 Vector space model中, (,,...,)1 2nT ttt為文本的特征, {,,...,}1 2mD ddd為包含 m 個(gè)文檔的文檔i 為 第 i 個(gè) 文 檔 的 特 征 空 間 向 量1 2{ , ,..., } ( 1, 2,..., )i i inV w w w ,i m,2,. . .m ,;j1,2,. . .n ,) 為文檔id 中的第 j 個(gè)詞條jt 的權(quán)值。這種模型可以滿足求,但由于 VSM 只考慮詞本身信息,幾乎完全忽視了詞語間的相關(guān)聯(lián)系析結(jié)果的準(zhǔn)確率產(chǎn)生一定的影響。概率主題模型篇文檔可以由許多主題構(gòu)成,每種主題都會(huì)按一定的概率呈現(xiàn),在文檔概率公式可由矩陣表示,如圖 2.3 所示。集..dm. . .. . .. . .wm1wm2... wmn文 檔文 檔
人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
【參考文獻(xiàn)】:
期刊論文
[1]基于雙重注意力模型的微博情感分析方法[J]. 張仰森,鄭佳,黃改娟,蔣玉茹. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(02)
[2]基于SVM和CRF多特征組合的微博情感分析[J]. 李婷婷,姬東鴻. 計(jì)算機(jī)應(yīng)用研究. 2015(04)
[3]基于SVM的文本詞句情感分析[J]. 楊經(jīng),林世平. 計(jì)算機(jī)應(yīng)用與軟件. 2011(09)
[4]國內(nèi)中文自動(dòng)分詞技術(shù)研究綜述[J]. 奉國和,鄭偉. 圖書情報(bào)工作. 2011(02)
[5]Internet中的新詞識(shí)別[J]. 李鈍,曹元大,萬月亮. 北京郵電大學(xué)學(xué)報(bào). 2008(01)
[6]面向Internet的中文新詞語檢測[J]. 鄒綱,劉洋,劉群,孟遙,于浩,西野文人,亢世勇. 中文信息學(xué)報(bào). 2004(06)
博士論文
[1]適應(yīng)于不同領(lǐng)域的中文分詞方法研究與實(shí)現(xiàn)[D]. 修馳.北京工業(yè)大學(xué) 2013
[2]基于遺傳算法優(yōu)化的中文分詞研究[D]. 何嘉.電子科技大學(xué) 2012
碩士論文
[1]基于文本流的中文新詞識(shí)別技術(shù)研究與應(yīng)用[D]. 方婷.北京郵電大學(xué) 2015
[2]中文分詞算法的研究與實(shí)現(xiàn)[D]. 朱世猛.電子科技大學(xué) 2011
本文編號(hào):3528250
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3528250.html
最近更新
教材專著