基于深度學(xué)習(xí)的文本情緒原因發(fā)現(xiàn)方法的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-01-25 17:09
隨著互聯(lián)網(wǎng)的飛速發(fā)展,人們越來越多地在網(wǎng)絡(luò)媒體上闡述自己的觀點(diǎn),并表達(dá)自己的情緒。在這種背景之下,互聯(lián)網(wǎng)中包含情緒傾向和觀點(diǎn)傾向的文本數(shù)據(jù)呈現(xiàn)爆炸性的增長。這些文本信息具有非凡的價(jià)值,它經(jīng)常包括發(fā)表人的情緒和觀點(diǎn),有助于人們從中提取每一個(gè)人的興趣點(diǎn)與關(guān)注點(diǎn)。近年來,人們經(jīng)常會(huì)從文本中的情感信息用于進(jìn)行決策。近年來,人們還開始利用文本中的情感信息,提取情緒發(fā)生的原因。情緒原因提取主要目標(biāo)使從文本中識(shí)別某種情緒表達(dá)背后的原因。本文主要研究并實(shí)現(xiàn)基于深度學(xué)習(xí)的情緒原因發(fā)現(xiàn)方法。通過深度學(xué)習(xí)的方法建立情感詞與文本中的句子之間的關(guān)系,并以此識(shí)別文本中的情緒原因。在以往的研究中,基于深度學(xué)習(xí)的方法通常是去準(zhǔn)確地獲取情感詞與文本中句子之間的語義相關(guān)性,并依此來識(shí)別文本中的情感原因。本文主要分為四方面內(nèi)容:(1)針對(duì)目前情緒原因發(fā)現(xiàn)問題的語料較小,若采用一些相對(duì)復(fù)雜的深度網(wǎng)絡(luò),往往容易過擬合。本文采用了一種新的情緒原因半自動(dòng)標(biāo)注方法,擴(kuò)充了一倍的數(shù)據(jù)集,并利用目前Gui提出的基于記憶網(wǎng)絡(luò)的深度模型驗(yàn)證了數(shù)據(jù)有效性。(2)針對(duì)目前情緒原因發(fā)現(xiàn)方法只采用了互注意力機(jī)制,只考慮了情感詞與文本子句之間的關(guān)系而...
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:63 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1?CBOW和Skip-Gram模型結(jié)構(gòu)圖??CBOW模型的目標(biāo)是利用己知的上下文詞向量來預(yù)測目標(biāo)詞詞的出現(xiàn)概率,由??CBOW經(jīng),一,
一個(gè)子句是否為產(chǎn)生該情感的原因。本文的原始數(shù)據(jù)來自騰訊新聞,作者通過搭??建爬蟲程序,爬取了?2018年3-6月共30000篇新聞文章,并且保留文章標(biāo)題、??正文和日期。本文使用的半自動(dòng)標(biāo)注方法流程如圖3-1:??■躺?!鑫谋尽鲈~5、,J極職'德1^??圖3-1半自動(dòng)標(biāo)注流程圖??通過觀察原始語料,作者發(fā)現(xiàn)很多原始語料中只表達(dá)新聞事件本身,新聞中??的主人公并未表達(dá)情緒,新聞中也沒有表現(xiàn)出明顯的情緒傾向。像這一類文本是??不符合情緒原因發(fā)現(xiàn)問題的標(biāo)注要求的。作為情緒原因發(fā)現(xiàn)問題的標(biāo)準(zhǔn)文本,應(yīng)??是帶有情緒的文章。因此需要有一種方法來對(duì)包含情緒的語料進(jìn)行篩選。在本文??中,筆者利用情緒極性分類的方式來篩選文本。??情緒文本提取步驟如下:1.本文直接使用了?LSTM作為訓(xùn)練算法,通過評(píng)論??極性數(shù)據(jù)集訓(xùn)練出了一個(gè)情緒極性分類模型,把文章分為正極性和負(fù)極性。模型??16??
前己經(jīng)存在表中的情緒文本和原因,用戶操作表用于存儲(chǔ)用戶提交的情緒文本和??結(jié)果,用戶日志表用于記錄系統(tǒng)用戶提交的模型更新,模型路徑表用戶存儲(chǔ)模型??的存儲(chǔ)路徑。如圖5-2為本系統(tǒng)數(shù)據(jù)庫設(shè)計(jì)的E-R圖。??|??!??36??
本文編號(hào):2999581
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:63 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1?CBOW和Skip-Gram模型結(jié)構(gòu)圖??CBOW模型的目標(biāo)是利用己知的上下文詞向量來預(yù)測目標(biāo)詞詞的出現(xiàn)概率,由??CBOW經(jīng),一,
一個(gè)子句是否為產(chǎn)生該情感的原因。本文的原始數(shù)據(jù)來自騰訊新聞,作者通過搭??建爬蟲程序,爬取了?2018年3-6月共30000篇新聞文章,并且保留文章標(biāo)題、??正文和日期。本文使用的半自動(dòng)標(biāo)注方法流程如圖3-1:??■躺?!鑫谋尽鲈~5、,J極職'德1^??圖3-1半自動(dòng)標(biāo)注流程圖??通過觀察原始語料,作者發(fā)現(xiàn)很多原始語料中只表達(dá)新聞事件本身,新聞中??的主人公并未表達(dá)情緒,新聞中也沒有表現(xiàn)出明顯的情緒傾向。像這一類文本是??不符合情緒原因發(fā)現(xiàn)問題的標(biāo)注要求的。作為情緒原因發(fā)現(xiàn)問題的標(biāo)準(zhǔn)文本,應(yīng)??是帶有情緒的文章。因此需要有一種方法來對(duì)包含情緒的語料進(jìn)行篩選。在本文??中,筆者利用情緒極性分類的方式來篩選文本。??情緒文本提取步驟如下:1.本文直接使用了?LSTM作為訓(xùn)練算法,通過評(píng)論??極性數(shù)據(jù)集訓(xùn)練出了一個(gè)情緒極性分類模型,把文章分為正極性和負(fù)極性。模型??16??
前己經(jīng)存在表中的情緒文本和原因,用戶操作表用于存儲(chǔ)用戶提交的情緒文本和??結(jié)果,用戶日志表用于記錄系統(tǒng)用戶提交的模型更新,模型路徑表用戶存儲(chǔ)模型??的存儲(chǔ)路徑。如圖5-2為本系統(tǒng)數(shù)據(jù)庫設(shè)計(jì)的E-R圖。??|??!??36??
本文編號(hào):2999581
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2999581.html
最近更新
教材專著