面向網(wǎng)絡(luò)評(píng)論短文本的情感分析研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-03-05 19:18
隨著互聯(lián)網(wǎng)的快速發(fā)展,微博、貼吧、抖音等各種社交型網(wǎng)絡(luò)平臺(tái)對(duì)人們生活的影響越來越大,大量的網(wǎng)絡(luò)用戶在各種平臺(tái)上會(huì)產(chǎn)生海量的信息,分析這些海量信息所隱藏的情感極性具有極大的商業(yè)和社會(huì)價(jià)值,因此對(duì)社交型網(wǎng)絡(luò)平臺(tái)的文本進(jìn)行情感分析,已經(jīng)成為當(dāng)今的熱點(diǎn)。在網(wǎng)絡(luò)評(píng)論文本中,網(wǎng)絡(luò)新詞層出不窮,由于網(wǎng)絡(luò)評(píng)論開放性的特點(diǎn),表達(dá)相似語義的評(píng)論在不同背景語境下,情感極性都有可能發(fā)生改變。針對(duì)以上問題,本文提出了一套綜合的網(wǎng)絡(luò)評(píng)論文本的情感分析方法。本文具體的工作如下所示:(1)針對(duì)網(wǎng)絡(luò)新詞問題,本文建立了一套新詞自動(dòng)發(fā)現(xiàn)及情感識(shí)別系統(tǒng)。在新詞發(fā)現(xiàn)的方面采用傳統(tǒng)的基于統(tǒng)計(jì)的新詞發(fā)現(xiàn)方法,該方法可以自動(dòng)發(fā)現(xiàn)新詞省去了大量的人工標(biāo)注工作,在新詞情感識(shí)別方面提出了一種基于新詞上下文、情感詞典基準(zhǔn)詞及新詞分布式語義相似度的綜合比較方法,來判斷新詞情感極性,最后自動(dòng)建立了網(wǎng)絡(luò)新詞情感詞典。(2)在網(wǎng)絡(luò)評(píng)論背景多樣性問題上,本文提出了一種基于背景增強(qiáng)的情感分類模型,該模型對(duì)評(píng)論進(jìn)行情感分類的時(shí)候,將評(píng)論的相關(guān)新聞或帖子作為其背景,并將其作為評(píng)論文本情感分析的特征,加入到情感分類模型中,從而提高了模型在不同背景下情感分析...
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【圖文】:
前饋神經(jīng)網(wǎng)絡(luò)
?Xt?Xt-i??圖2-9循環(huán)隱藏層??Figure?2-9?Loop?hidden?layer??圖2-9是隱藏層(HidderLayer)層級(jí)展開圖,t-l,t,t+l表示時(shí)間序列,X是輸??入的樣本&表示樣本在t時(shí)刻的記憶,妒表示上一層記憶輸入的權(quán)重,f;表示此刻??輸入的樣本的權(quán)重,F表示輸出的樣本權(quán)重。在t=l時(shí)刻,一般初始化輸入知=0,??隨機(jī)初始化%?R?F,進(jìn)行下面的公式計(jì)算?_??hl=Uxl+?Ws0?(2-8)??st=m)?(2-9)??〇]?=g(^i)?(2-10)??其中,/、g均為激活函數(shù)/可以為tarLh、relu、sigmoid,而g—般為softmax也??可以是其他。以下時(shí)刻的狀態(tài)時(shí)間就向前推進(jìn),此時(shí)的狀態(tài)A作為時(shí)刻1的記憶狀??態(tài)將參與下一個(gè)時(shí)刻的預(yù)測活動(dòng),也就是:??h2=Ux2+?JVs
重構(gòu)并且以誤差最小為目的來進(jìn)行模型的訓(xùn)練,來得到包含句子結(jié)構(gòu)信息的句子向量。假設(shè)句子s由m個(gè)單詞5?=?(^,%,_..,1)的序個(gè)單詞叫由〇1維向量嵌入冰=(+,;^...,&),如3.1小節(jié)所述。遞歸自標(biāo)是基于句子及其相應(yīng)的嵌入將句子映射到d維向量。??先將輸入的所有詞轉(zhuǎn)換成分布式的向量表示每個(gè)詞的是wxl?(其中置為300),整個(gè)模型由一系列自編碼器塊的串聯(lián)組成。在每個(gè)自動(dòng)父節(jié)點(diǎn)pi?(隱藏層)由兩個(gè)子節(jié)點(diǎn)(輸入層)計(jì)算:即句子中兩個(gè)節(jié)點(diǎn)向量pi通過使用以下公式由兩個(gè)子節(jié)點(diǎn)來計(jì)算:??A?=/(R[ci;c2]H)R中為編碼矩陣其維度為wx2w,?^為偏置向量維度為wxl,f為函數(shù)一般采用tanh(〇。編碼形成新的節(jié)點(diǎn)p然后用新的節(jié)點(diǎn)代替原,從而產(chǎn)生新的序列然后再選擇相鄰的詞語依次進(jìn)行編碼,直到將成一個(gè)節(jié)點(diǎn)。??〇?_〇?_0?〇?〇_0??_??
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的文本表示方法[J]. 李楓林,柯佳. 情報(bào)科學(xué). 2019(01)
[2]基于邊界增強(qiáng)的中文直播彈幕新詞發(fā)現(xiàn)[J]. 王雪瑞,劉淵. 傳感器與微系統(tǒng). 2018(07)
[3]基于改進(jìn)的Prefixspan算法的中文文本新詞提取方法研究[J]. 李博涵,蔡永香,鄧舒穎,王督. 電腦知識(shí)與技術(shù). 2018(08)
[4]面向社會(huì)媒體的開放領(lǐng)域新詞發(fā)現(xiàn)[J]. 張華平,商建云. 中文信息學(xué)報(bào). 2017(03)
本文編號(hào):3065725
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【圖文】:
前饋神經(jīng)網(wǎng)絡(luò)
?Xt?Xt-i??圖2-9循環(huán)隱藏層??Figure?2-9?Loop?hidden?layer??圖2-9是隱藏層(HidderLayer)層級(jí)展開圖,t-l,t,t+l表示時(shí)間序列,X是輸??入的樣本&表示樣本在t時(shí)刻的記憶,妒表示上一層記憶輸入的權(quán)重,f;表示此刻??輸入的樣本的權(quán)重,F表示輸出的樣本權(quán)重。在t=l時(shí)刻,一般初始化輸入知=0,??隨機(jī)初始化%?R?F,進(jìn)行下面的公式計(jì)算?_??hl=Uxl+?Ws0?(2-8)??st=m)?(2-9)??〇]?=g(^i)?(2-10)??其中,/、g均為激活函數(shù)/可以為tarLh、relu、sigmoid,而g—般為softmax也??可以是其他。以下時(shí)刻的狀態(tài)時(shí)間就向前推進(jìn),此時(shí)的狀態(tài)A作為時(shí)刻1的記憶狀??態(tài)將參與下一個(gè)時(shí)刻的預(yù)測活動(dòng),也就是:??h2=Ux2+?JVs
重構(gòu)并且以誤差最小為目的來進(jìn)行模型的訓(xùn)練,來得到包含句子結(jié)構(gòu)信息的句子向量。假設(shè)句子s由m個(gè)單詞5?=?(^,%,_..,1)的序個(gè)單詞叫由〇1維向量嵌入冰=(+,;^...,&),如3.1小節(jié)所述。遞歸自標(biāo)是基于句子及其相應(yīng)的嵌入將句子映射到d維向量。??先將輸入的所有詞轉(zhuǎn)換成分布式的向量表示每個(gè)詞的是wxl?(其中置為300),整個(gè)模型由一系列自編碼器塊的串聯(lián)組成。在每個(gè)自動(dòng)父節(jié)點(diǎn)pi?(隱藏層)由兩個(gè)子節(jié)點(diǎn)(輸入層)計(jì)算:即句子中兩個(gè)節(jié)點(diǎn)向量pi通過使用以下公式由兩個(gè)子節(jié)點(diǎn)來計(jì)算:??A?=/(R[ci;c2]H)R中為編碼矩陣其維度為wx2w,?^為偏置向量維度為wxl,f為函數(shù)一般采用tanh(〇。編碼形成新的節(jié)點(diǎn)p然后用新的節(jié)點(diǎn)代替原,從而產(chǎn)生新的序列然后再選擇相鄰的詞語依次進(jìn)行編碼,直到將成一個(gè)節(jié)點(diǎn)。??〇?_〇?_0?〇?〇_0??_??
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的文本表示方法[J]. 李楓林,柯佳. 情報(bào)科學(xué). 2019(01)
[2]基于邊界增強(qiáng)的中文直播彈幕新詞發(fā)現(xiàn)[J]. 王雪瑞,劉淵. 傳感器與微系統(tǒng). 2018(07)
[3]基于改進(jìn)的Prefixspan算法的中文文本新詞提取方法研究[J]. 李博涵,蔡永香,鄧舒穎,王督. 電腦知識(shí)與技術(shù). 2018(08)
[4]面向社會(huì)媒體的開放領(lǐng)域新詞發(fā)現(xiàn)[J]. 張華平,商建云. 中文信息學(xué)報(bào). 2017(03)
本文編號(hào):3065725
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3065725.html
最近更新
教材專著