基于深度學(xué)習(xí)技術(shù)的文本情感分類算法研究
發(fā)布時(shí)間:2021-01-17 15:48
隨著互聯(lián)網(wǎng)技術(shù)以及網(wǎng)絡(luò)平臺(tái)的日益火熱,越來越多的人參與到網(wǎng)絡(luò)信息交互中。如今,大量的文本信息呈井噴式出現(xiàn),人們通過網(wǎng)絡(luò)與社交平臺(tái)來表達(dá)自己的見解。通過挖掘這些文本內(nèi)容,不僅可以了解用戶的喜好,了解社會(huì)的熱點(diǎn)問題,還能得到商品服務(wù)的評(píng)價(jià)信息等因素。因此,文本情感分析無論是從經(jīng)濟(jì)或是政治角度都有其重要性。通過對(duì)這些文本進(jìn)行分析、處理、歸納和推理,我們能夠在網(wǎng)絡(luò)輿情發(fā)現(xiàn)等應(yīng)用方面挖掘到重大的商業(yè)價(jià)值。因此,本文研究了基于深度學(xué)習(xí)技術(shù)的文本情感分類算法,具體內(nèi)容包括以下幾個(gè)方面:首先,實(shí)現(xiàn)了卷積雙向長(zhǎng)短期記憶(CNN-BiLSTM)網(wǎng)絡(luò)模型。該模型結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)能提取高維文本特征和雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(Bi-directional Long Short-Term Memory,BiLSTM)擅長(zhǎng)處理序列式問題的優(yōu)點(diǎn)。本文對(duì)該模型在文本情感分類問題上進(jìn)行了研究。包括設(shè)計(jì)多種規(guī)模的卷積核來提取不同的緯度特征,使用可以保留多個(gè)較強(qiáng)特征的KMax池化層代替僅能保留最強(qiáng)特征的1Max池化層。實(shí)驗(yàn)結(jié)果表明,CNN-BiLSTM-KMa...
【文章來源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
情感分析方法
第1章緒論4其分為篇章級(jí)、句子級(jí)、短語(yǔ)級(jí)和詞語(yǔ)級(jí)。對(duì)文本的處理方法可以分為兩大類。其中一類是按照詞典規(guī)則的方法去分析,另一類是基于機(jī)器學(xué)習(xí)的方法去整理,具體如圖所示。在文本處理的流程中,我們能夠?qū)⑶楦袣w納為:情感信息的獲娶文本的預(yù)處理、情感信息的特征提取以及情感信息的分類或預(yù)測(cè),這幾項(xiàng)任務(wù)級(jí)級(jí)推進(jìn)[1]。如圖1.2所示。圖1.2情感分析處理流程1.2.1基于詞典規(guī)則的方法在基于詞典規(guī)則的研究方法中,將要求我們將需要處理的文本看作集合而不考慮詞語(yǔ)之間的連續(xù)問題,并且與通過我們自己制定的語(yǔ)言規(guī)則和人工標(biāo)注的人工情感詞典進(jìn)行匹配。對(duì)文本段落、單詞、句子進(jìn)行拆解,將詞語(yǔ)與情感詞典進(jìn)行匹配,得到一個(gè)得分,最終按照得分對(duì)文本進(jìn)行情感傾向性分析。而其中的詞性、詞頻,還有詞語(yǔ)強(qiáng)度都會(huì)影響分析效果。在技術(shù)分析里面,構(gòu)建情感詞典的方式有很多種,如基于圖的方法,基于啟發(fā)式的規(guī)則方法,基于詞對(duì)齊模型的方法等[2]。我們從中選擇啟發(fā)式的規(guī)則方法來進(jìn)行探究。該方法通過觀察大量語(yǔ)料總結(jié)出其特性,如找到其存在的一些語(yǔ)法句法、語(yǔ)法規(guī)則,語(yǔ)義特征甚至是語(yǔ)言學(xué)特性,然后再根據(jù)既定的語(yǔ)法規(guī)則、模式對(duì)他的特性進(jìn)行拆解,獲得其語(yǔ)言學(xué)特性。最后判斷被抽取出的情感詞對(duì)其特性是積極的還是消極的;趩l(fā)式規(guī)則的方法雖然有著很強(qiáng)的針對(duì)性并且易于理解和應(yīng)用,但缺點(diǎn)在于一方面要花費(fèi)大量的時(shí)間,另一方面人工定義的規(guī)則靈活性差。當(dāng)在處理一些網(wǎng)絡(luò)非正式文本的過程中,利用語(yǔ)法信息通常會(huì)產(chǎn)生大量的錯(cuò)誤。因此在情感詞抽取的研究中,基于圖傳播的研究方法
第2章相關(guān)研究基礎(chǔ)10第2章相關(guān)研究基礎(chǔ)2.1人工神經(jīng)網(wǎng)絡(luò)人腦的構(gòu)造和思維的運(yùn)行機(jī)理一直是科學(xué)家們致力于探索的課題,億萬個(gè)神經(jīng)元以特殊的形式組合在一起,在處理非確定性問題上有著計(jì)算機(jī)難以比擬的優(yōu)越性。它的提出,是建立在現(xiàn)代神經(jīng)科學(xué)研究的成果之上,試圖通過模擬大腦的處理和記憶方式進(jìn)行研究。應(yīng)運(yùn)而生的人工神經(jīng)網(wǎng)絡(luò)在模仿人類大腦的同時(shí)也顯現(xiàn)出一些明顯的特征:人工神經(jīng)網(wǎng)絡(luò)也想像人腦一樣有自己的智慧,會(huì)思考解決問題的不同種方式,即非線性;人工神經(jīng)網(wǎng)絡(luò)也像人體各個(gè)器官一樣協(xié)同工作,互相作用,而不是單單只依靠一個(gè)器官,人工神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元也是如此,即非局限性;人工神經(jīng)會(huì)自己不斷進(jìn)行組織和學(xué)習(xí),適應(yīng)外界變化,即非常定性;一個(gè)系統(tǒng)能經(jīng)久不衰的秘訣在于不斷進(jìn)化,不斷演變,而不是原地踏步,能夠在一定的條件下不斷演變的特性,即非凸性。研究學(xué)者們借鑒了生物科學(xué)的研究成果,仿生大腦結(jié)構(gòu),提出了人工神經(jīng)網(wǎng)絡(luò),為信息科學(xué)領(lǐng)域帶來了革命性的變化。圖2.1簡(jiǎn)單的人工神經(jīng)網(wǎng)絡(luò)
【參考文獻(xiàn)】:
期刊論文
[1]基于詞向量和CNN的書籍評(píng)論情感分析方法[J]. 李昊璇,張華潔. 測(cè)試技術(shù)學(xué)報(bào). 2019(02)
[2]注意力增強(qiáng)的雙向LSTM情感分析[J]. 關(guān)鵬飛,李寶安,呂學(xué)強(qiáng),周建設(shè). 中文信息學(xué)報(bào). 2019(02)
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的細(xì)粒度情感分析方法[J]. 李慧,柴亞青. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2019(01)
[4]卷積神經(jīng)網(wǎng)絡(luò)下的Twitter文本情感分析[J]. 王煜涵,張春云,趙寶林,襲肖明,耿蕾蕾,崔超然. 數(shù)據(jù)采集與處理. 2018(05)
[5]基于詞注意力卷積神經(jīng)網(wǎng)絡(luò)模型的情感分析研究[J]. 王盛玉,曾碧卿,商齊,韓旭麗. 中文信息學(xué)報(bào). 2018(09)
[6]文本情感分析綜述[J]. 劉爽,趙景秀,楊紅亞,徐冠華. 軟件導(dǎo)刊. 2018(06)
[7]面向自然語(yǔ)言處理的深度學(xué)習(xí)研究[J]. 奚雪峰,周國(guó)棟. 自動(dòng)化學(xué)報(bào). 2016(10)
[8]情感詞典構(gòu)建綜述[J]. 梅莉莉,黃河燕,周新宇,毛先領(lǐng). 中文信息學(xué)報(bào). 2016(05)
[9]基于極性轉(zhuǎn)移和LSTM遞歸網(wǎng)絡(luò)的情感分析[J]. 梁軍,柴玉梅,原慧斌,高明磊,昝紅英. 中文信息學(xué)報(bào). 2015(05)
[10]航空發(fā)動(dòng)機(jī)試車臺(tái)推力校準(zhǔn)系統(tǒng)[J]. 雷利,葉耀祖,馬昌. 工程與試驗(yàn). 2015(03)
碩士論文
[1]基于深度學(xué)習(xí)的微博文本情感分析研究[D]. 宋夢(mèng)姣.南京大學(xué) 2018
本文編號(hào):2983161
【文章來源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
情感分析方法
第1章緒論4其分為篇章級(jí)、句子級(jí)、短語(yǔ)級(jí)和詞語(yǔ)級(jí)。對(duì)文本的處理方法可以分為兩大類。其中一類是按照詞典規(guī)則的方法去分析,另一類是基于機(jī)器學(xué)習(xí)的方法去整理,具體如圖所示。在文本處理的流程中,我們能夠?qū)⑶楦袣w納為:情感信息的獲娶文本的預(yù)處理、情感信息的特征提取以及情感信息的分類或預(yù)測(cè),這幾項(xiàng)任務(wù)級(jí)級(jí)推進(jìn)[1]。如圖1.2所示。圖1.2情感分析處理流程1.2.1基于詞典規(guī)則的方法在基于詞典規(guī)則的研究方法中,將要求我們將需要處理的文本看作集合而不考慮詞語(yǔ)之間的連續(xù)問題,并且與通過我們自己制定的語(yǔ)言規(guī)則和人工標(biāo)注的人工情感詞典進(jìn)行匹配。對(duì)文本段落、單詞、句子進(jìn)行拆解,將詞語(yǔ)與情感詞典進(jìn)行匹配,得到一個(gè)得分,最終按照得分對(duì)文本進(jìn)行情感傾向性分析。而其中的詞性、詞頻,還有詞語(yǔ)強(qiáng)度都會(huì)影響分析效果。在技術(shù)分析里面,構(gòu)建情感詞典的方式有很多種,如基于圖的方法,基于啟發(fā)式的規(guī)則方法,基于詞對(duì)齊模型的方法等[2]。我們從中選擇啟發(fā)式的規(guī)則方法來進(jìn)行探究。該方法通過觀察大量語(yǔ)料總結(jié)出其特性,如找到其存在的一些語(yǔ)法句法、語(yǔ)法規(guī)則,語(yǔ)義特征甚至是語(yǔ)言學(xué)特性,然后再根據(jù)既定的語(yǔ)法規(guī)則、模式對(duì)他的特性進(jìn)行拆解,獲得其語(yǔ)言學(xué)特性。最后判斷被抽取出的情感詞對(duì)其特性是積極的還是消極的;趩l(fā)式規(guī)則的方法雖然有著很強(qiáng)的針對(duì)性并且易于理解和應(yīng)用,但缺點(diǎn)在于一方面要花費(fèi)大量的時(shí)間,另一方面人工定義的規(guī)則靈活性差。當(dāng)在處理一些網(wǎng)絡(luò)非正式文本的過程中,利用語(yǔ)法信息通常會(huì)產(chǎn)生大量的錯(cuò)誤。因此在情感詞抽取的研究中,基于圖傳播的研究方法
第2章相關(guān)研究基礎(chǔ)10第2章相關(guān)研究基礎(chǔ)2.1人工神經(jīng)網(wǎng)絡(luò)人腦的構(gòu)造和思維的運(yùn)行機(jī)理一直是科學(xué)家們致力于探索的課題,億萬個(gè)神經(jīng)元以特殊的形式組合在一起,在處理非確定性問題上有著計(jì)算機(jī)難以比擬的優(yōu)越性。它的提出,是建立在現(xiàn)代神經(jīng)科學(xué)研究的成果之上,試圖通過模擬大腦的處理和記憶方式進(jìn)行研究。應(yīng)運(yùn)而生的人工神經(jīng)網(wǎng)絡(luò)在模仿人類大腦的同時(shí)也顯現(xiàn)出一些明顯的特征:人工神經(jīng)網(wǎng)絡(luò)也想像人腦一樣有自己的智慧,會(huì)思考解決問題的不同種方式,即非線性;人工神經(jīng)網(wǎng)絡(luò)也像人體各個(gè)器官一樣協(xié)同工作,互相作用,而不是單單只依靠一個(gè)器官,人工神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元也是如此,即非局限性;人工神經(jīng)會(huì)自己不斷進(jìn)行組織和學(xué)習(xí),適應(yīng)外界變化,即非常定性;一個(gè)系統(tǒng)能經(jīng)久不衰的秘訣在于不斷進(jìn)化,不斷演變,而不是原地踏步,能夠在一定的條件下不斷演變的特性,即非凸性。研究學(xué)者們借鑒了生物科學(xué)的研究成果,仿生大腦結(jié)構(gòu),提出了人工神經(jīng)網(wǎng)絡(luò),為信息科學(xué)領(lǐng)域帶來了革命性的變化。圖2.1簡(jiǎn)單的人工神經(jīng)網(wǎng)絡(luò)
【參考文獻(xiàn)】:
期刊論文
[1]基于詞向量和CNN的書籍評(píng)論情感分析方法[J]. 李昊璇,張華潔. 測(cè)試技術(shù)學(xué)報(bào). 2019(02)
[2]注意力增強(qiáng)的雙向LSTM情感分析[J]. 關(guān)鵬飛,李寶安,呂學(xué)強(qiáng),周建設(shè). 中文信息學(xué)報(bào). 2019(02)
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的細(xì)粒度情感分析方法[J]. 李慧,柴亞青. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2019(01)
[4]卷積神經(jīng)網(wǎng)絡(luò)下的Twitter文本情感分析[J]. 王煜涵,張春云,趙寶林,襲肖明,耿蕾蕾,崔超然. 數(shù)據(jù)采集與處理. 2018(05)
[5]基于詞注意力卷積神經(jīng)網(wǎng)絡(luò)模型的情感分析研究[J]. 王盛玉,曾碧卿,商齊,韓旭麗. 中文信息學(xué)報(bào). 2018(09)
[6]文本情感分析綜述[J]. 劉爽,趙景秀,楊紅亞,徐冠華. 軟件導(dǎo)刊. 2018(06)
[7]面向自然語(yǔ)言處理的深度學(xué)習(xí)研究[J]. 奚雪峰,周國(guó)棟. 自動(dòng)化學(xué)報(bào). 2016(10)
[8]情感詞典構(gòu)建綜述[J]. 梅莉莉,黃河燕,周新宇,毛先領(lǐng). 中文信息學(xué)報(bào). 2016(05)
[9]基于極性轉(zhuǎn)移和LSTM遞歸網(wǎng)絡(luò)的情感分析[J]. 梁軍,柴玉梅,原慧斌,高明磊,昝紅英. 中文信息學(xué)報(bào). 2015(05)
[10]航空發(fā)動(dòng)機(jī)試車臺(tái)推力校準(zhǔn)系統(tǒng)[J]. 雷利,葉耀祖,馬昌. 工程與試驗(yàn). 2015(03)
碩士論文
[1]基于深度學(xué)習(xí)的微博文本情感分析研究[D]. 宋夢(mèng)姣.南京大學(xué) 2018
本文編號(hào):2983161
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/2983161.html
最近更新
教材專著