基于Attention-Based Bi-GRU模型的文本分類方法研究
發(fā)布時(shí)間:2021-02-06 08:29
大數(shù)據(jù)時(shí)代,各種終端設(shè)備產(chǎn)生了大量的文本數(shù)據(jù),文本分類技術(shù)作為智能搜索、智能問(wèn)答等自然語(yǔ)言處理的基礎(chǔ)和關(guān)鍵技術(shù)一直是交叉學(xué)科領(lǐng)域的研究熱點(diǎn)。由于文本是非結(jié)構(gòu)化數(shù)據(jù),利用傳統(tǒng)機(jī)器學(xué)習(xí)方法解決文本分類時(shí)忽略了文本的上下文的語(yǔ)義信息且分類精度不高。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,深度學(xué)習(xí)技術(shù)被證明在提取文本特征和提升分類精度上有諸多優(yōu)勢(shì)。本文在分析研究GRU和Attention機(jī)制的基礎(chǔ)上,對(duì)混合深度學(xué)習(xí)模型解決文本分類問(wèn)題進(jìn)行了深入研究。本文的主要研究工作如下:(1)本文給出了文本分類的數(shù)學(xué)定義并學(xué)習(xí)研究了文本分類的一般過(guò)程,包括文本預(yù)處理,文本表示,分類器設(shè)計(jì)及其性能評(píng)價(jià)。針對(duì)詞向量表示,研究和采用了Word2Vec詞向量表示,使得詞向量表示具有同義詞相似的特征,同時(shí)避免了維度過(guò)高導(dǎo)致的神經(jīng)網(wǎng)絡(luò)難以訓(xùn)練。梳理了若干傳統(tǒng)文本分類方法并指出其具有的缺陷。(2)本文通過(guò)對(duì)GRU和Attention機(jī)制的研究,提出了一種文本分類混合模型——Attention-Based Bi-GRU,其中GRU解決了傳統(tǒng)RNN在對(duì)序列數(shù)據(jù)進(jìn)行編碼時(shí)常常會(huì)面臨長(zhǎng)距離依賴消失的問(wèn)題,Bi-GRU全面考慮了文本的上下文信...
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:51 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
文本分類應(yīng)用場(chǎng)景
文本分類的流程圖
CBOW模型的結(jié)構(gòu)圖示
【參考文獻(xiàn)】:
期刊論文
[1]循環(huán)神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 楊麗,吳雨茜,王俊麗,劉義理. 計(jì)算機(jī)應(yīng)用. 2018(S2)
[2]基于互信息的加權(quán)樸素貝葉斯文本分類算法[J]. 武建軍,李昌兵. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2017(07)
[3]基于極性轉(zhuǎn)移和LSTM遞歸網(wǎng)絡(luò)的情感分析[J]. 梁軍,柴玉梅,原慧斌,高明磊,昝紅英. 中文信息學(xué)報(bào). 2015(05)
[4]基于語(yǔ)義距離的文本分類方法[J]. 張培穎,王雷全. 計(jì)算機(jī)技術(shù)與發(fā)展. 2013(01)
[5]基于自適應(yīng)中文分詞和近似SVM的文本分類算法[J]. 馮永,李華,鐘將,葉春曉. 計(jì)算機(jī)科學(xué). 2010(01)
[6]SVM和K-means結(jié)合的文本分類方法研究[J]. 晉幼麗,周明全,王學(xué)松. 計(jì)算機(jī)技術(shù)與發(fā)展. 2009(11)
[7]使用最大熵模型進(jìn)行中文文本分類[J]. 李榮陸,王建會(huì),陳曉云,陶曉鵬,胡運(yùn)發(fā). 計(jì)算機(jī)研究與發(fā)展. 2005(01)
[8]電子計(jì)算機(jī)與文獻(xiàn)分類[J]. 侯漢清,黃剛. 計(jì)算機(jī)與圖書(shū)館. 1982(01)
碩士論文
[1]基于注意力機(jī)制和改進(jìn)型RNN的Web文本情感分析研究[D]. 王治權(quán).蘭州大學(xué) 2018
[2]基于Attention Bi-LSTM的文本分類方法研究[D]. 王恰.華南理工大學(xué) 2018
[3]基于Attention-Based C-GRU模型的文本分類研究[D]. 楊東.北京交通大學(xué) 2018
[4]基于Attention-Based LSTM模型的文本分類技術(shù)的研究[D]. 張沖.南京大學(xué) 2016
[5]基于深度學(xué)習(xí)混合模型的文本分類研究[D]. 周超.蘭州大學(xué) 2016
[6]中文文本分類的研究與應(yīng)用[D]. 梅君.南昌大學(xué) 2010
本文編號(hào):3020466
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:51 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
文本分類應(yīng)用場(chǎng)景
文本分類的流程圖
CBOW模型的結(jié)構(gòu)圖示
【參考文獻(xiàn)】:
期刊論文
[1]循環(huán)神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 楊麗,吳雨茜,王俊麗,劉義理. 計(jì)算機(jī)應(yīng)用. 2018(S2)
[2]基于互信息的加權(quán)樸素貝葉斯文本分類算法[J]. 武建軍,李昌兵. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2017(07)
[3]基于極性轉(zhuǎn)移和LSTM遞歸網(wǎng)絡(luò)的情感分析[J]. 梁軍,柴玉梅,原慧斌,高明磊,昝紅英. 中文信息學(xué)報(bào). 2015(05)
[4]基于語(yǔ)義距離的文本分類方法[J]. 張培穎,王雷全. 計(jì)算機(jī)技術(shù)與發(fā)展. 2013(01)
[5]基于自適應(yīng)中文分詞和近似SVM的文本分類算法[J]. 馮永,李華,鐘將,葉春曉. 計(jì)算機(jī)科學(xué). 2010(01)
[6]SVM和K-means結(jié)合的文本分類方法研究[J]. 晉幼麗,周明全,王學(xué)松. 計(jì)算機(jī)技術(shù)與發(fā)展. 2009(11)
[7]使用最大熵模型進(jìn)行中文文本分類[J]. 李榮陸,王建會(huì),陳曉云,陶曉鵬,胡運(yùn)發(fā). 計(jì)算機(jī)研究與發(fā)展. 2005(01)
[8]電子計(jì)算機(jī)與文獻(xiàn)分類[J]. 侯漢清,黃剛. 計(jì)算機(jī)與圖書(shū)館. 1982(01)
碩士論文
[1]基于注意力機(jī)制和改進(jìn)型RNN的Web文本情感分析研究[D]. 王治權(quán).蘭州大學(xué) 2018
[2]基于Attention Bi-LSTM的文本分類方法研究[D]. 王恰.華南理工大學(xué) 2018
[3]基于Attention-Based C-GRU模型的文本分類研究[D]. 楊東.北京交通大學(xué) 2018
[4]基于Attention-Based LSTM模型的文本分類技術(shù)的研究[D]. 張沖.南京大學(xué) 2016
[5]基于深度學(xué)習(xí)混合模型的文本分類研究[D]. 周超.蘭州大學(xué) 2016
[6]中文文本分類的研究與應(yīng)用[D]. 梅君.南昌大學(xué) 2010
本文編號(hào):3020466
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3020466.html
最近更新
教材專著