基于BiGRU-CapsNet模型的文本分類研究
發(fā)布時間:2021-02-27 16:05
隨著科學技術(shù)水平不斷提高,互聯(lián)網(wǎng)得到迅速發(fā)展,以互聯(lián)網(wǎng)為紐帶帶動了包括商業(yè)貿(mào)易、服務(wù)業(yè)、娛樂休閑、公益等各個行業(yè)迅速發(fā)展,人們的生活方式、工作方式也產(chǎn)生了巨大的改變。文本作為網(wǎng)絡(luò)信息的主要承載形式,數(shù)據(jù)量飛速增長,涉及的領(lǐng)域也更加廣泛,例如產(chǎn)生了大量電影評論、新聞信息、論壇交流信息、微博評論、商品評論等涉及多個產(chǎn)業(yè)領(lǐng)域的網(wǎng)絡(luò)文本信息。這些文本信息數(shù)據(jù)量巨大,包含豐富的信息。將這些文本進行自動分類后可以了解發(fā)布信息者的真正意圖,有助于經(jīng)濟的發(fā)展、各個行業(yè)帶頭企業(yè)的方向?qū)Ш、政府的決策完善。近年來,深度學習(Deep Learning)作為人工智能領(lǐng)域最重要的進展,在諸多領(lǐng)域都有著驚人的表現(xiàn)。大量研究表明,相比于傳統(tǒng)的機器學習算法,深度學習中的許多網(wǎng)絡(luò)模型都能夠獲得更加出色的性能;贐iGRU模型的文本分類是目前最主流的文本分類方法,在分類效果上有不錯的表現(xiàn)。本文嘗試在BiGRU模型的基礎(chǔ)上,采用更加適合文本分類的深度學習算法進行文本分類模型搭建,主要工作包括以下幾個方面:首先對文本分類的一般流程進行了概述,包括文本預(yù)處理、文本表示、文本特征提取、文本分類訓(xùn)練、文本分類以及性能評估。通過...
【文章來源】:陜西師范大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:53 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本論文的主要研究內(nèi)容及章節(jié)安排
第2章 文本分類流程及原理
2.1 文本預(yù)處理
2.2 文本表示
2.2.1 獨熱編碼表示
2.2.2 分布表示
2.3 特征選擇及特征抽取
2.4 傳統(tǒng)分類算法
2.5 分類性能評估方法
2.6 本章小結(jié)
第3章 BiGRU-CapsNet模型
3.1 從CNN到CapsNet
3.2 從RNN到BiGRU
3.3 BiGRU網(wǎng)絡(luò)與CapsNet網(wǎng)絡(luò)優(yōu)化模型
3.4 本章小結(jié)
第4章 基于BiGRU-CapsNet模型的文本分類
4.1 數(shù)據(jù)預(yù)處理與文本表示過程
4.2 BiGRU-CapsNet模型構(gòu)建
4.2.1 Embedding層
4.2.2 BiGRU-CapsNet層
4.2.3 全連接層
4.3 BiGRU-CapsNet文本分類模型實驗結(jié)果及分析
4.3.1 網(wǎng)絡(luò)梯度算法迭代次數(shù)選擇
4.3.2 模型激活函數(shù)的選擇
4.3.3 截取文本長度的大小
4.3.4 模型分類結(jié)果
4.3.5 BiGRU-CapsNet分類模型在DonorsChoose數(shù)據(jù)集的適用性
4.4 BiGRU-CapsNet模型與BiGRU模型性能對比分析
4.4.1 BiGRU模型的構(gòu)建與訓(xùn)練
4.4.2 BiGRU-CapsNet模型與BiGRU模型文本分類結(jié)果對比分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 本文總結(jié)
5.2 研究展望
參考文獻
致謝
【參考文獻】:
期刊論文
[1]基于決策樹的文本分類研究[J]. 田苗苗. 吉林師范大學學報(自然科學版). 2008(01)
[2]文本分類綜述[J]. 靳小波. 自動化博覽. 2006(S1)
[3]現(xiàn)代貝葉斯分析與現(xiàn)代統(tǒng)計推斷[J]. 劉樂平,袁衛(wèi). 經(jīng)濟理論與經(jīng)濟管理. 2004(06)
博士論文
[1]文本分類及其特征降維研究[D]. 廖一星.浙江大學 2012
碩士論文
[1]基于詞向量的文本分類算法研究與改進[D]. 王明亞.華東師范大學 2016
[2]不規(guī)范英文文本分詞系統(tǒng)的設(shè)計與實現(xiàn)[D]. 韓偉.大連理工大學 2015
[3]基于中文信息檢索的文本預(yù)處理研究[D]. 何金鳳.電子科技大學 2008
本文編號:3054469
【文章來源】:陜西師范大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:53 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本論文的主要研究內(nèi)容及章節(jié)安排
第2章 文本分類流程及原理
2.1 文本預(yù)處理
2.2 文本表示
2.2.1 獨熱編碼表示
2.2.2 分布表示
2.3 特征選擇及特征抽取
2.4 傳統(tǒng)分類算法
2.5 分類性能評估方法
2.6 本章小結(jié)
第3章 BiGRU-CapsNet模型
3.1 從CNN到CapsNet
3.2 從RNN到BiGRU
3.3 BiGRU網(wǎng)絡(luò)與CapsNet網(wǎng)絡(luò)優(yōu)化模型
3.4 本章小結(jié)
第4章 基于BiGRU-CapsNet模型的文本分類
4.1 數(shù)據(jù)預(yù)處理與文本表示過程
4.2 BiGRU-CapsNet模型構(gòu)建
4.2.1 Embedding層
4.2.2 BiGRU-CapsNet層
4.2.3 全連接層
4.3 BiGRU-CapsNet文本分類模型實驗結(jié)果及分析
4.3.1 網(wǎng)絡(luò)梯度算法迭代次數(shù)選擇
4.3.2 模型激活函數(shù)的選擇
4.3.3 截取文本長度的大小
4.3.4 模型分類結(jié)果
4.3.5 BiGRU-CapsNet分類模型在DonorsChoose數(shù)據(jù)集的適用性
4.4 BiGRU-CapsNet模型與BiGRU模型性能對比分析
4.4.1 BiGRU模型的構(gòu)建與訓(xùn)練
4.4.2 BiGRU-CapsNet模型與BiGRU模型文本分類結(jié)果對比分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 本文總結(jié)
5.2 研究展望
參考文獻
致謝
【參考文獻】:
期刊論文
[1]基于決策樹的文本分類研究[J]. 田苗苗. 吉林師范大學學報(自然科學版). 2008(01)
[2]文本分類綜述[J]. 靳小波. 自動化博覽. 2006(S1)
[3]現(xiàn)代貝葉斯分析與現(xiàn)代統(tǒng)計推斷[J]. 劉樂平,袁衛(wèi). 經(jīng)濟理論與經(jīng)濟管理. 2004(06)
博士論文
[1]文本分類及其特征降維研究[D]. 廖一星.浙江大學 2012
碩士論文
[1]基于詞向量的文本分類算法研究與改進[D]. 王明亞.華東師范大學 2016
[2]不規(guī)范英文文本分詞系統(tǒng)的設(shè)計與實現(xiàn)[D]. 韓偉.大連理工大學 2015
[3]基于中文信息檢索的文本預(yù)處理研究[D]. 何金鳳.電子科技大學 2008
本文編號:3054469
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3054469.html
最近更新
教材專著