基于深度學(xué)習(xí)的中文文本分類算法研究
發(fā)布時間:2023-09-17 07:36
文本分類是一個典型且基礎(chǔ)性較強(qiáng)的研究領(lǐng)域。傳統(tǒng)方法是將文本分門別類后依靠人工手段獲取特征信息,深度學(xué)習(xí)方法是將特征提取和分類融為一體,已取代了傳統(tǒng)方法,可自動獲取特征信息,特別是在數(shù)據(jù)挖掘、自然語言處理、計算機(jī)視覺等方面應(yīng)用廣泛。新聞文本分類是自然語言處理中不可替代的技術(shù),新聞是人們獲取最新消息、了解時事信息的最佳手段,使用高效的方法實(shí)現(xiàn)新聞文本分類具有重大意義及價值。本文深刻分析了傳統(tǒng)文本分類方法存在的劣勢,著重研究深度學(xué)習(xí)方法中的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)在新聞文本分類中的應(yīng)用。論文完成的主要內(nèi)容如下:(1)針對文本分類中TCNN模型不能充分獲取文本局部特征和關(guān)鍵詞信息,RCNN模型不能充分提取文本上下文特征信息的問題,論文提出了TC-AM模型和GCNN模型文本分類算法。TC-AM模型使用三層卷積池化操作獲取文本局部特征,引入雙通道注意力機(jī)制(DAM)使得文本表示的特征更具代表性,給文本信息分配相應(yīng)的權(quán)重,獲取關(guān)鍵詞信息。GCNN模型采用雙通道前后向雙向門...
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文主要工作
1.4 本文組織結(jié)構(gòu)
2 相關(guān)理論與技術(shù)
2.1 文本分類基礎(chǔ)理論
2.1.1 文本預(yù)處理
2.1.2 文本表示
2.1.3 分類模型
2.2 深度學(xué)習(xí)方法
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.3 注意力機(jī)制
2.3 開發(fā)平臺
2.3.1 Scikit-Learn庫
2.3.2 Tensorflow與 Keras庫
2.4 本章小結(jié)
3 基于改進(jìn)深度學(xué)習(xí)模型的文本分類算法
3.1 TCNN模型的改進(jìn)
3.1.1 TC-AM模型設(shè)計
3.1.2 TC-AM算法描述
3.1.3 TC-AM處理過程
3.2 實(shí)驗與分析
3.2.1 實(shí)驗環(huán)境與數(shù)據(jù)
3.2.2 實(shí)驗內(nèi)容與評價指標(biāo)
3.2.3 實(shí)驗參數(shù)設(shè)置
3.2.4 實(shí)驗結(jié)果與分析
3.3 RCNN模型的改進(jìn)
3.3.1 GCNN模型設(shè)計
3.3.2 GCNN算法描述
3.3.3 GCNN處理過程
3.4 實(shí)驗與分析
3.4.1 實(shí)驗環(huán)境與數(shù)據(jù)
3.4.2 實(shí)驗內(nèi)容與評價指標(biāo)
3.4.3 實(shí)驗參數(shù)設(shè)置
3.4.4 實(shí)驗結(jié)果與分析
3.5 本章小結(jié)
4 基于深度學(xué)習(xí)融合模型的文本分類算法
4.1 融合模型概念
4.1.1 融合模型方法
4.1.2 融合模型示例
4.2 TGC-AM融合模型基本思想
4.2.1 TGC-AM串聯(lián)設(shè)計
4.2.2 TGC-AM改進(jìn)策略
4.3 TGC-AM融合模型設(shè)計
4.3.1 TGC-AM模型構(gòu)建
4.3.2 TGC-AM算法描述
4.3.3 TGC-AM處理過程
4.4 實(shí)驗與分析
4.4.1 實(shí)驗環(huán)境與數(shù)據(jù)
4.4.2 實(shí)驗參數(shù)設(shè)置
4.4.3 實(shí)驗內(nèi)容與評價指標(biāo)
4.4.4 實(shí)驗結(jié)果與分析
4.5 本章小結(jié)
5 總結(jié)與展望
5.1 總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
附錄
本文編號:3847291
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文主要工作
1.4 本文組織結(jié)構(gòu)
2 相關(guān)理論與技術(shù)
2.1 文本分類基礎(chǔ)理論
2.1.1 文本預(yù)處理
2.1.2 文本表示
2.1.3 分類模型
2.2 深度學(xué)習(xí)方法
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.3 注意力機(jī)制
2.3 開發(fā)平臺
2.3.1 Scikit-Learn庫
2.3.2 Tensorflow與 Keras庫
2.4 本章小結(jié)
3 基于改進(jìn)深度學(xué)習(xí)模型的文本分類算法
3.1 TCNN模型的改進(jìn)
3.1.1 TC-AM模型設(shè)計
3.1.2 TC-AM算法描述
3.1.3 TC-AM處理過程
3.2 實(shí)驗與分析
3.2.1 實(shí)驗環(huán)境與數(shù)據(jù)
3.2.2 實(shí)驗內(nèi)容與評價指標(biāo)
3.2.3 實(shí)驗參數(shù)設(shè)置
3.2.4 實(shí)驗結(jié)果與分析
3.3 RCNN模型的改進(jìn)
3.3.1 GCNN模型設(shè)計
3.3.2 GCNN算法描述
3.3.3 GCNN處理過程
3.4 實(shí)驗與分析
3.4.1 實(shí)驗環(huán)境與數(shù)據(jù)
3.4.2 實(shí)驗內(nèi)容與評價指標(biāo)
3.4.3 實(shí)驗參數(shù)設(shè)置
3.4.4 實(shí)驗結(jié)果與分析
3.5 本章小結(jié)
4 基于深度學(xué)習(xí)融合模型的文本分類算法
4.1 融合模型概念
4.1.1 融合模型方法
4.1.2 融合模型示例
4.2 TGC-AM融合模型基本思想
4.2.1 TGC-AM串聯(lián)設(shè)計
4.2.2 TGC-AM改進(jìn)策略
4.3 TGC-AM融合模型設(shè)計
4.3.1 TGC-AM模型構(gòu)建
4.3.2 TGC-AM算法描述
4.3.3 TGC-AM處理過程
4.4 實(shí)驗與分析
4.4.1 實(shí)驗環(huán)境與數(shù)據(jù)
4.4.2 實(shí)驗參數(shù)設(shè)置
4.4.3 實(shí)驗內(nèi)容與評價指標(biāo)
4.4.4 實(shí)驗結(jié)果與分析
4.5 本章小結(jié)
5 總結(jié)與展望
5.1 總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
附錄
本文編號:3847291
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3847291.html
最近更新
教材專著