基于深度學(xué)習(xí)的新聞文本分類與應(yīng)用
發(fā)布時間:2023-02-12 17:04
新聞文本信息是我們生活中接觸較廣泛的一種文本類信息,也是人們了解社會發(fā)展的重要手段之一。一方面,人們在進(jìn)行新聞文本信息瀏覽,尋找感興趣的新聞類別時,可能會摻雜其他類,用文本分類技術(shù)正確劃分新聞類別,可節(jié)省用戶獲取信息的時間;另一方面,互聯(lián)網(wǎng)公司可對新聞文本進(jìn)行類別的劃分,把不同類別放在不同類別庫,根據(jù)用戶需要進(jìn)行自動化推薦,節(jié)省人力物力,提高效率。深度學(xué)習(xí)方法在自然語言處理領(lǐng)域的應(yīng)用越來越廣泛。本文利用深度學(xué)習(xí)的強(qiáng)大優(yōu)勢,將其應(yīng)用在新聞文本分類領(lǐng)域,具體內(nèi)容包括:(1)梳理了文本分類的基本流程,分析比較常用的文本分類算法,包括傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法。(2)針對傳統(tǒng)機(jī)器學(xué)習(xí)算法特征工程繁瑣的問題,包括文本預(yù)處理,文本表示,特征選擇等步驟,這極大地增加了分類的工作量;本文提出了基于注意力機(jī)制的Text CNN深度學(xué)習(xí)模型。首先,選取Text CNN作為基礎(chǔ)分類模型。然后,卷積層使用多尺度卷積核,池化層使用2-max pooling代替max pooling,同時增加平均池化。最后,在池化層后加入注意力機(jī)制,對2-max pooling和平均池化這兩種池化得到的深層特征文本進(jìn)行特征精煉,...
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 文本分類研究現(xiàn)狀
1.2.2 深度學(xué)習(xí)研究現(xiàn)狀
1.3 研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
1.5 本章小結(jié)
2 相關(guān)技術(shù)介紹
2.1 文本分類關(guān)鍵技術(shù)
2.1.1 文本預(yù)處理
2.1.2 文本表示
2.1.3 特征選擇
2.1.4 分類算法
2.2 深度學(xué)習(xí)關(guān)鍵技術(shù)
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.3 評價標(biāo)準(zhǔn)
2.2.4 深度學(xué)習(xí)框架
2.3 本章小結(jié)
3 基于注意力機(jī)制的CNN新聞文本分類模型
3.1 基于注意力機(jī)制的CNN新聞文本分類模型
3.1.1 注意力機(jī)制
3.1.2 算法框架
3.2 實驗與分析
3.2.1 實驗環(huán)境與數(shù)據(jù)集
3.2.2 實驗設(shè)計及實現(xiàn)
3.2.3 實驗結(jié)果及分析
3.3 本章小結(jié)
4 融合Attention-Text CNN和LSTM的新聞文本分類模型
4.1 融合Attention-Text CNN和LSTM的新聞文本分類模型
4.1.1 模型融合
4.1.2 算法框架
4.2 實驗與分析
4.2.1 實驗環(huán)境與數(shù)據(jù)集
4.2.2 實驗設(shè)計及實現(xiàn)
4.2.3 實驗結(jié)果及分析
4.3 本章小結(jié)
5 新聞文本分類系統(tǒng)設(shè)計與實現(xiàn)
5.1 需求分析
5.2 概要設(shè)計
5.3 詳細(xì)設(shè)計
5.3.1 爬蟲模塊
5.3.2 文件上傳模塊
5.3.3 分類模塊
5.4 新聞文本分類系統(tǒng)實現(xiàn)
5.4.1 系統(tǒng)開發(fā)環(huán)境
5.4.2 爬蟲模塊實現(xiàn)
5.4.3 文件上傳模塊實現(xiàn)
5.4.4 分類模塊實現(xiàn)
5.5 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
本文編號:3741481
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 文本分類研究現(xiàn)狀
1.2.2 深度學(xué)習(xí)研究現(xiàn)狀
1.3 研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
1.5 本章小結(jié)
2 相關(guān)技術(shù)介紹
2.1 文本分類關(guān)鍵技術(shù)
2.1.1 文本預(yù)處理
2.1.2 文本表示
2.1.3 特征選擇
2.1.4 分類算法
2.2 深度學(xué)習(xí)關(guān)鍵技術(shù)
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.3 評價標(biāo)準(zhǔn)
2.2.4 深度學(xué)習(xí)框架
2.3 本章小結(jié)
3 基于注意力機(jī)制的CNN新聞文本分類模型
3.1 基于注意力機(jī)制的CNN新聞文本分類模型
3.1.1 注意力機(jī)制
3.1.2 算法框架
3.2 實驗與分析
3.2.1 實驗環(huán)境與數(shù)據(jù)集
3.2.2 實驗設(shè)計及實現(xiàn)
3.2.3 實驗結(jié)果及分析
3.3 本章小結(jié)
4 融合Attention-Text CNN和LSTM的新聞文本分類模型
4.1 融合Attention-Text CNN和LSTM的新聞文本分類模型
4.1.1 模型融合
4.1.2 算法框架
4.2 實驗與分析
4.2.1 實驗環(huán)境與數(shù)據(jù)集
4.2.2 實驗設(shè)計及實現(xiàn)
4.2.3 實驗結(jié)果及分析
4.3 本章小結(jié)
5 新聞文本分類系統(tǒng)設(shè)計與實現(xiàn)
5.1 需求分析
5.2 概要設(shè)計
5.3 詳細(xì)設(shè)計
5.3.1 爬蟲模塊
5.3.2 文件上傳模塊
5.3.3 分類模塊
5.4 新聞文本分類系統(tǒng)實現(xiàn)
5.4.1 系統(tǒng)開發(fā)環(huán)境
5.4.2 爬蟲模塊實現(xiàn)
5.4.3 文件上傳模塊實現(xiàn)
5.4.4 分類模塊實現(xiàn)
5.5 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
本文編號:3741481
本文鏈接:http://sikaile.net/xinwenchuanbolunwen/3741481.html
最近更新
教材專著