深度學(xué)習(xí)與SVM相融合的新聞分類技術(shù)研究
發(fā)布時間:2022-10-20 18:55
隨著信息處理技術(shù)和網(wǎng)絡(luò)傳輸技術(shù)的急速發(fā)展,進(jìn)入了信息爆炸的空前時代,人們急切的想通過互聯(lián)網(wǎng)獲得世界各地的最新新聞資訊,但每個人關(guān)注新聞的時間有限,無法快速的從雜亂的新聞消息中獲得自己想看,關(guān)心的內(nèi)容。新聞分類是一項對新聞進(jìn)行分門別類的技術(shù),能夠按照新聞內(nèi)容的領(lǐng)域、涵蓋范圍、種類等劃分方式,將新產(chǎn)生的新聞進(jìn)行自動化歸類。用戶可根據(jù)新聞類目快速找到自己所需要的資訊內(nèi)容。新聞分類屬于一種監(jiān)督性的機(jī)器學(xué)習(xí)技術(shù),算法需要根據(jù)已經(jīng)標(biāo)注好正確類別的新聞內(nèi)容進(jìn)行模型訓(xùn)練,再用模型對未知類別的新聞進(jìn)行自動化分類。文章根據(jù)新聞類目標(biāo)注需求設(shè)計了一個新聞標(biāo)注系統(tǒng),采用眾籌的思想,讓各個類別領(lǐng)域的人員參與新聞類別標(biāo)注,為了保證標(biāo)注質(zhì)量,設(shè)計了一套標(biāo)注規(guī)范及標(biāo)注效果驗證方法。根據(jù)新聞內(nèi)容特點,文章對傳統(tǒng)文本分類算法進(jìn)行研究,綜合分析算法原理及應(yīng)用范圍,選擇了適合新聞分類的SVM算法。以SVM算法為基礎(chǔ),設(shè)計了一個基于SVM的新聞自動分類架構(gòu),并對架構(gòu)中每個模塊的設(shè)計思想進(jìn)行了詳細(xì)的介紹。針對SVM分類算法特點,對算法模型指標(biāo)進(jìn)行改進(jìn),將算法計算需要的特征進(jìn)行關(guān)鍵特征選擇操作,不斷對特征抽取進(jìn)行迭代運算,選取對分...
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
引言
第1章 緒論
1.1 課題的研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文主要研究內(nèi)容
1.4 論文的組織結(jié)構(gòu)
第2章 分類系統(tǒng)基本原理及算法
2.1 分類系統(tǒng)介紹
2.2 常用的文本分類算法
2.3 深度學(xué)習(xí)分類算法
2.4 TensorFlow和Sk-learn
2.5 本章小結(jié)
第3章 基于SVM算法的分類系統(tǒng)設(shè)計
3.1 分類系統(tǒng)架構(gòu)設(shè)計
3.2 數(shù)據(jù)收集和存儲模塊
3.2.1 新聞類目確認(rèn)
3.2.2 新聞類別標(biāo)注
3.2.3 新聞內(nèi)容獲取
3.2.4 新聞內(nèi)容存儲
3.3 數(shù)據(jù)分析和處理模塊
3.3.1 語料預(yù)處理
3.3.2 特征選擇
3.3.3 文本向量表示
3.3.4 歸一化處理
3.4 分類模塊
3.5 本章小結(jié)
第4章 融合深度學(xué)習(xí)特征的分類研究
4.1 深度卷積網(wǎng)絡(luò)構(gòu)建
4.2 數(shù)據(jù)收集和存儲模塊
4.3 TensorFlow實現(xiàn)圖片卷積特征提取
4.4 特征融合及模型訓(xùn)練
4.5 本章小結(jié)
第5章 實驗設(shè)計與結(jié)果分析
5.1 實驗設(shè)計
5.2 算法性能評測指標(biāo)
5.3 實驗環(huán)境
5.4 實驗結(jié)果及分析
5.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
導(dǎo)師簡介
作者簡介
學(xué)位論文數(shù)據(jù)集
【參考文獻(xiàn)】:
期刊論文
[1]一種新聞網(wǎng)頁關(guān)鍵信息的提取算法[J]. 向菁菁,耿光剛,李曉東. 計算機(jī)應(yīng)用. 2016(08)
[2]基于事件要素加權(quán)的新聞?wù)崛》椒╗J]. 郭艷卿,趙銳,孔祥維,付海燕,蔣金平. 計算機(jī)科學(xué). 2016(01)
[3]Framework Construction and Application for Global Health Information Platform[J]. ZHOU Jing,Lü Chaozhen,JI Donghong,LIANG Xiaohui. Wuhan University Journal of Natural Sciences. 2015(02)
[4]深度學(xué)習(xí)的研究與發(fā)展[J]. 張建明,詹智財,成科揚,詹永照. 江蘇大學(xué)學(xué)報(自然科學(xué)版). 2015(02)
[5]深度學(xué)習(xí)研究進(jìn)展[J]. 劉建偉,劉媛,羅雄麟. 計算機(jī)應(yīng)用研究. 2014(07)
[6]Deep Learning算法分析和模型改進(jìn)[J]. 魯向擁,陳悅,張瞳,葛貝. 計算機(jī)光盤軟件與應(yīng)用. 2014(06)
[7]“新聞是新近信息的媒介互動”——試論新媒體傳播背景下“新聞”的定義[J]. 陳響園. 編輯之友. 2013(11)
[8]基于LDA主題模型的短文本分類方法[J]. 張志飛,苗奪謙,高燦. 計算機(jī)應(yīng)用. 2013(06)
[9]KNN分類算法改進(jìn)研究進(jìn)展[J]. 奉國和,吳敬學(xué). 圖書情報工作. 2012(21)
[10]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計算機(jī)應(yīng)用研究. 2012(08)
博士論文
[1]文本分類中文本表示模型和特征選擇算法研究[D]. 楊杰明.吉林大學(xué) 2013
碩士論文
[1]基于詞向量的短文本分類方法研究[D]. 江大鵬.浙江大學(xué) 2015
[2]基于Deep Learning的領(lǐng)域概念抽取方法研究[D]. 洪俊.華東師范大學(xué) 2014
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法與應(yīng)用研究[D]. 陳先昌.浙江工商大學(xué) 2014
[4]文本分類特征選擇與分類算法的改進(jìn)[D]. 鄭俊飛.西安電子科技大學(xué) 2012
[5]KNN文本分類中特征詞權(quán)重算法的研究[D]. 趙小華.太原理工大學(xué) 2010
[6]中文分詞關(guān)鍵技術(shù)研究[D]. 曹衛(wèi)峰.南京理工大學(xué) 2009
[7]中文文本分類技術(shù)研究[D]. 旺建華.吉林大學(xué) 2007
本文編號:3695119
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
引言
第1章 緒論
1.1 課題的研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文主要研究內(nèi)容
1.4 論文的組織結(jié)構(gòu)
第2章 分類系統(tǒng)基本原理及算法
2.1 分類系統(tǒng)介紹
2.2 常用的文本分類算法
2.3 深度學(xué)習(xí)分類算法
2.4 TensorFlow和Sk-learn
2.5 本章小結(jié)
第3章 基于SVM算法的分類系統(tǒng)設(shè)計
3.1 分類系統(tǒng)架構(gòu)設(shè)計
3.2 數(shù)據(jù)收集和存儲模塊
3.2.1 新聞類目確認(rèn)
3.2.2 新聞類別標(biāo)注
3.2.3 新聞內(nèi)容獲取
3.2.4 新聞內(nèi)容存儲
3.3 數(shù)據(jù)分析和處理模塊
3.3.1 語料預(yù)處理
3.3.2 特征選擇
3.3.3 文本向量表示
3.3.4 歸一化處理
3.4 分類模塊
3.5 本章小結(jié)
第4章 融合深度學(xué)習(xí)特征的分類研究
4.1 深度卷積網(wǎng)絡(luò)構(gòu)建
4.2 數(shù)據(jù)收集和存儲模塊
4.3 TensorFlow實現(xiàn)圖片卷積特征提取
4.4 特征融合及模型訓(xùn)練
4.5 本章小結(jié)
第5章 實驗設(shè)計與結(jié)果分析
5.1 實驗設(shè)計
5.2 算法性能評測指標(biāo)
5.3 實驗環(huán)境
5.4 實驗結(jié)果及分析
5.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
導(dǎo)師簡介
作者簡介
學(xué)位論文數(shù)據(jù)集
【參考文獻(xiàn)】:
期刊論文
[1]一種新聞網(wǎng)頁關(guān)鍵信息的提取算法[J]. 向菁菁,耿光剛,李曉東. 計算機(jī)應(yīng)用. 2016(08)
[2]基于事件要素加權(quán)的新聞?wù)崛》椒╗J]. 郭艷卿,趙銳,孔祥維,付海燕,蔣金平. 計算機(jī)科學(xué). 2016(01)
[3]Framework Construction and Application for Global Health Information Platform[J]. ZHOU Jing,Lü Chaozhen,JI Donghong,LIANG Xiaohui. Wuhan University Journal of Natural Sciences. 2015(02)
[4]深度學(xué)習(xí)的研究與發(fā)展[J]. 張建明,詹智財,成科揚,詹永照. 江蘇大學(xué)學(xué)報(自然科學(xué)版). 2015(02)
[5]深度學(xué)習(xí)研究進(jìn)展[J]. 劉建偉,劉媛,羅雄麟. 計算機(jī)應(yīng)用研究. 2014(07)
[6]Deep Learning算法分析和模型改進(jìn)[J]. 魯向擁,陳悅,張瞳,葛貝. 計算機(jī)光盤軟件與應(yīng)用. 2014(06)
[7]“新聞是新近信息的媒介互動”——試論新媒體傳播背景下“新聞”的定義[J]. 陳響園. 編輯之友. 2013(11)
[8]基于LDA主題模型的短文本分類方法[J]. 張志飛,苗奪謙,高燦. 計算機(jī)應(yīng)用. 2013(06)
[9]KNN分類算法改進(jìn)研究進(jìn)展[J]. 奉國和,吳敬學(xué). 圖書情報工作. 2012(21)
[10]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計算機(jī)應(yīng)用研究. 2012(08)
博士論文
[1]文本分類中文本表示模型和特征選擇算法研究[D]. 楊杰明.吉林大學(xué) 2013
碩士論文
[1]基于詞向量的短文本分類方法研究[D]. 江大鵬.浙江大學(xué) 2015
[2]基于Deep Learning的領(lǐng)域概念抽取方法研究[D]. 洪俊.華東師范大學(xué) 2014
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法與應(yīng)用研究[D]. 陳先昌.浙江工商大學(xué) 2014
[4]文本分類特征選擇與分類算法的改進(jìn)[D]. 鄭俊飛.西安電子科技大學(xué) 2012
[5]KNN文本分類中特征詞權(quán)重算法的研究[D]. 趙小華.太原理工大學(xué) 2010
[6]中文分詞關(guān)鍵技術(shù)研究[D]. 曹衛(wèi)峰.南京理工大學(xué) 2009
[7]中文文本分類技術(shù)研究[D]. 旺建華.吉林大學(xué) 2007
本文編號:3695119
本文鏈接:http://sikaile.net/xinwenchuanbolunwen/3695119.html
最近更新
教材專著