深度學習與SVM相融合的新聞分類技術研究
發(fā)布時間:2022-10-20 18:55
隨著信息處理技術和網(wǎng)絡傳輸技術的急速發(fā)展,進入了信息爆炸的空前時代,人們急切的想通過互聯(lián)網(wǎng)獲得世界各地的最新新聞資訊,但每個人關注新聞的時間有限,無法快速的從雜亂的新聞消息中獲得自己想看,關心的內(nèi)容。新聞分類是一項對新聞進行分門別類的技術,能夠按照新聞內(nèi)容的領域、涵蓋范圍、種類等劃分方式,將新產(chǎn)生的新聞進行自動化歸類。用戶可根據(jù)新聞類目快速找到自己所需要的資訊內(nèi)容。新聞分類屬于一種監(jiān)督性的機器學習技術,算法需要根據(jù)已經(jīng)標注好正確類別的新聞內(nèi)容進行模型訓練,再用模型對未知類別的新聞進行自動化分類。文章根據(jù)新聞類目標注需求設計了一個新聞標注系統(tǒng),采用眾籌的思想,讓各個類別領域的人員參與新聞類別標注,為了保證標注質(zhì)量,設計了一套標注規(guī)范及標注效果驗證方法。根據(jù)新聞內(nèi)容特點,文章對傳統(tǒng)文本分類算法進行研究,綜合分析算法原理及應用范圍,選擇了適合新聞分類的SVM算法。以SVM算法為基礎,設計了一個基于SVM的新聞自動分類架構(gòu),并對架構(gòu)中每個模塊的設計思想進行了詳細的介紹。針對SVM分類算法特點,對算法模型指標進行改進,將算法計算需要的特征進行關鍵特征選擇操作,不斷對特征抽取進行迭代運算,選取對分...
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
引言
第1章 緒論
1.1 課題的研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文主要研究內(nèi)容
1.4 論文的組織結(jié)構(gòu)
第2章 分類系統(tǒng)基本原理及算法
2.1 分類系統(tǒng)介紹
2.2 常用的文本分類算法
2.3 深度學習分類算法
2.4 TensorFlow和Sk-learn
2.5 本章小結(jié)
第3章 基于SVM算法的分類系統(tǒng)設計
3.1 分類系統(tǒng)架構(gòu)設計
3.2 數(shù)據(jù)收集和存儲模塊
3.2.1 新聞類目確認
3.2.2 新聞類別標注
3.2.3 新聞內(nèi)容獲取
3.2.4 新聞內(nèi)容存儲
3.3 數(shù)據(jù)分析和處理模塊
3.3.1 語料預處理
3.3.2 特征選擇
3.3.3 文本向量表示
3.3.4 歸一化處理
3.4 分類模塊
3.5 本章小結(jié)
第4章 融合深度學習特征的分類研究
4.1 深度卷積網(wǎng)絡構(gòu)建
4.2 數(shù)據(jù)收集和存儲模塊
4.3 TensorFlow實現(xiàn)圖片卷積特征提取
4.4 特征融合及模型訓練
4.5 本章小結(jié)
第5章 實驗設計與結(jié)果分析
5.1 實驗設計
5.2 算法性能評測指標
5.3 實驗環(huán)境
5.4 實驗結(jié)果及分析
5.5 本章小結(jié)
結(jié)論
參考文獻
致謝
導師簡介
作者簡介
學位論文數(shù)據(jù)集
【參考文獻】:
期刊論文
[1]一種新聞網(wǎng)頁關鍵信息的提取算法[J]. 向菁菁,耿光剛,李曉東. 計算機應用. 2016(08)
[2]基于事件要素加權(quán)的新聞摘要提取方法[J]. 郭艷卿,趙銳,孔祥維,付海燕,蔣金平. 計算機科學. 2016(01)
[3]Framework Construction and Application for Global Health Information Platform[J]. ZHOU Jing,Lü Chaozhen,JI Donghong,LIANG Xiaohui. Wuhan University Journal of Natural Sciences. 2015(02)
[4]深度學習的研究與發(fā)展[J]. 張建明,詹智財,成科揚,詹永照. 江蘇大學學報(自然科學版). 2015(02)
[5]深度學習研究進展[J]. 劉建偉,劉媛,羅雄麟. 計算機應用研究. 2014(07)
[6]Deep Learning算法分析和模型改進[J]. 魯向擁,陳悅,張瞳,葛貝. 計算機光盤軟件與應用. 2014(06)
[7]“新聞是新近信息的媒介互動”——試論新媒體傳播背景下“新聞”的定義[J]. 陳響園. 編輯之友. 2013(11)
[8]基于LDA主題模型的短文本分類方法[J]. 張志飛,苗奪謙,高燦. 計算機應用. 2013(06)
[9]KNN分類算法改進研究進展[J]. 奉國和,吳敬學. 圖書情報工作. 2012(21)
[10]深度學習研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計算機應用研究. 2012(08)
博士論文
[1]文本分類中文本表示模型和特征選擇算法研究[D]. 楊杰明.吉林大學 2013
碩士論文
[1]基于詞向量的短文本分類方法研究[D]. 江大鵬.浙江大學 2015
[2]基于Deep Learning的領域概念抽取方法研究[D]. 洪俊.華東師范大學 2014
[3]基于卷積神經(jīng)網(wǎng)絡的深度學習算法與應用研究[D]. 陳先昌.浙江工商大學 2014
[4]文本分類特征選擇與分類算法的改進[D]. 鄭俊飛.西安電子科技大學 2012
[5]KNN文本分類中特征詞權(quán)重算法的研究[D]. 趙小華.太原理工大學 2010
[6]中文分詞關鍵技術研究[D]. 曹衛(wèi)峰.南京理工大學 2009
[7]中文文本分類技術研究[D]. 旺建華.吉林大學 2007
本文編號:3695119
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
引言
第1章 緒論
1.1 課題的研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文主要研究內(nèi)容
1.4 論文的組織結(jié)構(gòu)
第2章 分類系統(tǒng)基本原理及算法
2.1 分類系統(tǒng)介紹
2.2 常用的文本分類算法
2.3 深度學習分類算法
2.4 TensorFlow和Sk-learn
2.5 本章小結(jié)
第3章 基于SVM算法的分類系統(tǒng)設計
3.1 分類系統(tǒng)架構(gòu)設計
3.2 數(shù)據(jù)收集和存儲模塊
3.2.1 新聞類目確認
3.2.2 新聞類別標注
3.2.3 新聞內(nèi)容獲取
3.2.4 新聞內(nèi)容存儲
3.3 數(shù)據(jù)分析和處理模塊
3.3.1 語料預處理
3.3.2 特征選擇
3.3.3 文本向量表示
3.3.4 歸一化處理
3.4 分類模塊
3.5 本章小結(jié)
第4章 融合深度學習特征的分類研究
4.1 深度卷積網(wǎng)絡構(gòu)建
4.2 數(shù)據(jù)收集和存儲模塊
4.3 TensorFlow實現(xiàn)圖片卷積特征提取
4.4 特征融合及模型訓練
4.5 本章小結(jié)
第5章 實驗設計與結(jié)果分析
5.1 實驗設計
5.2 算法性能評測指標
5.3 實驗環(huán)境
5.4 實驗結(jié)果及分析
5.5 本章小結(jié)
結(jié)論
參考文獻
致謝
導師簡介
作者簡介
學位論文數(shù)據(jù)集
【參考文獻】:
期刊論文
[1]一種新聞網(wǎng)頁關鍵信息的提取算法[J]. 向菁菁,耿光剛,李曉東. 計算機應用. 2016(08)
[2]基于事件要素加權(quán)的新聞摘要提取方法[J]. 郭艷卿,趙銳,孔祥維,付海燕,蔣金平. 計算機科學. 2016(01)
[3]Framework Construction and Application for Global Health Information Platform[J]. ZHOU Jing,Lü Chaozhen,JI Donghong,LIANG Xiaohui. Wuhan University Journal of Natural Sciences. 2015(02)
[4]深度學習的研究與發(fā)展[J]. 張建明,詹智財,成科揚,詹永照. 江蘇大學學報(自然科學版). 2015(02)
[5]深度學習研究進展[J]. 劉建偉,劉媛,羅雄麟. 計算機應用研究. 2014(07)
[6]Deep Learning算法分析和模型改進[J]. 魯向擁,陳悅,張瞳,葛貝. 計算機光盤軟件與應用. 2014(06)
[7]“新聞是新近信息的媒介互動”——試論新媒體傳播背景下“新聞”的定義[J]. 陳響園. 編輯之友. 2013(11)
[8]基于LDA主題模型的短文本分類方法[J]. 張志飛,苗奪謙,高燦. 計算機應用. 2013(06)
[9]KNN分類算法改進研究進展[J]. 奉國和,吳敬學. 圖書情報工作. 2012(21)
[10]深度學習研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計算機應用研究. 2012(08)
博士論文
[1]文本分類中文本表示模型和特征選擇算法研究[D]. 楊杰明.吉林大學 2013
碩士論文
[1]基于詞向量的短文本分類方法研究[D]. 江大鵬.浙江大學 2015
[2]基于Deep Learning的領域概念抽取方法研究[D]. 洪俊.華東師范大學 2014
[3]基于卷積神經(jīng)網(wǎng)絡的深度學習算法與應用研究[D]. 陳先昌.浙江工商大學 2014
[4]文本分類特征選擇與分類算法的改進[D]. 鄭俊飛.西安電子科技大學 2012
[5]KNN文本分類中特征詞權(quán)重算法的研究[D]. 趙小華.太原理工大學 2010
[6]中文分詞關鍵技術研究[D]. 曹衛(wèi)峰.南京理工大學 2009
[7]中文文本分類技術研究[D]. 旺建華.吉林大學 2007
本文編號:3695119
本文鏈接:http://sikaile.net/xinwenchuanbolunwen/3695119.html