基于深度學(xué)習(xí)的網(wǎng)頁分類技術(shù)研究
發(fā)布時間:2022-07-12 17:42
隨著計算機技術(shù)的迅猛發(fā)展,互聯(lián)網(wǎng)因其包含的海量信息而越來越多的成為了人們獲取信息的主要場所。也有了更多的人樂于在互聯(lián)網(wǎng)上分享自己的知識,這導(dǎo)致了網(wǎng)頁數(shù)量的爆炸式增長。據(jù)1月31日中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)在京發(fā)布的第41次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》顯示,截止至2017年12月,我國網(wǎng)民數(shù)量已經(jīng)達到了7.72億,占人口總數(shù)的55.8%,超過全球平均水準4.1個百分點,超過亞洲平均水準9.1個百分點。種種現(xiàn)象表明,互聯(lián)網(wǎng)已經(jīng)成為當代人們生活中必不可少的組成部分。而伴隨著互聯(lián)網(wǎng)的飛速發(fā)展,網(wǎng)絡(luò)內(nèi)容得到了極大的豐富。如何將這些海量的信息進行一個合理的篩選,讓人們能快速,有效的找到自己想要的資源成為了一個重要而且有意義的問題。為了應(yīng)對這種問題,人們發(fā)明了搜索引擎,能準確地查找人們所需要的信息,但將所有網(wǎng)頁放在同一集合查找顯然不是明智之舉。調(diào)查顯示,人們在進行信息檢索時往往會圍繞著一個主題。如果能將網(wǎng)頁按頁面類型進行分類將有效的提高信息檢索的效率。將網(wǎng)頁快速、有效的進行分類還能很好的提高搜索引擎對人們發(fā)出的信息檢索請求的響應(yīng)速度。目前在工業(yè)上網(wǎng)頁分類多半是采用人工策略或者傳統(tǒng)機器學(xué)習(xí)...
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 引言
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 網(wǎng)頁分類
1.2.2 基于CNN的文本特征提取
1.3 研究內(nèi)容
1.4 章節(jié)安排
第2章 相關(guān)技術(shù)研究
2.1 網(wǎng)頁分類簡介
2.2 分類算法
2.3 卷積神經(jīng)網(wǎng)絡(luò)
2.3.1 網(wǎng)絡(luò)概述
2.3.2 經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)介紹
2.3.3 損失函數(shù)
2.3.4 梯度下降
2.4 本章小結(jié)
第3章 網(wǎng)頁分類技術(shù)研究
3.1 網(wǎng)頁分類流程
3.2 網(wǎng)頁抓取與結(jié)構(gòu)化
3.3 網(wǎng)頁特征向量轉(zhuǎn)換
3.4 網(wǎng)頁特征提取
3.5 網(wǎng)頁分類
3.6 本章小結(jié)
第4章 實驗結(jié)果
4.1 評估方法
4.1.1 分類標準
4.1.2 評估標準
4.2 評估流程
4.3 結(jié)果對比
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 論文總結(jié)
5.2 工作展望
致謝
參考文獻
【參考文獻】:
期刊論文
[1]第41次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》發(fā)布[J]. 中國廣播. 2018(03)
[2]不同池化模型的卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)性能研究[J]. 劉萬軍,梁雪劍,曲海成. 中國圖象圖形學(xué)報. 2016(09)
[3]深度學(xué)習(xí)的昨天、今天和明天[J]. 余凱,賈磊,陳雨強,徐偉. 計算機研究與發(fā)展. 2013(09)
[4]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計算機應(yīng)用研究. 2012(08)
[5]搜索引擎技術(shù)研究與發(fā)展[J]. 印鑒,陳憶群,張鋼. 計算機工程. 2005(14)
[6]自然語言處理[J]. 陳肇雄,高慶獅. 計算機研究與發(fā)展. 1989(11)
本文編號:3659567
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 引言
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 網(wǎng)頁分類
1.2.2 基于CNN的文本特征提取
1.3 研究內(nèi)容
1.4 章節(jié)安排
第2章 相關(guān)技術(shù)研究
2.1 網(wǎng)頁分類簡介
2.2 分類算法
2.3 卷積神經(jīng)網(wǎng)絡(luò)
2.3.1 網(wǎng)絡(luò)概述
2.3.2 經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)介紹
2.3.3 損失函數(shù)
2.3.4 梯度下降
2.4 本章小結(jié)
第3章 網(wǎng)頁分類技術(shù)研究
3.1 網(wǎng)頁分類流程
3.2 網(wǎng)頁抓取與結(jié)構(gòu)化
3.3 網(wǎng)頁特征向量轉(zhuǎn)換
3.4 網(wǎng)頁特征提取
3.5 網(wǎng)頁分類
3.6 本章小結(jié)
第4章 實驗結(jié)果
4.1 評估方法
4.1.1 分類標準
4.1.2 評估標準
4.2 評估流程
4.3 結(jié)果對比
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 論文總結(jié)
5.2 工作展望
致謝
參考文獻
【參考文獻】:
期刊論文
[1]第41次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》發(fā)布[J]. 中國廣播. 2018(03)
[2]不同池化模型的卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)性能研究[J]. 劉萬軍,梁雪劍,曲海成. 中國圖象圖形學(xué)報. 2016(09)
[3]深度學(xué)習(xí)的昨天、今天和明天[J]. 余凱,賈磊,陳雨強,徐偉. 計算機研究與發(fā)展. 2013(09)
[4]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計算機應(yīng)用研究. 2012(08)
[5]搜索引擎技術(shù)研究與發(fā)展[J]. 印鑒,陳憶群,張鋼. 計算機工程. 2005(14)
[6]自然語言處理[J]. 陳肇雄,高慶獅. 計算機研究與發(fā)展. 1989(11)
本文編號:3659567
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3659567.html
最近更新
教材專著