網(wǎng)頁(yè)內(nèi)容分級(jí)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
本文關(guān)鍵詞:網(wǎng)頁(yè)內(nèi)容分級(jí)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)在社會(huì)各個(gè)領(lǐng)域的普及和應(yīng)用,互聯(lián)網(wǎng)已經(jīng)成為人類社會(huì)不可或缺的重要組成部分。通過互聯(lián)網(wǎng)傳播的網(wǎng)頁(yè)內(nèi)容形式多樣,如何對(duì)這些內(nèi)容,特別是有害內(nèi)容進(jìn)行有效監(jiān)管,是互聯(lián)網(wǎng)研究的重要課題。本論文首先分析了世界各國(guó)在治理互聯(lián)網(wǎng)有害信息方面所采取的各種措施,然后從技術(shù)角度出發(fā),依據(jù)內(nèi)容分級(jí)管理體系思想,結(jié)合支持向量機(jī)(Support Vector Machine,SVM)網(wǎng)頁(yè)內(nèi)容分類算法,提出了一種把網(wǎng)頁(yè)內(nèi)容分級(jí)和網(wǎng)頁(yè)自動(dòng)分級(jí)標(biāo)記相結(jié)合的信息過濾系統(tǒng):該系統(tǒng)以分級(jí)標(biāo)準(zhǔn)中的分級(jí)條目作為網(wǎng)頁(yè)自動(dòng)分級(jí)標(biāo)記的依據(jù),根據(jù)提前訓(xùn)練好的分級(jí)模板,對(duì)用戶請(qǐng)求的未分級(jí)網(wǎng)頁(yè)進(jìn)行自動(dòng)分級(jí)標(biāo)記,系統(tǒng)最后依據(jù)內(nèi)容分級(jí)過濾規(guī)則對(duì)有害信息進(jìn)行過濾。在系統(tǒng)實(shí)現(xiàn)過程中,論文還引入了一些可行的安全措施,保證整個(gè)系統(tǒng)安全高效地運(yùn)行。 歸納起來,本論文主要做了以下幾方面的研究工作: (1)論文分析了網(wǎng)頁(yè)內(nèi)容分級(jí)和當(dāng)前主流過濾技術(shù)在世界各國(guó)的研究與實(shí)施現(xiàn)狀,針對(duì)阻礙網(wǎng)頁(yè)分級(jí)實(shí)施的各種不利因素,提出了一種把網(wǎng)頁(yè)內(nèi)容分級(jí)與網(wǎng)頁(yè)自動(dòng)分級(jí)標(biāo)記相結(jié)合的信息過濾系統(tǒng); (2)編程實(shí)現(xiàn)了對(duì)未分級(jí)網(wǎng)頁(yè)的自動(dòng)分級(jí)標(biāo)記。該過程主要包括網(wǎng)頁(yè)信息的提取與轉(zhuǎn)換、網(wǎng)頁(yè)特征向量計(jì)算、分類訓(xùn)練、網(wǎng)頁(yè)分類以及分級(jí)標(biāo)簽生成等幾部分。論文還搜集了相關(guān)網(wǎng)頁(yè)數(shù)據(jù),進(jìn)行了實(shí)驗(yàn)驗(yàn)證; (3)為保證分級(jí)標(biāo)簽與相關(guān)網(wǎng)頁(yè)信息的一致性和分級(jí)標(biāo)簽的安全性,系統(tǒng)在生成分級(jí)標(biāo)簽的同時(shí),生成了對(duì)應(yīng)網(wǎng)頁(yè)的信息摘要,并將其作為分級(jí)標(biāo)簽的一部分儲(chǔ)存在分級(jí)標(biāo)簽中,而且還對(duì)分級(jí)標(biāo)簽采取了數(shù)字簽名,論文給出了詳細(xì)的實(shí)現(xiàn)步驟和方法。
【關(guān)鍵詞】:內(nèi)容分級(jí) 分級(jí)標(biāo)簽 文本分類 支持向量機(jī)
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP393.092
【目錄】:
- 致謝5-6
- 摘要6-7
- ABSTRACT7-8
- 目錄8-10
- 1 引言10-13
- 2 內(nèi)容過濾的概念及其分類13-16
- 2.1 內(nèi)容過濾的基本概念及特征13
- 2.2 內(nèi)容過濾在網(wǎng)絡(luò)安全架構(gòu)中的位置及作用13-14
- 2.3 內(nèi)容過濾的分類14-16
- 2.3.1 服務(wù)器端過濾和客戶端過濾14
- 2.3.2 主動(dòng)過濾和被動(dòng)過濾14-15
- 2.3.3 基于URL的過濾和基于關(guān)鍵詞的過濾15
- 2.3.4 智能文本過濾方法15-16
- 3 內(nèi)容分級(jí)管理體系16-29
- 3.1 內(nèi)容分級(jí)過濾系統(tǒng)的工作原理16-17
- 3.2 分級(jí)標(biāo)準(zhǔn)17-18
- 3.2.1 分級(jí)詞匯17
- 3.2.2 分級(jí)標(biāo)記17-18
- 3.2.3 分級(jí)操作方法18
- 3.3 分級(jí)標(biāo)簽18-22
- 3.3.1 分級(jí)標(biāo)簽的格式18-19
- 3.3.2 分級(jí)標(biāo)簽的分類及作用范圍19-20
- 3.3.3 分級(jí)標(biāo)簽的傳輸20-21
- 3.3.4 分級(jí)標(biāo)簽的生成過程21-22
- 3.4 標(biāo)簽局(LABEL BUREAU)22-24
- 3.5 分級(jí)過濾規(guī)則描述語(yǔ)言24-25
- 3.6 內(nèi)容分級(jí)的使用方式25-26
- 3.7 我國(guó)網(wǎng)絡(luò)內(nèi)容分級(jí)的發(fā)展及現(xiàn)狀26-29
- 4 網(wǎng)頁(yè)內(nèi)容分級(jí)系統(tǒng)的設(shè)計(jì)29-39
- 4.1 當(dāng)前常用過濾軟件的功能及局限性29-31
- 4.2 內(nèi)容分級(jí)過濾系統(tǒng)存在的問題31-32
- 4.3 一種安全的網(wǎng)頁(yè)內(nèi)容分級(jí)過濾系統(tǒng)32-33
- 4.4 網(wǎng)頁(yè)內(nèi)容分級(jí)系統(tǒng)的工作流圖33-34
- 4.5 分級(jí)標(biāo)簽的一致性與安全性的實(shí)現(xiàn)34-37
- 4.5.1 主要實(shí)現(xiàn)步驟35-37
- 4.5.2 具體實(shí)現(xiàn)方法及對(duì)系統(tǒng)的影響分析37
- 4.6 網(wǎng)頁(yè)內(nèi)容分級(jí)系統(tǒng)的部署方式37-39
- 5 文本網(wǎng)頁(yè)自動(dòng)分級(jí)系統(tǒng)實(shí)現(xiàn)39-52
- 5.1 分類的相關(guān)概念39-40
- 5.1.1 文本分類的概念39-40
- 5.1.2 分類的劃分40
- 5.2 文本分類主要技術(shù)及分類過程40-50
- 5.2.1 文本表示40-41
- 5.2.2 特征項(xiàng)的選擇41-42
- 5.2.3 分類算法42-45
- 5.2.4 網(wǎng)頁(yè)的預(yù)處理45-49
- 5.2.5 文本自動(dòng)分類的過程49-50
- 5.3 自動(dòng)分級(jí)系統(tǒng)功能模塊及主要工作過程50-52
- 6 實(shí)驗(yàn)與討論52-58
- 7 結(jié)束語(yǔ)58-59
- 參考文獻(xiàn)59-61
- 作者簡(jiǎn)歷及攻讀碩士學(xué)位期間取得的研究成果61-63
- 學(xué)位論文數(shù)據(jù)集63
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 龔德和;;獲取網(wǎng)頁(yè)內(nèi)容方法多[J];電腦知識(shí)與技術(shù)(經(jīng)驗(yàn)技巧);2007年04期
2 陳欣;卓力;;面向敏感網(wǎng)頁(yè)識(shí)別的網(wǎng)頁(yè)內(nèi)容獲取方案的設(shè)計(jì)與實(shí)現(xiàn)[J];測(cè)控技術(shù);2009年05期
3 邱江濤;唐常杰;李川;朱軍;;基于塊分布的新聞網(wǎng)頁(yè)內(nèi)容提取[J];吉林大學(xué)學(xué)報(bào)(工學(xué)版);2009年05期
4 一嘯;;精彩內(nèi)容 瞬間分享[J];電腦迷;2010年10期
5 繼華;;時(shí)空穿梭 快速找回以前看過的網(wǎng)頁(yè)內(nèi)容[J];電腦迷;2010年16期
6 張寶政;;網(wǎng)頁(yè)內(nèi)容防采集策略的研究[J];數(shù)字技術(shù)與應(yīng)用;2010年05期
7 解姝;葉施仁;肖春;;社會(huì)媒體網(wǎng)頁(yè)內(nèi)容的分割與抽取[J];計(jì)算機(jī)工程;2011年21期
8 王悠悠;吳中博;;網(wǎng)頁(yè)內(nèi)容提取工具的設(shè)計(jì)與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2011年32期
9 王國(guó)慶;;如伺保存和修改網(wǎng)頁(yè)內(nèi)容[J];廣東電腦與電訊;1999年08期
10 齊志勇;;輕松截取無(wú)邊框網(wǎng)頁(yè)內(nèi)容[J];河北教育(教學(xué)版);2006年06期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條
1 李連霞;馬軍;陳竹敏;;基于多特征的網(wǎng)頁(yè)內(nèi)容提取研究[A];第三屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2007)論文集[C];2007年
2 張建標(biāo);肖創(chuàng)柏;;網(wǎng)頁(yè)內(nèi)容實(shí)時(shí)監(jiān)控審計(jì)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];第十九次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2004年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 李點(diǎn);衛(wèi)星可加快網(wǎng)頁(yè)內(nèi)容傳送[N];北京科技報(bào);2001年
2 ;世紀(jì)互聯(lián)推內(nèi)容加強(qiáng)服務(wù)[N];中國(guó)電子報(bào);2000年
3 浙江 姚愷豐;屏蔽非打印元素二法[N];電腦報(bào);2004年
4 實(shí)習(xí)生 馬霞;無(wú)障礙閱讀系統(tǒng):讓互聯(lián)網(wǎng)不再有“盲區(qū)”[N];科技日?qǐng)?bào);2011年
5 ;學(xué)生上網(wǎng)的保護(hù)[N];中國(guó)電腦教育報(bào);2003年
6 王潔;新手問答[N];中國(guó)電腦教育報(bào);2003年
7 李峰 曹誠(chéng)志;加強(qiáng)反腐倡廉網(wǎng)絡(luò)宣教的思考[N];中國(guó)紀(jì)檢監(jiān)察報(bào);2005年
8 張常偉邋羅朱 本報(bào)記者 唐先武;用網(wǎng)絡(luò)貫穿的文化“快車道”[N];科技日?qǐng)?bào);2008年
9 Xman;熊寶寶圖標(biāo)的EXE文件[N];電腦報(bào);2002年
10 釗;香港網(wǎng)瞅準(zhǔn)電視上網(wǎng)[N];中華工商時(shí)報(bào);2000年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 史正群;網(wǎng)頁(yè)內(nèi)容分級(jí)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京交通大學(xué);2015年
2 苗苗;基于頁(yè)面分塊的網(wǎng)頁(yè)內(nèi)容提取的研究與實(shí)現(xiàn)[D];武漢理工大學(xué);2010年
3 馬曉蘭;網(wǎng)頁(yè)內(nèi)容分級(jí)過濾系統(tǒng)研究[D];華東師范大學(xué);2004年
4 李連霞;基于多特征的HTML網(wǎng)頁(yè)內(nèi)容提取的研究[D];山東大學(xué);2008年
5 張強(qiáng);網(wǎng)頁(yè)內(nèi)容獲取及基于意圖的聚類[D];北京郵電大學(xué);2010年
6 周洪喜;基于人工標(biāo)注技術(shù)的網(wǎng)頁(yè)內(nèi)容抽取系統(tǒng)開發(fā)[D];復(fù)旦大學(xué);2010年
7 解姝;社會(huì)媒體網(wǎng)頁(yè)內(nèi)容分割與主題頻繁簇的抽取[D];湘潭大學(xué);2011年
8 張瓊;Web主題網(wǎng)頁(yè)內(nèi)容安全監(jiān)管研究[D];西安電子科技大學(xué);2008年
9 羅超然;一種通用的網(wǎng)頁(yè)內(nèi)容抽取模塊的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2015年
10 王阿婷;基于概念集合的網(wǎng)頁(yè)內(nèi)容過濾方法的研究[D];北京交通大學(xué);2010年
本文關(guān)鍵詞:網(wǎng)頁(yè)內(nèi)容分級(jí)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):418540
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/418540.html