天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)重要性在垃圾網(wǎng)頁(yè)檢測(cè)中的應(yīng)用

發(fā)布時(shí)間:2020-03-28 22:06
【摘要】:在現(xiàn)代社會(huì)人們通常使用網(wǎng)絡(luò)來(lái)獲取信息。但許多無(wú)良的商業(yè)網(wǎng)站利用網(wǎng)絡(luò)制造垃圾網(wǎng)頁(yè)來(lái)獲取利潤(rùn)。這種行為已經(jīng)嚴(yán)重干擾了網(wǎng)絡(luò)的正常秩序。因此,檢測(cè)垃圾網(wǎng)頁(yè)工作已經(jīng)成為亟需解決的重要課題。由于TrustRank算法認(rèn)為高質(zhì)量的網(wǎng)站一般不會(huì)指向垃圾網(wǎng)站,但現(xiàn)實(shí)中這種行為是存在的,因此論文對(duì)TrustRank算法進(jìn)行改進(jìn),使用復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)重要性的排序方法,提出了基于介數(shù)指標(biāo)和集聚系數(shù)的垃圾網(wǎng)頁(yè)檢測(cè)算法BCTRank。BCTRank包括2個(gè)子算法——基于介數(shù)指標(biāo)的種子集選取算法BCW和基于集聚系數(shù)的排序算法CTRank。論文主要工作如下。(1)在現(xiàn)實(shí)中,垃圾網(wǎng)頁(yè)的制造者會(huì)在高質(zhì)量的網(wǎng)頁(yè)里添加外鏈,提升自己在網(wǎng)絡(luò)中的排名。針對(duì)這種情況,論文提出了一種新的選取種子集的方法,即BCW算法。首先采用PCA來(lái)處理數(shù)據(jù),在此基礎(chǔ)上使用了介數(shù)指標(biāo)對(duì)每個(gè)網(wǎng)頁(yè)進(jìn)行評(píng)分并且對(duì)不同的網(wǎng)頁(yè)定義不同的權(quán)重,以此通過(guò)每個(gè)網(wǎng)頁(yè)出鏈的評(píng)分與該網(wǎng)頁(yè)的評(píng)分的加權(quán)求和來(lái)計(jì)算每個(gè)網(wǎng)頁(yè)的重要性得分。然后,采用的種子集賦值方式是挑選出得分較高和較低的頁(yè)面分別賦予不同的初值,使其共同組成種子集。(2)TrustRank排序算法認(rèn)為網(wǎng)頁(yè)的跳轉(zhuǎn)概率都是相同的,但通常網(wǎng)頁(yè)與網(wǎng)頁(yè)間不應(yīng)是“平等”的關(guān)系,針對(duì)此問(wèn)題論文提出了CTRank算法。把集聚系數(shù)中的鄰居數(shù)改為使用入鏈數(shù)來(lái)代替計(jì)算。根據(jù)改變后的集聚系數(shù)的得分和每個(gè)節(jié)點(diǎn)的出鏈情況,提出使用不同方法來(lái)差異化地計(jì)算轉(zhuǎn)移矩陣。以此來(lái)改善TrustRank算法在計(jì)算轉(zhuǎn)移矩陣時(shí)平均分配鏈接權(quán)重、而忽略網(wǎng)頁(yè)重要性的問(wèn)題。論文使用WEBSPAM-UK2007對(duì)算法的有效性進(jìn)行評(píng)估。使用準(zhǔn)確率、召回率以及F值等評(píng)價(jià)指標(biāo)對(duì)網(wǎng)頁(yè)的最終排序結(jié)果進(jìn)行分析比較。實(shí)驗(yàn)最終結(jié)果證明了所提算法的有效性。
【學(xué)位授予單位】:天津大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:O157.5;TP393.092

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 楊博;陳賀昌;朱冠宇;趙學(xué)華;;基于超鏈接多樣性分析的新型網(wǎng)頁(yè)排名算法[J];計(jì)算機(jī)學(xué)報(bào);2014年04期

2 孫佳龍;郭金運(yùn);郭淑艷;;利用夾角余弦和聚類分析的電離層TEC混沌預(yù)測(cè)[J];武漢大學(xué)學(xué)報(bào)(信息科學(xué)版);2014年04期

3 崔現(xiàn)東;劉江;黃韜;陳建亞;劉韻潔;;基于節(jié)點(diǎn)介數(shù)和替換率的內(nèi)容中心網(wǎng)絡(luò)網(wǎng)內(nèi)緩存策略[J];電子與信息學(xué)報(bào);2014年01期

4 劉建國(guó);任卓明;郭強(qiáng);汪秉宏;;復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)重要性排序的研究進(jìn)展[J];物理學(xué)報(bào);2013年17期

5 任卓明;邵鳳;劉建國(guó);郭強(qiáng);汪秉宏;;基于度與集聚系數(shù)的網(wǎng)絡(luò)節(jié)點(diǎn)重要性度量方法研究[J];物理學(xué)報(bào);2013年12期

6 江雪;孫樂(lè);;用戶查詢意圖切分的研究[J];計(jì)算機(jī)學(xué)報(bào);2013年03期

7 李艷平;徐雅斌;陳俊伊;;搜索服務(wù)中基于云計(jì)算的垃圾網(wǎng)頁(yè)識(shí)別研究[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年S1期

8 馬宏遠(yuǎn);王斌;;基于日志分析的搜索引擎查詢結(jié)果緩存研究[J];計(jì)算機(jī)研究與發(fā)展;2012年S1期

9 潘巍;李戰(zhàn)懷;伍賽;陳群;;基于消息傳遞機(jī)制的MapReduce圖算法研究[J];計(jì)算機(jī)學(xué)報(bào);2011年10期

10 喬少杰;彭京;李天瑞;李紅;李太勇;王超;;基于中心性和PageRank的網(wǎng)頁(yè)綜合評(píng)分方法[J];西南交通大學(xué)學(xué)報(bào);2011年03期

,

本文編號(hào):2604977

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2604977.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6923f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com