web超鏈分析應用研究
發(fā)布時間:2024-12-11 05:39
隨著互聯(lián)網(wǎng)的不斷發(fā)展,網(wǎng)絡(luò)已成為人們發(fā)布和獲取信息的主要平臺。由于互聯(lián)網(wǎng)是一個高速增長、完全不受控制的異構(gòu)信息集合,因而無論是web信息資源的利用,還是web拓撲建模,經(jīng)典的信息挖掘技術(shù)和數(shù)據(jù)建模方法都很難得到有效應用,而超鏈分析的引入和應用為這些問題的解決提供了一條嶄新的思路。本論文在對超鏈分析思想進行初步分析的基礎(chǔ)上,著重就超鏈分析在web信息資源檢索、web資源發(fā)現(xiàn)以及web拓撲結(jié)構(gòu)建模等方面的應用進行了詳細的研究。 由于超鏈接關(guān)系和引文關(guān)系在形式和功能上極其相似,因而引文分析的方法和思路被廣泛應用于超鏈分析之中,但互聯(lián)網(wǎng)動態(tài)、異構(gòu)分布、無序增長等特點使得超鏈分析所需解決的問題更為復雜。因而,超鏈分析方法不僅僅只是簡單的從算法上進行實現(xiàn),還需要融合社會網(wǎng)絡(luò)分析方法、復雜系統(tǒng)理論以及拓撲建模等技術(shù),系統(tǒng)地對web超鏈接結(jié)構(gòu)和web信息實體行為之間的關(guān)系進行研究。 對于一個特定的信息檢索系統(tǒng),影響檢索效率的因素主要是系統(tǒng)對特定信息的覆蓋率和對信息相關(guān)性判定的準確性。而在web環(huán)境下,信息檢索的主要問題已不是覆蓋率,而是如何能夠濾出與查...
【文章頁數(shù)】:85 頁
【學位級別】:碩士
【部分圖文】:
本文編號:4016273
【文章頁數(shù)】:85 頁
【學位級別】:碩士
【部分圖文】:
圖5小世界網(wǎng)絡(luò)模型
其總節(jié)點數(shù)N可以很大),其中左圖為規(guī)則網(wǎng)絡(luò),右圖為隨機網(wǎng)是一個典型的小世界網(wǎng)絡(luò),是在左圖的規(guī)則網(wǎng)絡(luò)基礎(chǔ)上通過邊的重連得每一條邊的重連概率為p,當p二o時,為規(guī)則網(wǎng)絡(luò),p二1時為隨機網(wǎng)絡(luò)。
圖6小世界網(wǎng)絡(luò)特征
圖5小世界網(wǎng)絡(luò)模型s模型的聚集系數(shù)C(P)和平均最短距離LP()都是概率p的函數(shù),規(guī)的聚集系數(shù)為C(0),平均最短距離為L(o)。實驗發(fā)現(xiàn),如果p值很小,則網(wǎng)絡(luò)的局部特性就會保留,聚集系數(shù)不會發(fā)生明顯的改變,C(P)一C同時平均最短距離的值下降的很快L(P)<<L(0),具有了隨....
本文編號:4016273
本文鏈接:http://sikaile.net/tushudanganlunwen/4016273.html