web超鏈分析應(yīng)用研究
發(fā)布時(shí)間:2024-12-11 05:39
隨著互聯(lián)網(wǎng)的不斷發(fā)展,網(wǎng)絡(luò)已成為人們發(fā)布和獲取信息的主要平臺(tái)。由于互聯(lián)網(wǎng)是一個(gè)高速增長(zhǎng)、完全不受控制的異構(gòu)信息集合,因而無(wú)論是web信息資源的利用,還是web拓?fù)浣?經(jīng)典的信息挖掘技術(shù)和數(shù)據(jù)建模方法都很難得到有效應(yīng)用,而超鏈分析的引入和應(yīng)用為這些問(wèn)題的解決提供了一條嶄新的思路。本論文在對(duì)超鏈分析思想進(jìn)行初步分析的基礎(chǔ)上,著重就超鏈分析在web信息資源檢索、web資源發(fā)現(xiàn)以及web拓?fù)浣Y(jié)構(gòu)建模等方面的應(yīng)用進(jìn)行了詳細(xì)的研究。 由于超鏈接關(guān)系和引文關(guān)系在形式和功能上極其相似,因而引文分析的方法和思路被廣泛應(yīng)用于超鏈分析之中,但互聯(lián)網(wǎng)動(dòng)態(tài)、異構(gòu)分布、無(wú)序增長(zhǎng)等特點(diǎn)使得超鏈分析所需解決的問(wèn)題更為復(fù)雜。因而,超鏈分析方法不僅僅只是簡(jiǎn)單的從算法上進(jìn)行實(shí)現(xiàn),還需要融合社會(huì)網(wǎng)絡(luò)分析方法、復(fù)雜系統(tǒng)理論以及拓?fù)浣5燃夹g(shù),系統(tǒng)地對(duì)web超鏈接結(jié)構(gòu)和web信息實(shí)體行為之間的關(guān)系進(jìn)行研究。 對(duì)于一個(gè)特定的信息檢索系統(tǒng),影響檢索效率的因素主要是系統(tǒng)對(duì)特定信息的覆蓋率和對(duì)信息相關(guān)性判定的準(zhǔn)確性。而在web環(huán)境下,信息檢索的主要問(wèn)題已不是覆蓋率,而是如何能夠?yàn)V出與查...
【文章頁(yè)數(shù)】:85 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文編號(hào):4016273
【文章頁(yè)數(shù)】:85 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖5小世界網(wǎng)絡(luò)模型
其總節(jié)點(diǎn)數(shù)N可以很大),其中左圖為規(guī)則網(wǎng)絡(luò),右圖為隨機(jī)網(wǎng)是一個(gè)典型的小世界網(wǎng)絡(luò),是在左圖的規(guī)則網(wǎng)絡(luò)基礎(chǔ)上通過(guò)邊的重連得每一條邊的重連概率為p,當(dāng)p二o時(shí),為規(guī)則網(wǎng)絡(luò),p二1時(shí)為隨機(jī)網(wǎng)絡(luò)。
圖6小世界網(wǎng)絡(luò)特征
圖5小世界網(wǎng)絡(luò)模型s模型的聚集系數(shù)C(P)和平均最短距離LP()都是概率p的函數(shù),規(guī)的聚集系數(shù)為C(0),平均最短距離為L(zhǎng)(o)。實(shí)驗(yàn)發(fā)現(xiàn),如果p值很小,則網(wǎng)絡(luò)的局部特性就會(huì)保留,聚集系數(shù)不會(huì)發(fā)生明顯的改變,C(P)一C同時(shí)平均最短距離的值下降的很快L(P)<<L(0),具有了隨....
本文編號(hào):4016273
本文鏈接:http://sikaile.net/tushudanganlunwen/4016273.html
最近更新
教材專著