百科詞條冪律分布及網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)研究
發(fā)布時間:2020-05-27 12:26
【摘要】:近年來,復(fù)雜網(wǎng)絡(luò)引起各個學(xué)科的學(xué)者的廣泛關(guān)注,包括社會學(xué),統(tǒng)計(jì)物理學(xué),生物學(xué),統(tǒng)計(jì)學(xué)等學(xué)科。無標(biāo)度網(wǎng)絡(luò)更能形象地展示現(xiàn)實(shí)世界。無標(biāo)度網(wǎng)絡(luò)的度分布服從冪律分布,冪律分布廣泛存在于自然界與生活的方方面面,且無標(biāo)度網(wǎng)絡(luò)中的Hub節(jié)點(diǎn)對網(wǎng)絡(luò)的結(jié)構(gòu)以及功能都起著至關(guān)重要的作用。因此關(guān)于無標(biāo)度現(xiàn)象的研究有助于了解實(shí)際生活中不同的現(xiàn)象的本質(zhì)規(guī)律。本文主要包括如下兩部分內(nèi)容:(1)針對百度百科詞條,收集百科特色詞條以及普通詞條的編輯歷史數(shù)據(jù),從整體編輯歷史時間間隔和用戶編輯歷史時間間隔兩方面對兩組詞條分析其分布。通過最大似然估計(jì)法計(jì)算參數(shù)以及似然比檢驗(yàn)法對結(jié)果進(jìn)行檢驗(yàn),結(jié)果顯示,特色詞條的整體編輯歷史時間間隔分布服從雙冪律分布,前半段的參數(shù)近似等于1.1,后半段參數(shù)均大于2,用戶編輯歷史時間間隔服從單冪律分布,參數(shù)近似等于1.1。普通詞條的整體編輯歷史時間間隔分布服從單冪律分布,參數(shù)近似等于1.1,用戶編輯歷史時間間隔服從單冪律分布,參數(shù)近似等于1.1。(2)聚焦于具有Hub的網(wǎng)絡(luò)的結(jié)構(gòu)學(xué)習(xí)問題。在鄰域選擇框架下,我們基于Hub網(wǎng)絡(luò)的特點(diǎn)在模型中加入_1L和_2L正則子,從而分別引入網(wǎng)絡(luò)的稀疏性先驗(yàn)和Hub網(wǎng)絡(luò)的組先驗(yàn)。對于所得模型,采用坐標(biāo)下降法求解。模擬數(shù)據(jù)和真實(shí)數(shù)據(jù)表明所提模型的有效性和實(shí)用性。
【圖文】:
得11 1= .niix n 計(jì)算了兩個分布的參數(shù)后代入對數(shù)似然比判斷數(shù)據(jù)更擬合的分布。2.3 結(jié)果分析本節(jié)將收集到的特色詞條的兩組數(shù)據(jù)和普通詞條的兩組數(shù)據(jù)進(jìn)行分析,詞條的區(qū)別。首先通過雙對數(shù)坐標(biāo)圖判斷數(shù)據(jù)是否擬合冪律分布,再用最大法計(jì)算冪律分布的參數(shù),最后對冪律分布進(jìn)行檢驗(yàn)。2.3.1 特色詞條編輯歷史時間間隔分布收集選取的 9 個特色詞條的整體編輯歷史時間間隔數(shù)據(jù),在雙對數(shù)圖上為了更清楚的說明結(jié)果,我們將詞條分為三組,詞條 1,49,98 一組,詞99 一組,詞條 3,51,100 一組。結(jié)果分別是圖 1,,圖 2,圖 3。
得11 1= .niix n 計(jì)算了兩個分布的參數(shù)后代入對數(shù)似然比判斷數(shù)據(jù)更擬合的分布。2.3 結(jié)果分析本節(jié)將收集到的特色詞條的兩組數(shù)據(jù)和普通詞條的兩組數(shù)據(jù)進(jìn)行分析,詞條的區(qū)別。首先通過雙對數(shù)坐標(biāo)圖判斷數(shù)據(jù)是否擬合冪律分布,再用最大法計(jì)算冪律分布的參數(shù),最后對冪律分布進(jìn)行檢驗(yàn)。2.3.1 特色詞條編輯歷史時間間隔分布收集選取的 9 個特色詞條的整體編輯歷史時間間隔數(shù)據(jù),在雙對數(shù)圖上為了更清楚的說明結(jié)果,我們將詞條分為三組,詞條 1,49,98 一組,詞99 一組,詞條 3,51,100 一組。結(jié)果分別是圖 1,圖 2,圖 3。
【學(xué)位授予單位】:西北大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:C811
本文編號:2683533
【圖文】:
得11 1= .niix n 計(jì)算了兩個分布的參數(shù)后代入對數(shù)似然比判斷數(shù)據(jù)更擬合的分布。2.3 結(jié)果分析本節(jié)將收集到的特色詞條的兩組數(shù)據(jù)和普通詞條的兩組數(shù)據(jù)進(jìn)行分析,詞條的區(qū)別。首先通過雙對數(shù)坐標(biāo)圖判斷數(shù)據(jù)是否擬合冪律分布,再用最大法計(jì)算冪律分布的參數(shù),最后對冪律分布進(jìn)行檢驗(yàn)。2.3.1 特色詞條編輯歷史時間間隔分布收集選取的 9 個特色詞條的整體編輯歷史時間間隔數(shù)據(jù),在雙對數(shù)圖上為了更清楚的說明結(jié)果,我們將詞條分為三組,詞條 1,49,98 一組,詞99 一組,詞條 3,51,100 一組。結(jié)果分別是圖 1,,圖 2,圖 3。
得11 1= .niix n 計(jì)算了兩個分布的參數(shù)后代入對數(shù)似然比判斷數(shù)據(jù)更擬合的分布。2.3 結(jié)果分析本節(jié)將收集到的特色詞條的兩組數(shù)據(jù)和普通詞條的兩組數(shù)據(jù)進(jìn)行分析,詞條的區(qū)別。首先通過雙對數(shù)坐標(biāo)圖判斷數(shù)據(jù)是否擬合冪律分布,再用最大法計(jì)算冪律分布的參數(shù),最后對冪律分布進(jìn)行檢驗(yàn)。2.3.1 特色詞條編輯歷史時間間隔分布收集選取的 9 個特色詞條的整體編輯歷史時間間隔數(shù)據(jù),在雙對數(shù)圖上為了更清楚的說明結(jié)果,我們將詞條分為三組,詞條 1,49,98 一組,詞99 一組,詞條 3,51,100 一組。結(jié)果分別是圖 1,圖 2,圖 3。
【學(xué)位授予單位】:西北大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:C811
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 黃令賀;朱慶華;;百科詞條特征及用戶貢獻(xiàn)行為研究——以百度百科為例[J];中國圖書館學(xué)報(bào);2013年01期
2 趙東杰;郝黎;李德毅;王華;何宇;;維基百科詞條編輯特性研究[J];計(jì)算機(jī)科學(xué);2011年S1期
3 蘇東旭;楊建梅;;百度百科合作網(wǎng)絡(luò)的分形生長機(jī)制研究[J];計(jì)算機(jī)應(yīng)用研究;2010年12期
4 謝偉聰;楊建梅;;維基百科貢獻(xiàn)者中的人類動力學(xué)模式[J];科學(xué)學(xué)研究;2010年10期
相關(guān)碩士學(xué)位論文 前2條
1 肖強(qiáng);維基百科詞條編輯次數(shù)冪律分布機(jī)制研究[D];南京大學(xué);2014年
2 李欣榮;百度百科與谷歌開源社區(qū)比較研究[D];華南理工大學(xué);2011年
本文編號:2683533
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/2683533.html
最近更新
教材專著