主動(dòng)半監(jiān)督網(wǎng)絡(luò)結(jié)構(gòu)發(fā)現(xiàn)算法研究及應(yīng)用
發(fā)布時(shí)間:2022-02-12 16:15
信息化時(shí)代,來自社交平臺(tái)的數(shù)據(jù)每天在源源不斷的生成,許多數(shù)據(jù)可建模為大規(guī)模網(wǎng)絡(luò),基于這些網(wǎng)絡(luò)數(shù)據(jù)快速、準(zhǔn)確地識(shí)別其潛在的多類型聚類結(jié)構(gòu),有利于實(shí)際的應(yīng)用,如推薦系統(tǒng)可利用用戶聚類信息進(jìn)行推薦,輿情分析可利用用戶聚類發(fā)現(xiàn)用戶交互模式。目前存在的社區(qū)結(jié)構(gòu)發(fā)現(xiàn)算法只能識(shí)別網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu),而對(duì)于網(wǎng)絡(luò)的多類型結(jié)構(gòu),無監(jiān)督網(wǎng)絡(luò)結(jié)構(gòu)發(fā)現(xiàn)算法雖可以發(fā)現(xiàn)其結(jié)構(gòu),但準(zhǔn)確性不高。先驗(yàn)信息有助于提高網(wǎng)絡(luò)結(jié)構(gòu)發(fā)現(xiàn)的準(zhǔn)確率,但先驗(yàn)信息很難獲得,且需要很大的代價(jià)花銷。主動(dòng)學(xué)習(xí)基于采樣策略選擇使模型性能提升最大的監(jiān)督信息,可花費(fèi)較少代價(jià)得到高質(zhì)量先驗(yàn),進(jìn)一步提高網(wǎng)絡(luò)結(jié)構(gòu)發(fā)現(xiàn)算法的準(zhǔn)確性。因此,主動(dòng)半監(jiān)督網(wǎng)絡(luò)結(jié)構(gòu)發(fā)現(xiàn)算法更加具有研究與應(yīng)用價(jià)值。無監(jiān)督在線EM算法onlineVEM(online Variational Expectation Maximization)可以發(fā)現(xiàn)大規(guī)模網(wǎng)絡(luò)多類型結(jié)構(gòu),但是其十分依賴模型初始參數(shù)的優(yōu)劣,尤其是在網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜時(shí)結(jié)果不穩(wěn)定且不準(zhǔn)確。因此,將onlineVEM算法與不確定性采樣策略相結(jié)合,提出一種基于迭代框架的主動(dòng)半監(jiān)督網(wǎng)絡(luò)結(jié)構(gòu)發(fā)現(xiàn)方法ASonlineVEM(Active Semi...
【文章來源】:河北地質(zhì)大學(xué)河北省
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
主動(dòng)學(xué)習(xí)模型
河北地質(zhì)大學(xué)碩士學(xué)位論文13點(diǎn)數(shù)占網(wǎng)絡(luò)總節(jié)點(diǎn)數(shù)的比例(K維)和類間鏈接概率矩陣(KK維)。圖2.1為隨機(jī)塊模型的參數(shù)表示,其生成網(wǎng)絡(luò)的過程如下:設(shè)節(jié)點(diǎn)i屬于第k類的概率為k,則節(jié)點(diǎn)i的類指派向量表示為K維的iZ,且iZ服從多項(xiàng)式分布;類間鏈接概率矩陣為KK維矩陣,其中rs表示類r和類s之間產(chǎn)生鏈接的概率。圖2.1隨機(jī)塊模型的參數(shù)表示利用EM算法和網(wǎng)絡(luò)生成過程估計(jì)模型參數(shù),求解節(jié)點(diǎn)類隸屬度ik的目標(biāo)公式的對(duì)數(shù)似然函數(shù)近似如下:A1-A,,,(A,Z|,)((1))ijijikkikjlikijkllogloglog(2.12)對(duì)目標(biāo)公式進(jìn)行求導(dǎo)得到參數(shù)ik:A1A,((1))ijijjlikkijr(2.13)模型參數(shù)和求解公式如下:1kikiN(2.14)Aikjlijijklikjlij(2.15)2.3.2Newman混合模型Newman提出的混合模型NMM可以發(fā)現(xiàn)網(wǎng)絡(luò)的結(jié)構(gòu)特征,該方法將具有相似鏈接模式的節(jié)點(diǎn)對(duì)劃分到同一類中,已達(dá)到最終的聚類效果。NMM算法的實(shí)現(xiàn)利用期望最大化算法和概率混合模型。首先對(duì)NMM算法中使用的變量進(jìn)行說明:A表示鄰接矩陣,節(jié)點(diǎn)之間有邊為1,否則為0;iq表示節(jié)點(diǎn)i的類隸屬;模型參數(shù)為r和ri,r表示類r中節(jié)點(diǎn)比例,ri表示類r產(chǎn)生一條指向節(jié)點(diǎn)i的邊的概率。而NMM算法的最終目標(biāo)則是最大化似然Pr(A,q|,),一般來說是使該似然的對(duì)數(shù)最大化:
gn8的NMI對(duì)比結(jié)果
【參考文獻(xiàn)】:
期刊論文
[1]主動(dòng)學(xué)習(xí)策略融合算法在高光譜圖像分類中的應(yīng)用[J]. 崔穎,徐凱,陸忠軍,劉述彬,王立國(guó). 通信學(xué)報(bào). 2018(04)
[2]基于鏈接模型的主動(dòng)半監(jiān)督社區(qū)發(fā)現(xiàn)方法[J]. 柴變芳,王建嶺,許冀偉,李文斌. 計(jì)算機(jī)應(yīng)用. 2017(11)
[3]基于迭代框架的主動(dòng)鏈接選擇半監(jiān)督社區(qū)發(fā)現(xiàn)算法[J]. 陳嶷瑛,柴變芳,李文斌,賀毅朝,吳聰聰. 計(jì)算機(jī)應(yīng)用. 2017(11)
[4]一種基于信息論的文本數(shù)據(jù)挖掘算法[J]. 方玉峰. 電子技術(shù)與軟件工程. 2017(12)
[5]復(fù)雜網(wǎng)絡(luò)半監(jiān)督的社區(qū)發(fā)現(xiàn)算法研究[J]. 王靜紅,于雅智. 計(jì)算機(jī)應(yīng)用研究. 2018(06)
[6]基于最小割圖分割的社區(qū)發(fā)現(xiàn)算法[J]. 王亞珅,黃河燕,馮沖. 中文信息學(xué)報(bào). 2017(03)
[7]基于數(shù)據(jù)挖掘的圖像分類算法[J]. 唐普霞,石麗怡. 現(xiàn)代電子技術(shù). 2017(03)
[8]基于社區(qū)劃分的學(xué)術(shù)論文推薦模型[J]. 黃泳航,湯庸,李春英,湯志康,劉繼偉. 計(jì)算機(jī)應(yīng)用. 2016(05)
[9]改進(jìn)的基于局部模塊度的社團(tuán)劃分算法[J]. 王天宏,武星,蘭旺森. 計(jì)算機(jī)應(yīng)用. 2016(05)
[10]一種高效的隨機(jī)塊模型學(xué)習(xí)算法[J]. 趙學(xué)華,楊博,陳賀昌. 軟件學(xué)報(bào). 2016(09)
碩士論文
[1]基于社區(qū)發(fā)現(xiàn)的網(wǎng)絡(luò)輿情熱點(diǎn)主題識(shí)別研究[D]. 吳靚嬋媛.南京理工大學(xué) 2017
[2]EM算法及其應(yīng)用[D]. 張宏東.山東大學(xué) 2014
本文編號(hào):3622034
【文章來源】:河北地質(zhì)大學(xué)河北省
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
主動(dòng)學(xué)習(xí)模型
河北地質(zhì)大學(xué)碩士學(xué)位論文13點(diǎn)數(shù)占網(wǎng)絡(luò)總節(jié)點(diǎn)數(shù)的比例(K維)和類間鏈接概率矩陣(KK維)。圖2.1為隨機(jī)塊模型的參數(shù)表示,其生成網(wǎng)絡(luò)的過程如下:設(shè)節(jié)點(diǎn)i屬于第k類的概率為k,則節(jié)點(diǎn)i的類指派向量表示為K維的iZ,且iZ服從多項(xiàng)式分布;類間鏈接概率矩陣為KK維矩陣,其中rs表示類r和類s之間產(chǎn)生鏈接的概率。圖2.1隨機(jī)塊模型的參數(shù)表示利用EM算法和網(wǎng)絡(luò)生成過程估計(jì)模型參數(shù),求解節(jié)點(diǎn)類隸屬度ik的目標(biāo)公式的對(duì)數(shù)似然函數(shù)近似如下:A1-A,,,(A,Z|,)((1))ijijikkikjlikijkllogloglog(2.12)對(duì)目標(biāo)公式進(jìn)行求導(dǎo)得到參數(shù)ik:A1A,((1))ijijjlikkijr(2.13)模型參數(shù)和求解公式如下:1kikiN(2.14)Aikjlijijklikjlij(2.15)2.3.2Newman混合模型Newman提出的混合模型NMM可以發(fā)現(xiàn)網(wǎng)絡(luò)的結(jié)構(gòu)特征,該方法將具有相似鏈接模式的節(jié)點(diǎn)對(duì)劃分到同一類中,已達(dá)到最終的聚類效果。NMM算法的實(shí)現(xiàn)利用期望最大化算法和概率混合模型。首先對(duì)NMM算法中使用的變量進(jìn)行說明:A表示鄰接矩陣,節(jié)點(diǎn)之間有邊為1,否則為0;iq表示節(jié)點(diǎn)i的類隸屬;模型參數(shù)為r和ri,r表示類r中節(jié)點(diǎn)比例,ri表示類r產(chǎn)生一條指向節(jié)點(diǎn)i的邊的概率。而NMM算法的最終目標(biāo)則是最大化似然Pr(A,q|,),一般來說是使該似然的對(duì)數(shù)最大化:
gn8的NMI對(duì)比結(jié)果
【參考文獻(xiàn)】:
期刊論文
[1]主動(dòng)學(xué)習(xí)策略融合算法在高光譜圖像分類中的應(yīng)用[J]. 崔穎,徐凱,陸忠軍,劉述彬,王立國(guó). 通信學(xué)報(bào). 2018(04)
[2]基于鏈接模型的主動(dòng)半監(jiān)督社區(qū)發(fā)現(xiàn)方法[J]. 柴變芳,王建嶺,許冀偉,李文斌. 計(jì)算機(jī)應(yīng)用. 2017(11)
[3]基于迭代框架的主動(dòng)鏈接選擇半監(jiān)督社區(qū)發(fā)現(xiàn)算法[J]. 陳嶷瑛,柴變芳,李文斌,賀毅朝,吳聰聰. 計(jì)算機(jī)應(yīng)用. 2017(11)
[4]一種基于信息論的文本數(shù)據(jù)挖掘算法[J]. 方玉峰. 電子技術(shù)與軟件工程. 2017(12)
[5]復(fù)雜網(wǎng)絡(luò)半監(jiān)督的社區(qū)發(fā)現(xiàn)算法研究[J]. 王靜紅,于雅智. 計(jì)算機(jī)應(yīng)用研究. 2018(06)
[6]基于最小割圖分割的社區(qū)發(fā)現(xiàn)算法[J]. 王亞珅,黃河燕,馮沖. 中文信息學(xué)報(bào). 2017(03)
[7]基于數(shù)據(jù)挖掘的圖像分類算法[J]. 唐普霞,石麗怡. 現(xiàn)代電子技術(shù). 2017(03)
[8]基于社區(qū)劃分的學(xué)術(shù)論文推薦模型[J]. 黃泳航,湯庸,李春英,湯志康,劉繼偉. 計(jì)算機(jī)應(yīng)用. 2016(05)
[9]改進(jìn)的基于局部模塊度的社團(tuán)劃分算法[J]. 王天宏,武星,蘭旺森. 計(jì)算機(jī)應(yīng)用. 2016(05)
[10]一種高效的隨機(jī)塊模型學(xué)習(xí)算法[J]. 趙學(xué)華,楊博,陳賀昌. 軟件學(xué)報(bào). 2016(09)
碩士論文
[1]基于社區(qū)發(fā)現(xiàn)的網(wǎng)絡(luò)輿情熱點(diǎn)主題識(shí)別研究[D]. 吳靚嬋媛.南京理工大學(xué) 2017
[2]EM算法及其應(yīng)用[D]. 張宏東.山東大學(xué) 2014
本文編號(hào):3622034
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3622034.html
最近更新
教材專著