一種基于局部相似性的社區(qū)發(fā)現(xiàn)算法
本文關(guān)鍵詞:一種基于局部相似性的社區(qū)發(fā)現(xiàn)算法
更多相關(guān)文章: 社區(qū)發(fā)現(xiàn) 圖聚類 屬性圖 節(jié)點(diǎn)重要性 局部相似性 節(jié)點(diǎn)相似度
【摘要】:現(xiàn)有社區(qū)發(fā)現(xiàn)算法大多僅考慮圖的拓?fù)浣Y(jié)構(gòu)或節(jié)點(diǎn)的屬性信息,其中結(jié)合兩者的屬性圖聚類算法挖掘效果不理想,而基于共享鄰居的局部相似性算法卻未充分度量節(jié)點(diǎn)間相似度。針對(duì)上述問題,提出一種新的基于局部相似性的節(jié)點(diǎn)相似度社區(qū)發(fā)現(xiàn)算法。該算法包括基于局部相似性的節(jié)點(diǎn)相似度計(jì)算和節(jié)點(diǎn)聚類2個(gè)模塊。利用Pagerank算法計(jì)算基于圖鏈接結(jié)構(gòu)的節(jié)點(diǎn)重要性,衡量節(jié)點(diǎn)間的鏈接強(qiáng)度并結(jié)合節(jié)點(diǎn)的屬性得到節(jié)點(diǎn)對(duì)相似性。為避免基于共享鄰居的節(jié)點(diǎn)相似度計(jì)算的低估傾向,引入鄰居節(jié)點(diǎn)集之間的相似度作為節(jié)點(diǎn)局部相似性。采用K-Medoids聚類算法將節(jié)點(diǎn)與分組中心節(jié)點(diǎn)的局部相似性值作為節(jié)點(diǎn)類別歸屬的判斷,得到社區(qū)劃分的結(jié)果。實(shí)驗(yàn)結(jié)果表明,與經(jīng)典SA-Cluster與k-SNAP等算法相比,該算法能挖掘出質(zhì)量更高的社區(qū),具有較好的社區(qū)劃分效果。
【作者單位】: 華東師范大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系;
【關(guān)鍵詞】: 社區(qū)發(fā)現(xiàn) 圖聚類 屬性圖 節(jié)點(diǎn)重要性 局部相似性 節(jié)點(diǎn)相似度
【基金】:上海市科學(xué)技術(shù)委員會(huì)科研計(jì)劃項(xiàng)目(1451110700,14511106803) 上海市張江國(guó)家自主創(chuàng)新示范區(qū)專項(xiàng)發(fā)展資金(201411-JA-B108-002)
【分類號(hào)】:TP311.13
【正文快照】: 0概述近年來社會(huì)網(wǎng)絡(luò)得到廣泛應(yīng)用,如科學(xué)家合作網(wǎng)、博客網(wǎng)絡(luò)、電子郵件網(wǎng)絡(luò)等。社會(huì)網(wǎng)絡(luò)中的社區(qū)定義為網(wǎng)絡(luò)中的節(jié)點(diǎn)集合以及節(jié)點(diǎn)之間產(chǎn)生的聯(lián)系,使得社區(qū)內(nèi)部節(jié)點(diǎn)的鏈接比較緊密,而社區(qū)之間的節(jié)點(diǎn)鏈接相對(duì)稀疏[1]。社會(huì)網(wǎng)絡(luò)具有2個(gè)重要特征:一個(gè)是社區(qū)結(jié) 構(gòu),即網(wǎng)絡(luò)的結(jié)構(gòu)性
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前10條
1 鄭煒冬;;試卷相似度自動(dòng)評(píng)估技術(shù)的研究[J];智能計(jì)算機(jī)與應(yīng)用;2011年06期
2 李桂林,陳曉云;關(guān)于聚類分析中相似度的討論[J];計(jì)算機(jī)工程與應(yīng)用;2004年31期
3 秦玉平;楊興凱;;基于案例推理的區(qū)間屬性相似度研究[J];遼寧師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年04期
4 蔣鵬;;基于本體的應(yīng)急案例相似度算法研究[J];南昌高專學(xué)報(bào);2009年03期
5 何亞;;詞語相似度算法的分析與改進(jìn)[J];硅谷;2011年24期
6 仇麗青;陳卓艷;;基于共同鄰居相似度的社區(qū)發(fā)現(xiàn)算法[J];信息系統(tǒng)工程;2014年05期
7 焦鵬;唐見兵;查亞兵;;仿真可信度評(píng)估中相似度方法的改進(jìn)及其應(yīng)用[J];系統(tǒng)仿真學(xué)報(bào);2007年12期
8 姜毅;樂慶玲;;一種基于興趣相似度的學(xué)習(xí)社區(qū)算法[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年16期
9 劉曉平;陸勁挺;唐益明;;基于可拓學(xué)的對(duì)比相似功能樹擴(kuò)展方法[J];工程圖學(xué)學(xué)報(bào);2009年01期
10 劉青磊;顧小豐;;基于《知網(wǎng)》的詞語相似度算法研究[J];中文信息學(xué)報(bào);2010年06期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫 前8條
1 劉海波;鄭德權(quán);趙鐵軍;;基于相似度線性加權(quán)方法的檢索結(jié)果聚類研究[A];中國(guó)計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
2 陸勁挺;路強(qiáng);劉曉平;;對(duì)比相似度計(jì)算方法及其在功能樹擴(kuò)展中的應(yīng)用[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
3 雷慶;吳揚(yáng)揚(yáng);;一種基于語義信息計(jì)算XML文檔相似度的新方法[A];第二十一屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
4 羅辛;歐陽元新;熊璋;袁滿;;通過相似度支持度優(yōu)化基于K近鄰的協(xié)同過濾算法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集A輯一[C];2010年
5 周博;岑榮偉;劉奕群;張敏;馬少平;;相關(guān)反饋任務(wù)中一種基于文檔相似度的檢索結(jié)果重排序方法[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
6 廖光忠;黃澤鑫;;基于HowNet語義算法的研究[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
7 袁里馳;鐘義信;;一種新穎的詞聚類算法[A];中國(guó)自動(dòng)化學(xué)會(huì)、中國(guó)儀器儀表學(xué)會(huì)2004年西南三省一市自動(dòng)化與儀器儀表學(xué)術(shù)年會(huì)論文集[C];2004年
8 沈克爽;劉建偉;陳鋒;樂嘉錦;;基于分段直方圖的時(shí)間序列相似度查詢[A];第二十一屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 程亮;基于本體的疾病數(shù)據(jù)整合與挖掘方法研究[D];哈爾濱工業(yè)大學(xué);2014年
2 張明西;信息網(wǎng)絡(luò)中的相似度搜索問題研究[D];復(fù)旦大學(xué);2013年
3 武威;異質(zhì)數(shù)據(jù)相似度學(xué)習(xí)及其在網(wǎng)絡(luò)搜索中的應(yīng)用[D];北京大學(xué);2012年
4 馬海平;基于概率生成模型的相似度建模技術(shù)研究及應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年
5 劉守群;海量網(wǎng)絡(luò)視頻快速檢索關(guān)鍵技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
6 夏云慶;IHSMTS系統(tǒng)中啟發(fā)式類比翻譯處理機(jī)制(HATM)的設(shè)計(jì)與實(shí)現(xiàn)[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2001年
7 張磊;個(gè)性化推薦和搜索中若干關(guān)鍵問題的研究[D];北京郵電大學(xué);2009年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張寧;某于《知網(wǎng)》的詞語相似度優(yōu)化算法[D];昆明理工大學(xué);2015年
2 王世泓;基于情緒詞典擴(kuò)展技術(shù)的中文微博情緒分析[D];南京航空航天大學(xué);2015年
3 高春華;面向異構(gòu)社交網(wǎng)絡(luò)的個(gè)性化推薦技術(shù)研究[D];南京大學(xué);2014年
4 劉穎穎;一種RDF圖模式管理工具的設(shè)計(jì)與實(shí)現(xiàn)[D];南京大學(xué);2013年
5 劉勇;基于主題相似度的排序?qū)W習(xí)算法研究[D];南京大學(xué);2016年
6 王彬;自動(dòng)重復(fù)缺陷報(bào)告檢測(cè)方法研究[D];華東師范大學(xué);2016年
7 裴運(yùn)亮;基于切詞和語義的中文相似度研究與應(yīng)用[D];電子科技大學(xué);2011年
8 李磊;虛擬教學(xué)實(shí)驗(yàn)方案相似度的分析和度量[D];華中科技大學(xué);2009年
9 荊路;基于本體的文本相似度研究與實(shí)現(xiàn)[D];沈陽工業(yè)大學(xué);2009年
10 劉青磊;漢語詞語及句子相似度算法研究與應(yīng)用[D];電子科技大學(xué);2011年
,本文編號(hào):550914
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/550914.html