社交網(wǎng)絡節(jié)點分類技術(shù)研究
本文關鍵詞:社交網(wǎng)絡節(jié)點分類技術(shù)研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著Internet的迅速發(fā)展,使得人們通過網(wǎng)絡進行互聯(lián)的溝通方式也得了極大發(fā)展,這也形成了社交網(wǎng)絡這一新興的網(wǎng)絡基本形態(tài)。社交網(wǎng)絡是現(xiàn)實世界人與人之間溝通的網(wǎng)絡虛擬化,尤其是近年來社交網(wǎng)絡(如:Facebook、騰訊、微博)的迅猛發(fā)展,吸引了眾多領域?qū)W者對社交網(wǎng)絡中數(shù)據(jù)進行挖掘分析的廣泛關注,從而促進了以廣告宣傳、公共服務、營銷、學術(shù)交流等為目的的社交網(wǎng)絡研究。分類問題作為數(shù)據(jù)挖掘分析的一種方式,也被應用在社交網(wǎng)絡之中,通過對網(wǎng)絡中節(jié)點進行分類,通過標簽對節(jié)點的這些興趣,愛好,關系或其他可能的特征進行捕獲,可以得出對人口的價值觀、興趣的描述,節(jié)點的信仰以及標政治或宗教信仰。通過分類技術(shù)對社交網(wǎng)絡中的節(jié)點進行標簽標記,有利于深入分析對社交結(jié)構(gòu)特征以及應用的延研究。對社交網(wǎng)絡中的節(jié)點進行分類是文本研究方向,社交網(wǎng)絡中節(jié)點可以是代表現(xiàn)實中一個人也可以是某個學校這樣的一個整體,節(jié)點包含了大量的文本、圖片、音頻、視頻等數(shù)據(jù)以及屬性。節(jié)點分類主要分為單標簽分類和多標簽分類,由于社交網(wǎng)絡內(nèi)節(jié)點含有眾多數(shù)據(jù)以及屬性,單標簽分類已經(jīng)不滿足于節(jié)點分類的要求,本文主要對節(jié)點進行多標簽分類。本文結(jié)合社交網(wǎng)絡節(jié)點特性,從兩個方面進行了節(jié)點分類技術(shù)的研究,一個方向是根據(jù)節(jié)點自身屬性分類節(jié)點,另一個是根據(jù)節(jié)點之間鏈接關系進行分類。當前根據(jù)節(jié)點屬性進行分類的相關方法存在對數(shù)據(jù)樣本的原始屬性集進行各種不同形式的約減,但分類沒有對不同的類標簽或標簽集使用不同的屬性集來加以區(qū)分,從而更好地挖掘標簽間的區(qū)別與聯(lián)系。另外,由于社交節(jié)點之間存在錯綜復雜的關系,僅考慮節(jié)點自身屬性不能夠滿足節(jié)點分類要求,還要考慮節(jié)點之間關系。因此,本文提出兩種社交網(wǎng)絡節(jié)點分類方法。首先,本文基于節(jié)點屬性,提出了一種基于K近鄰節(jié)點屬性的多標簽分類算法。算法主要思想是首先找出能夠體現(xiàn)出節(jié)點類標簽的強相關屬性,以及不能體現(xiàn)節(jié)點特征的弱相關屬性,保留強相關性屬性,去掉弱相關屬性。以此為基礎計算未標簽節(jié)點的K個近鄰,通過未標簽節(jié)點的近鄰標簽集,使用最大后驗概率計算該未標簽節(jié)點屬于各個標簽的概率,最終根據(jù)闕值得到未標簽節(jié)點的標簽集合。其次,本文結(jié)合節(jié)點關系,提出一種基于社區(qū)結(jié)構(gòu)性節(jié)點多標簽隨機游走分類算法。算法主要思想是首先對網(wǎng)絡進行社區(qū)劃分,然后將劃分社區(qū)多標簽節(jié)點數(shù)據(jù)映射到圖上,通過圖來表示網(wǎng)絡中的節(jié)點,節(jié)點之間的邊表示節(jié)點間的關系,通過隨機游走以及條件概率模型,節(jié)點與各個標簽的相似性,計算出未標簽節(jié)的從屬各個標簽的概率分布情況,從而得到節(jié)點的分類集合。最后,本文通過在兩種數(shù)據(jù)集上進行實驗,實驗結(jié)果表明本文提出的基于K近鄰的標簽屬性相關算法與其屬性相比較能夠提高分類速度,得到良好的分類結(jié)果,此外基于社區(qū)結(jié)構(gòu)性節(jié)點多標簽隨機游走算法與其他鏈接性分類算法相比在分類準確程度上也得了很好的體現(xiàn)。
【關鍵詞】:社交網(wǎng)絡 多標簽分類 K近鄰 隨機游走
【學位授予單位】:遼寧大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP311.13;TP393.09
【目錄】:
- 摘要4-6
- 英文摘要6-12
- 第1章 緒論12-19
- 1.1 研究背景及意義12-14
- 1.2 國內(nèi)外研究現(xiàn)狀14-16
- 1.2.1 基于屬性分類的研究現(xiàn)狀14-15
- 1.2.2 基于鏈接結(jié)構(gòu)的研究現(xiàn)狀15-16
- 1.3 本文主要工作與結(jié)構(gòu)安排16-19
- 1.3.1 主要工作16-17
- 1.3.2 論文結(jié)構(gòu)17-19
- 第2章 相關工作19-29
- 2.1 社交網(wǎng)絡相關概念和定義19-21
- 2.2 多標簽分類21-24
- 2.3 經(jīng)典分類算法24-26
- 2.3.1 決策樹分類24-25
- 2.3.2 貝葉斯分類25-26
- 2.3.3 支持向量機26
- 2.4 鏈接分類算法26-28
- 2.4.1 迭代分類算法26-27
- 2.4.2 馬爾可夫邏輯網(wǎng)27-28
- 2.5 本章小結(jié)28-29
- 第3章 基于K近鄰節(jié)點屬性多標簽分類算法29-40
- 3.1 問題描述29-30
- 3.2 基于K近鄰節(jié)點屬性的多標簽分類算法30-38
- 3.2.1 概念與定義30-32
- 3.2.2 K近鄰算法32-34
- 3.2.3 算法思想34-36
- 3.2.4 算法設計36-38
- 3.3 算法分析38-39
- 3.4 本章小結(jié)39-40
- 第4章 基于社區(qū)結(jié)構(gòu)性節(jié)點多標簽隨機游走算法40-50
- 4.1 問題描述40-41
- 4.2 基于社區(qū)結(jié)構(gòu)性節(jié)點多標簽隨機游走算法41-48
- 4.2.1 概念與定義41-42
- 4.2.2 隨機游走模型42-44
- 4.2.3 算法思想44-46
- 4.2.4 算法設計46-48
- 4.3 算法分析48-49
- 4.4 本章小結(jié)49-50
- 第5章 實驗結(jié)果與分析50-56
- 5.1 實驗數(shù)據(jù)集50-51
- 5.2 實驗方案51-52
- 5.2.1 基于K近鄰節(jié)點屬性的多標簽分類算法51
- 5.2.2 基于社區(qū)結(jié)構(gòu)性節(jié)點多標簽隨機游走算法51-52
- 5.3 實驗結(jié)果與分析52-55
- 5.3.1 基于K近鄰節(jié)點屬性的多標簽分類算法52-53
- 5.3.2 基于社區(qū)結(jié)構(gòu)性節(jié)點多標簽隨機游走算法53-55
- 5.4 本章小結(jié)55-56
- 第6章 總結(jié)和展望56-58
- 6.1 本文工作內(nèi)容總結(jié)56-57
- 6.2 展望57-58
- 致謝58-59
- 參考文獻59-62
- 攻讀學位期間發(fā)表的學術(shù)論文及參加科研情況62-63
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王若愚;方芳;葉昭;;流量分類技術(shù)精細管理網(wǎng)絡[J];中國教育網(wǎng)絡;2012年02期
2 馬明成;莫曉俊;姜洪臣;徐波;;音頻分類技術(shù)在廣播質(zhì)量評估中的應用[J];廣播與電視技術(shù);2010年10期
3 黃樹成;曲亞輝;;數(shù)據(jù)流分類技術(shù)研究綜述[J];計算機應用研究;2009年10期
4 張俊,石功軍,王中平;信息處理過程中的分類技術(shù)[J];聲學技術(shù);2003年04期
5 張李,涂曉東,何誠;流分類技術(shù)的研究[J];電子科技大學學報;2004年06期
6 李洋;趙驊;;基于信息熵和決策分類技術(shù)的郵件識別研究[J];計算機科學;2008年02期
7 夏雪;肖德寶;顧婷;;基于本體的報警分類技術(shù)在報警評估過程中的應用與實現(xiàn)(英文)[J];北京交通大學學報;2008年06期
8 黃敏;何中市;;分類技術(shù)在高職教學質(zhì)量評價分析中的應用[J];計算機工程與設計;2012年03期
9 王與;劉洋;;分類技術(shù)在高校教學管理中的應用[J];滁州學院學報;2011年05期
10 段巍巍;許海濱;;基于分類技術(shù)的目標客戶輔助定位方法研究[J];江蘇通信;2008年03期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 梁曉雯;閔友鋼;;音樂情感分類技術(shù)在媒體資產(chǎn)管理中的應用[A];中國新聞技術(shù)工作者聯(lián)合會2008年學術(shù)年會論文集(下)[C];2008年
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 畢夏安;高性能包分類技術(shù)及其應用研究[D];湖南大學;2012年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 周方;社交網(wǎng)絡節(jié)點分類技術(shù)研究[D];遼寧大學;2015年
2 叢蓉;基于采樣的網(wǎng)絡流量分類技術(shù)研究[D];北京郵電大學;2012年
3 朱秋香;流分類技術(shù)研究及其原型系統(tǒng)的實現(xiàn)[D];東南大學;2004年
4 張海笑;數(shù)據(jù)挖掘分類技術(shù)在高校教學中的應用研究[D];廣東工業(yè)大學;2005年
5 常慧;分類技術(shù)在稅收管理中的應用[D];鄭州大學;2003年
6 蔣杰;基于分類技術(shù)的電子支付平臺作弊賬戶的識別模型研究[D];浙江工業(yè)大學;2012年
7 陳錚;基于音樂流派分類技術(shù)的音樂庫分類檢索系統(tǒng)的研究與實現(xiàn)[D];華東師范大學;2012年
8 代麗;DFI流量分類技術(shù)的研究和實現(xiàn)[D];北京郵電大學;2011年
9 楊傳耀;數(shù)字圖書館及其分類技術(shù)的研究[D];福州大學;2004年
10 王國華;智能監(jiān)控中目標檢測與分類技術(shù)的研究[D];安徽大學;2012年
本文關鍵詞:社交網(wǎng)絡節(jié)點分類技術(shù)研究,由筆耕文化傳播整理發(fā)布。
,本文編號:336233
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/336233.html