天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

異構信息網絡中基于聚類的社區(qū)發(fā)現(xiàn)方法研究

發(fā)布時間:2021-03-06 09:55
  社區(qū)發(fā)現(xiàn)是數(shù)據挖掘的基礎,通過社區(qū)發(fā)現(xiàn)可以了解節(jié)點在網絡中的重要程度和不同關聯(lián)節(jié)點,同時可以挖掘網絡內部不同的節(jié)點信息,引導后續(xù)的網絡推薦推薦系統(tǒng)以及預測網絡的未來走向趨勢�,F(xiàn)有的社區(qū)發(fā)現(xiàn)算法的大多適用環(huán)境都是同構信息網絡,因為同構信息網絡節(jié)點關系單一,從直觀上可以進行描述,方便理解。然而,隨著網絡的發(fā)展,現(xiàn)有的信息網絡大多包含有多種類型的節(jié)點及鏈接關系,不同節(jié)點之間的鏈接關系可能代表著不同的語義信息,同一條鏈接關系也可能擁有不同的表述含義,我們將這種類型的信息網絡稱之為異構信息網絡。異構信息網絡對于節(jié)點的信息表達更加全面、精確,但是相對于以同構網絡結構來進行社區(qū)發(fā)現(xiàn)將面臨更多的困難與挑戰(zhàn)。本文在借鑒現(xiàn)有研究成果的基礎上,提出了一種適用于現(xiàn)有的異構信息網絡的社區(qū)發(fā)現(xiàn)算法框架HCDClus(Heterogeneous Community Detection Cluster)。算法框架HCDClus主要包含兩個部分:融合多條元路徑的異構網絡相似性度量算法HCBOWSMVA(Heterogeneous Continuous Bag of Words... 

【文章來源】:內蒙古科技大學內蒙古自治區(qū)

【文章頁數(shù)】:58 頁

【學位級別】:碩士

【部分圖文】:

異構信息網絡中基于聚類的社區(qū)發(fā)現(xiàn)方法研究


異質網絡結構類型

信息網絡,異構


內蒙古科技大學碩士學位論文-3-異構信息網絡的異構性主要表現(xiàn)以下幾個方面:1、節(jié)點類型的多樣性,譬如在DBLP數(shù)據集中,節(jié)點類型就包含有作者,論文,關鍵字,期刊等類型;2、鏈接關系的多樣性,譬如論文與期刊之間有發(fā)表關系,論文和關鍵字之間存在包含關系等等;3、網絡節(jié)點的重要性也會有區(qū)分,譬如在DBLP數(shù)據集中,論文與作者的重要程度應大于其他類型節(jié)點[20]。下面來詳細介紹異構信息網絡中的一些相關定義。定義1異構信息網絡:異構信息網絡是包含多種節(jié)點與關系的信息網絡[21],也可以用圖G來表示。節(jié)點用V來表示,鏈接關系用E來表示,那么節(jié)點的類型集合表示為T,鏈接關系所屬的類型集合表示為R。當且僅當節(jié)點類型集合|T|>1或者鏈接關系類型|R|>1時,這個網絡就可以稱之為異構信息網絡。如果|T|=1和|R|=1則G為同構信息網絡。該網絡可以用公式表示為:G=V,E,T,R,,,(式1-1)其中,φ表示的是節(jié)點間的關系映射,表示的是節(jié)點的類型映射,ψ表示的是鏈接關系的類型映射。顯然,含有不同類型節(jié)點和不同鏈接關系類型的異構信息網絡會包含有更加豐富的網絡結構信息。如果網絡中只包含有一種類型的節(jié)點,但是有多種不同的鏈接關系,這種網絡類型也稱為多關系網絡,一般應用于社會網絡等等[22]。如果網絡中只包含多種類型的節(jié)點,同時也有多種不同的鏈接關系,這種網絡類型就稱為多模式網絡[23]。如圖1.2所示的兩個網絡就是典型的異構信息網絡。圖1.2(a)中電影推薦系統(tǒng)中包含了用戶、電影、導演、演員等的節(jié)點類型,圖1.2(b)中DBLP數(shù)據集也是一種多模式網絡,包含了作者、論文、關鍵字、期刊等節(jié)點類型。圖1.2異構信息網絡

聚類過程,論文,社區(qū)


內蒙古科技大學碩士學位論文-7-NS-Clus圖1.5論文合作網絡的聚類過程1.4論文組織結構本文的論文具體結構如下:第一章為緒論,主要是介紹了本文的研究背景、目的與意義以及具體研究內容等。研究背景主要介紹了社區(qū)發(fā)現(xiàn)的發(fā)展歷程、異構信息網絡提出的原因與發(fā)展以及異構信息網絡中存在的一些基本概念等內容;課題研究的目的與意義主要介紹了當前的社區(qū)發(fā)現(xiàn)算法在發(fā)展過程中存在的一些問題,引出了本文在異構信息網絡中進行社區(qū)發(fā)現(xiàn)的原因;最后介紹了本文的研究內容,即本文選用在相似性度量的基礎上進行聚類的這種社區(qū)發(fā)現(xiàn)算法的原因以及具體的流程。第二章分別介紹了在同構信息網絡異構信息網絡中進行社區(qū)發(fā)現(xiàn)所存在的問題以及不同信息網絡社區(qū)發(fā)現(xiàn)的發(fā)展過程及所提出經典的社區(qū)發(fā)現(xiàn)算法,同時在對比不同社區(qū)發(fā)現(xiàn)算法的優(yōu)缺點后,提出自己的社區(qū)發(fā)現(xiàn)算法框架。第三章主要是進行社區(qū)發(fā)現(xiàn)聚類算法的基礎-相似性度量算法,詳細介紹了本文的相似性度量算法HCBOW-SMVA算法。該算法是通過融合多條元路徑來進行相似性度量,因此需要計算出每條有效元路徑的權重以及當前元路徑下的任意節(jié)點間的相似性。其具體算法是分別對每條元路徑下的路徑實例進行了相似性度量,然后結合權重信息,獲取了所有節(jié)點的節(jié)點向量化表示,然后根據得到節(jié)點向量,利用節(jié)點向量趨向性通過空間中的余弦相似度來進行相似度的計算。第四章介紹基于新的相似性度量指標進行聚類算法的基本思想和具體過程。詳細描述基于新的相似性進行聚類的社區(qū)發(fā)現(xiàn)算法過程,包括種子節(jié)點的選取,節(jié)點聚類和初

【參考文獻】:
期刊論文
[1]基于深度神經網絡結構的互聯(lián)網金融市場動態(tài)預測[J]. 趙洪科,吳李康,李徵,張兮,劉淇,陳恩紅.  計算機研究與發(fā)展. 2019(08)
[2]基于LSTM和多特征組合的電影評論專業(yè)程度分類[J]. 吳璠,李壽山,周國棟.  計算機科學. 2019(S1)
[3]基于雙向量模型的自適應微博話題追蹤方法[J]. 黃暢,郭文忠,郭昆.  小型微型計算機系統(tǒng). 2019(06)
[4]基于拉普拉斯矩陣在Star網絡中應用研究[J]. 鄧鳳茹,陳博海,王曉龍.  北華航天工業(yè)學院學報. 2019(01)
[5]一種基于抽樣改進加權核K-means的大數(shù)據譜聚類算法[J]. 金海,張勁松,吳睿.  測繪通報. 2018(11)
[6]異質信息網絡中基于元路徑的社團發(fā)現(xiàn)算法研究[J]. 鄭玉艷,王明省,石川,王銳.  中文信息學報. 2018(09)
[7]面向復雜有權網絡的社區(qū)發(fā)現(xiàn)方法研究[J]. 譚紅葉,吳永科,張虎,劉全明,李茹.  中文信息學報. 2018(08)
[8]A New Algorithm for Literature Recommendation Based on a Bibliographic Heterogeneous Information Network[J]. LI Linna,WANG Lijun,JIANG Xueqin,HAN Hongqi,ZHAI Yun.  Chinese Journal of Electronics. 2018(04)
[9]關系對異質群體行為選擇的影響——基于人際關系網絡調查數(shù)據的實證研究[J]. 賀尊,徐黎黎,賀嘉貝.  中南民族大學學報(人文社會科學版). 2018(01)
[10]一種基于關鍵詞的微博話題聚類算法[J]. 林丹,劉建明,谷志瑜.  計算機應用與軟件. 2018(01)

碩士論文
[1]基于主題與結構的社區(qū)發(fā)現(xiàn)方法研究[D]. 劉亞瓊.山東農業(yè)大學 2019
[2]復雜網絡中社區(qū)發(fā)現(xiàn)算法的研究[D]. 金爽.云南財經大學 2018
[3]基于k-最近鄰網絡和模板法符號轉移熵的腦電節(jié)律信號分析[D]. 余嫻.南京郵電大學 2017
[4]大規(guī)模異構信息網絡社區(qū)發(fā)現(xiàn)算法與社區(qū)特征研究[D]. 張正林.北京郵電大學 2017
[5]基于元路徑選擇和融合的異構信息網絡社區(qū)挖掘算法研究[D]. 李立.西安電子科技大學 2014



本文編號:3066889

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3066889.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶4ed44***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com