社區(qū)發(fā)現(xiàn)算法的研究及其在代碼托管平臺(tái)的應(yīng)用
本文關(guān)鍵詞: 社交網(wǎng)絡(luò) 復(fù)雜網(wǎng)絡(luò) 社區(qū)發(fā)現(xiàn) 網(wǎng)絡(luò)爬蟲 出處:《西南交通大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
【摘要】:互聯(lián)網(wǎng)技術(shù)的發(fā)展,推動(dòng)著諸如微博、知乎、Facebook、Twitter等在線社交媒體的快速發(fā)展,從而形成了巨大的社交網(wǎng)絡(luò)。社交網(wǎng)絡(luò)是人們真實(shí)世界的一種延伸,符合真實(shí)社會(huì)的某些特征,能夠反映人們的社會(huì)屬性和偏好,研究如何從這類網(wǎng)絡(luò)中發(fā)現(xiàn)有價(jià)值的潛在社區(qū)成了近年來的熱點(diǎn)。與此同時(shí),以Git和開源項(xiàng)目為基礎(chǔ)的代碼托管平臺(tái)也蓬勃發(fā)展起來,隨著越來越多開發(fā)者的參與,形成了龐大的開發(fā)者網(wǎng)絡(luò)社區(qū)。不可否認(rèn),開發(fā)者是互聯(lián)網(wǎng)科技快速發(fā)展的中堅(jiān)力量,研究如何幫助開發(fā)者更好的交流和協(xié)作具有十分重要的意義。本文以最具代表性的代碼托管平臺(tái)——GitHub為研究對(duì)象,提出了一套基于代碼托管平臺(tái)的社區(qū)發(fā)現(xiàn)方法。首先基于GitHub網(wǎng)站爬取到的數(shù)據(jù),提出了一種基于代碼倉庫編程語言類型的用戶建模方法;并在此基礎(chǔ)上設(shè)計(jì)了一種構(gòu)建網(wǎng)絡(luò)拓?fù)鋱D的方法;然后對(duì)傳統(tǒng)FastUnfolding算法進(jìn)行改進(jìn),并對(duì)所構(gòu)建的網(wǎng)絡(luò)拓?fù)鋱D進(jìn)行社區(qū)發(fā)現(xiàn)研究。本文主要工作包括如下幾方面:1.完成定向網(wǎng)絡(luò)爬蟲的設(shè)計(jì),利用網(wǎng)絡(luò)爬蟲收集網(wǎng)頁數(shù)據(jù),并進(jìn)行預(yù)處理操作,獲得實(shí)驗(yàn)數(shù)據(jù)。2.基于代碼倉庫的編程語言類型,提出一種用戶建模的方法,并給出了兩個(gè)用戶模型之間邊的定義以及邊權(quán)重的計(jì)算方法,完成帶權(quán)網(wǎng)絡(luò)拓?fù)鋱D的構(gòu)建。3.對(duì)傳統(tǒng)的社區(qū)發(fā)現(xiàn)算法進(jìn)行研究,針對(duì)傳統(tǒng)FastUnfolding算法在每次迭代計(jì)算邊權(quán)的過程中忽略了部分節(jié)點(diǎn)特性的問題,提出一種基于重構(gòu)用戶模型的權(quán)重計(jì)算方法。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的算法對(duì)社區(qū)劃分結(jié)果的模塊度Q值有一定的提升。在實(shí)驗(yàn)統(tǒng)計(jì)分析的基礎(chǔ)上,提出了一種簡(jiǎn)化的用戶模型,對(duì)比實(shí)驗(yàn)結(jié)果表明,簡(jiǎn)化模型可以獲得更高的模塊度Q值。4.設(shè)計(jì)并實(shí)現(xiàn)了基于社區(qū)劃分結(jié)果的推薦系統(tǒng),該系統(tǒng)實(shí)現(xiàn)了社區(qū)劃分結(jié)果和用戶模型的可視化展示,并可為用戶推薦其所在社區(qū)的其他用戶以及與其他用戶相關(guān)的代碼倉庫信息。
[Abstract]:......
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP393.09;O157.5
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 周小平;梁循;張海燕;;基于R-C模型的微博用戶社區(qū)發(fā)現(xiàn)[J];軟件學(xué)報(bào);2014年12期
2 蔡波斯;陳翔;;基于行為相似度的微博社區(qū)發(fā)現(xiàn)研究[J];計(jì)算機(jī)工程;2013年08期
3 何翔;顧春華;丁軍;;基于微博的主題社區(qū)發(fā)現(xiàn)[J];計(jì)算機(jī)應(yīng)用與軟件;2013年06期
4 封海岳;薛安榮;;基于重疊模塊度的社區(qū)離群點(diǎn)檢測(cè)[J];計(jì)算機(jī)應(yīng)用與軟件;2013年05期
5 閆光輝;舒昕;馬志程;李祥;;基于主題和鏈接分析的微博社區(qū)發(fā)現(xiàn)算法[J];計(jì)算機(jī)應(yīng)用研究;2013年07期
6 方平;李芝棠;涂浩;郭正彪;;復(fù)雜網(wǎng)絡(luò)局部社區(qū)挖掘的節(jié)點(diǎn)接近度算法[J];計(jì)算機(jī)工程與應(yīng)用;2013年17期
7 王莉軍;楊炳儒;翟云;謝永紅;;動(dòng)態(tài)社區(qū)發(fā)現(xiàn)算法的研究進(jìn)展[J];計(jì)算機(jī)應(yīng)用研究;2011年09期
8 黃發(fā)良;肖南峰;;基于線圖與PSO的網(wǎng)絡(luò)重疊社區(qū)發(fā)現(xiàn)[J];自動(dòng)化學(xué)報(bào);2011年09期
9 張聰;沈惠璋;李峰;;復(fù)雜網(wǎng)絡(luò)中社團(tuán)結(jié)構(gòu)劃分的快速分裂算法[J];計(jì)算機(jī)應(yīng)用研究;2011年04期
10 黃發(fā)良;;信息網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)及其應(yīng)用研究[J];復(fù)雜系統(tǒng)與復(fù)雜性科學(xué);2010年01期
,本文編號(hào):1534140
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/1534140.html