基于鏈接分析和用戶興趣的微博社區(qū)發(fā)現(xiàn)算法
本文關(guān)鍵詞:基于鏈接分析和用戶興趣的微博社區(qū)發(fā)現(xiàn)算法,,由筆耕文化傳播整理發(fā)布。
【摘要】:微博作為一種新興的社交媒體,近幾年發(fā)展迅速,影響越來越廣泛,逐漸成為一種重要的交流平臺(tái)。微博網(wǎng)絡(luò)的大量用戶組成了不同的虛擬社區(qū),有效挖掘具有網(wǎng)絡(luò)結(jié)構(gòu)內(nèi)聚性和用戶興趣內(nèi)聚性的微博社區(qū),對(duì)于提高微博個(gè)性化推薦、微博市場(chǎng)營(yíng)銷以及鏈接預(yù)測(cè)的準(zhǔn)確性具有重要意義。目前,經(jīng)典的社區(qū)劃分算法大多缺乏對(duì)節(jié)點(diǎn)之間的鏈接關(guān)系以及節(jié)點(diǎn)內(nèi)容的綜合考慮,其劃分出的社區(qū)普遍具有較低的興趣內(nèi)聚性。現(xiàn)有的基于節(jié)點(diǎn)之間的鏈接關(guān)系和節(jié)點(diǎn)內(nèi)容的社區(qū)劃分算法主要是通過分析用戶所發(fā)的微博內(nèi)容獲得用戶的興趣信息。而用戶發(fā)布的微博內(nèi)容通常包含大量的噪音信息并且微博的發(fā)布具有很大的隨意性,這使得微博內(nèi)容難于準(zhǔn)確反映用戶的興趣;谝陨媳尘,本文分析了用戶資料,分析發(fā)現(xiàn)用戶資料信息可以很好的反應(yīng)用戶的特點(diǎn),本文將這些信息統(tǒng)一稱為用戶的興趣信息。論文針對(duì)微博社區(qū)發(fā)現(xiàn)問題展開研究,在對(duì)已有的社區(qū)發(fā)現(xiàn)算法進(jìn)行分析總結(jié)的基礎(chǔ)上,根據(jù)微博網(wǎng)絡(luò)的特點(diǎn),提出一種基于用戶之間的鏈接關(guān)系和用戶興趣的微博社區(qū)發(fā)現(xiàn)算法,使得劃分的社區(qū)能夠更好的反映真實(shí)的社會(huì)關(guān)系,達(dá)到網(wǎng)絡(luò)結(jié)構(gòu)內(nèi)聚性和興趣內(nèi)聚性。論文的主要研究?jī)?nèi)容如下:首先,論文介紹了復(fù)雜網(wǎng)絡(luò)中常用的經(jīng)典社區(qū)發(fā)現(xiàn)算法,對(duì)比分析算法在微博社區(qū)發(fā)現(xiàn)中存在的優(yōu)勢(shì)及不足;對(duì)已有的社區(qū)評(píng)價(jià)方法進(jìn)行了分類和介紹,并對(duì)網(wǎng)絡(luò)分析工具作了簡(jiǎn)單的描述。其次,介紹了兩個(gè)比較著名的微博平臺(tái),并對(duì)微博網(wǎng)絡(luò)的特點(diǎn)進(jìn)行了簡(jiǎn)單的描述;分析了微博網(wǎng)絡(luò)中常用的兩種社區(qū)發(fā)現(xiàn)算法存在的不足,然后引出了基于用戶興趣的社區(qū)發(fā)現(xiàn)技術(shù)。最后,論文分析了微博用戶的鏈接關(guān)系和用戶興趣,推導(dǎo)出鏈接相似度公式和用戶興趣相似度公式,結(jié)合兩者計(jì)算出用戶之間的總相似度。根據(jù)用戶之間的總相似度將微博網(wǎng)絡(luò)轉(zhuǎn)換成一個(gè)無向有權(quán)網(wǎng)絡(luò),在Louvain算法的基礎(chǔ)上本文提出一種新的社區(qū)劃分算法對(duì)微博網(wǎng)絡(luò)進(jìn)行社區(qū)劃分。使用社會(huì)網(wǎng)絡(luò)分析工具Pajek對(duì)社區(qū)進(jìn)行可視化,得到社區(qū)的可視化效果,對(duì)社區(qū)有了更加直觀的認(rèn)識(shí),通過引入不同的社區(qū)評(píng)價(jià)指標(biāo)與已有的社區(qū)發(fā)現(xiàn)算法進(jìn)行對(duì)比,驗(yàn)證了本文方法的有效性。
【關(guān)鍵詞】:微博網(wǎng)絡(luò) 社區(qū)發(fā)現(xiàn) 鏈接分析 用戶興趣
【學(xué)位授予單位】:蘭州交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP393.092;O157.5
【目錄】:
- 摘要4-5
- Abstract5-9
- 1 緒論9-14
- 1.1 研究背景及意義9-10
- 1.2 研究現(xiàn)狀10-11
- 1.3 本文主要研究?jī)?nèi)容11-12
- 1.4 本文組織結(jié)構(gòu)12-14
- 2 復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)研究及相關(guān)技術(shù)介紹14-28
- 2.1 圖論14-16
- 2.2 社區(qū)定義16-18
- 2.3 經(jīng)典社區(qū)發(fā)現(xiàn)算法18-22
- 2.3.1 KL算法18
- 2.3.2 譜平分法18-19
- 2.3.3 GN算法和快速Newman算法19-21
- 2.3.4 LPA算法21-22
- 2.3.5 Louvain算法22
- 2.4 社區(qū)評(píng)價(jià)方法22-26
- 2.5 網(wǎng)絡(luò)分析工具Pajek26-27
- 2.6 本章小結(jié)27-28
- 3 微博社區(qū)發(fā)現(xiàn)相關(guān)理論和技術(shù)28-36
- 3.1 微博相關(guān)介紹28-32
- 3.1.1 Twitter28-29
- 3.1.2 新浪微博29-32
- 3.2 微博社區(qū)發(fā)現(xiàn)相關(guān)方法分析32-35
- 3.2.1 基于鏈接分析的社區(qū)發(fā)現(xiàn)方法32-33
- 3.2.2 基于博文內(nèi)容的社區(qū)發(fā)現(xiàn)方法33-34
- 3.2.3 基于用戶興趣的社區(qū)發(fā)現(xiàn)方法34-35
- 3.3 本章小結(jié)35-36
- 4 基于鏈接分析和用戶興趣的微博社區(qū)發(fā)現(xiàn)36-43
- 4.1 鏈接相似度36-37
- 4.1.1 共同關(guān)注和共同粉絲相似度36-37
- 4.1.2 轉(zhuǎn)發(fā)相似度37
- 4.2 興趣相似度37-39
- 4.2.1 所在地信息相似度37-38
- 4.2.2 用戶標(biāo)簽信息相似度38
- 4.2.3 用戶簡(jiǎn)介信息相似度和總的興趣相似度38-39
- 4.3 用戶總的相似度39
- 4.4 社區(qū)分類算法39-42
- 4.5 本章小結(jié)42-43
- 5 實(shí)驗(yàn)結(jié)果及評(píng)價(jià)43-51
- 5.1 數(shù)據(jù)采集43-45
- 5.2 實(shí)驗(yàn)結(jié)果與分析45-50
- 5.2.1 使用數(shù)據(jù)集1進(jìn)行實(shí)驗(yàn)46-48
- 5.2.2 使用數(shù)據(jù)集2進(jìn)行實(shí)驗(yàn)48-49
- 5.2.3 實(shí)驗(yàn)結(jié)果分析49-50
- 5.3 本章小結(jié)50-51
- 6 總結(jié)與展望51-53
- 6.1 結(jié)論51-52
- 6.2 展望52-53
- 致謝53-54
- 參考文獻(xiàn)54-58
- 攻讀碩士期間的研究成果及參加的科研項(xiàng)目58
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前10條
1 邵秀麗;乜聚科;侯樂彩;田振雷;;基于綜合用戶信息的用戶興趣建模研究[J];南開大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年03期
2 王開選;;結(jié)構(gòu)模型對(duì)用戶興趣變化的適應(yīng)研究[J];今日科苑;2008年24期
3 勾智楠;;基于用戶興趣的多屬性效用算法的研究[J];河北工業(yè)科技;2012年02期
4 宋雅婷;徐天偉;;基于用戶興趣的個(gè)性化推薦技術(shù)綜述[J];云南大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年S1期
5 南智敏;錢松榮;;引入漂移特性的用戶興趣模型優(yōu)化研究[J];微型電腦應(yīng)用;2012年03期
6 伍大清;陽小華;馬家宇;胡東;吳取勁;;基于隱式反饋的用戶興趣漂移方法[J];計(jì)算機(jī)應(yīng)用與軟件;2010年09期
7 曹毅;賀衛(wèi)紅;;基于用戶興趣的混合推薦模型[J];系統(tǒng)工程;2009年06期
8 張瑜;袁方;;基于用戶興趣的個(gè)性化信息檢索方法[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2006年03期
9 王道平;李志隆;楊岑;;基于熱門物品懲罰和用戶興趣變化的知識(shí)推送算法[J];系統(tǒng)工程;2014年01期
10 王有為;張健斌;;一種新的層次結(jié)構(gòu)網(wǎng)站用戶興趣模式變化識(shí)別算法[J];系統(tǒng)工程理論與實(shí)踐;2008年10期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫 前7條
1 趙琦;駱志剛;田文穎;李聰;丁凡;;一種基于負(fù)反饋信息的用戶興趣模型修正方法[A];中國(guó)通信學(xué)會(huì)第六屆學(xué)術(shù)年會(huì)論文集(下)[C];2009年
2 孫靜;郭奇;張志強(qiáng);馮建華;;一種基于面向領(lǐng)域檢索系統(tǒng)的用戶興趣獲取方法[A];第二十一屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
3 孫鐵利;教巍巍;;基于馬爾科夫模型的用戶興趣導(dǎo)航模型系統(tǒng)(英文)[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展——全國(guó)第17屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2006年
4 廖祝華;劉建勛;易愛平;;基于用戶興趣的Web服務(wù)發(fā)現(xiàn)[A];2006年全國(guó)開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(三)[C];2006年
5 李曉黎;史忠植;梁永全;劉福桃;;INTERNET網(wǎng)上一種識(shí)別用戶興趣的學(xué)習(xí)方法[A];第十六屆全國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集[C];1999年
6 田萱;杜小勇;;基于SAM模型的用戶興趣表示研究[A];第二十三屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年
7 王勇;劉奕群;張敏;馬少平;茹立云;;基于用戶興趣分析的網(wǎng)頁生命周期建模(英文)[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫 前1條
1 中國(guó)科學(xué)院計(jì)算技術(shù)研究所 王 斌;內(nèi)容為王[N];計(jì)算機(jī)世界;2004年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前9條
1 梁政;面向在線社交網(wǎng)絡(luò)輿情的信息傳播分析關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年
2 張召;在線論壇用戶興趣圖譜發(fā)現(xiàn)與個(gè)性化信息推薦[D];華東師范大學(xué);2012年
3 劉淇;基于用戶興趣建模的推薦方法及應(yīng)用研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年
4 郭巖;網(wǎng)絡(luò)日志中用戶興趣的挖掘及利用[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年
5 吳麗輝;個(gè)性化的Web信息采集技術(shù)研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
6 謝興;社會(huì)網(wǎng)絡(luò)中興趣發(fā)現(xiàn)與信息組織的研究[D];復(fù)旦大學(xué);2011年
7 李東勝;基于興趣與保護(hù)隱私的在線社區(qū)推薦技術(shù)研究[D];復(fù)旦大學(xué);2012年
8 陳浩;Web搜索的用戶興趣與智能優(yōu)化研究[D];中南大學(xué);2012年
9 姜邵巍;基于競(jìng)爭(zhēng)關(guān)系的推薦技術(shù)研究[D];北京郵電大學(xué);2014年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 梁潤(rùn)庭(Runting Leung);面向微博用戶的興趣識(shí)別算法的研究與實(shí)現(xiàn)[D];西南交通大學(xué);2015年
2 崔瑞飛;微博興趣社區(qū)發(fā)現(xiàn)及其熱議話題檢測(cè)技術(shù)研究[D];解放軍信息工程大學(xué);2014年
3 于巖;基于用戶影響力的用戶興趣建模方法研究[D];解放軍信息工程大學(xué);2015年
4 米鵬;面向社區(qū)用戶的推薦策略研究[D];北方工業(yè)大學(xué);2016年
5 樊夢(mèng)佳;節(jié)點(diǎn)內(nèi)容和鏈接關(guān)系相融合的微博用戶興趣社區(qū)發(fā)現(xiàn)[D];北京信息科技大學(xué);2015年
6 黃宏亮;基于用戶興趣差異化的概念汽車設(shè)計(jì)研究[D];華中科技大學(xué);2014年
7 雷滋和;基于微博用戶的新聞推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西南交通大學(xué);2016年
8 高健明;基于多源數(shù)據(jù)融合的微博用戶興趣挖掘方法[D];哈爾濱工業(yè)大學(xué);2016年
9 杜雨萌;微博用戶興趣識(shí)別技術(shù)的研究與應(yīng)用[D];哈爾濱工業(yè)大學(xué);2016年
10 王夏陽;基于關(guān)聯(lián)分析的用戶興趣漂移挖掘算法研究[D];中國(guó)民航大學(xué);2016年
本文關(guān)鍵詞:基于鏈接分析和用戶興趣的微博社區(qū)發(fā)現(xiàn)算法,由筆耕文化傳播整理發(fā)布。
本文編號(hào):443076
本文鏈接:http://sikaile.net/kejilunwen/yysx/443076.html