社交網(wǎng)絡(luò)用戶影響力評估算法研究與分布式實現(xiàn)
發(fā)布時間:2017-06-29 18:07
本文關(guān)鍵詞:社交網(wǎng)絡(luò)用戶影響力評估算法研究與分布式實現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:以微博為代表的新型社交網(wǎng)絡(luò)不同于傳統(tǒng)網(wǎng)絡(luò),其信息傳播和擴散主要依賴于海量用戶之間的關(guān)系。如何使信息被更多的用戶所接收,即用戶影響力最大化問題,已經(jīng)成為社交網(wǎng)絡(luò)平臺及其應(yīng)用的研究熱點。但是由于用戶數(shù)據(jù)量巨大,傳統(tǒng)集中式數(shù)據(jù)處理方式在海量數(shù)據(jù)集處理方面的高成本、低效率的限制,使得目前對于用戶影響力的研究成果并不突出,平臺上海量數(shù)據(jù)資源也沒有得到充分利用。PageRank算法是由Google開發(fā)的用于評估頁面等級的算法,該算法以頁面的鏈出和鏈入情況來對頁面等級進行評估。論文將社交網(wǎng)絡(luò)用戶之間的相互關(guān)注關(guān)系抽象為頁面之間的鏈出和鏈入關(guān)系,將PageRank算法應(yīng)用于用戶影響力的分析研究中,并將用戶追隨者的質(zhì)量,即追隨者的影響力的情況也作為重要的參考因素。并以此,設(shè)計了一種改進的用戶影響力評估算法——URank算法。論文給出了URank算法的設(shè)計思路和詳細實現(xiàn)過程。粒子群PSO優(yōu)化算法是一種群體智能算法,以其收斂快、易實現(xiàn)等優(yōu)點受到學(xué)術(shù)界廣泛的重視。由于用戶影響力分析也是一種優(yōu)化設(shè)計,因此論文提出一種基于PSO算法的用戶影響力評估算法——PsoRank算法。算法綜合考慮用戶自身因素和其追隨者質(zhì)量對用戶影響力的影響,擴展了常見的用戶影響力評估算法所依賴的參考因素。該算法在對用戶影響力進行評估時,以用戶自身質(zhì)量,即用戶的粉絲數(shù)、發(fā)布信息的頻率和信息被轉(zhuǎn)發(fā)率/被評論以及用戶是否認證等因素為基礎(chǔ),以用戶追隨者的質(zhì)量為條件,并且將用戶影響力增量因子作為算法的適應(yīng)度函數(shù)來判斷是否對用戶的影響力進行更新。從多方面保證算法評估出的用戶影響力的合理性和公正性。為了使提出的算法能夠適應(yīng)海量數(shù)據(jù)處理,論文提出將URank和PsoRank算法按照MapReduce分布式并行化編程模型將論文設(shè)計的用戶影響力評估算法改編成分布式并行化程序。論文用真實的從新浪微博平臺爬取的數(shù)據(jù)在Hadoop集群上對論文提出的分布式并行化URank和PsoRank算法進行實驗驗證。實驗結(jié)果表明,相對于其它的用戶影響力評估算法,論文提出的用戶影響力評估算法可以更公正合理地反映用戶真實的影響力大小。并且集群性能分析結(jié)果也表明,論文提出的并行化算法具有良好的加速比和計算效率比。因此論文提出的分布式并行化用戶影響力評估算法較適合像新浪微博這樣的大型社交網(wǎng)絡(luò)平臺。
【關(guān)鍵詞】:社交網(wǎng)絡(luò) 用戶影響力 粒子群算法 PageRank MapReduce
【學(xué)位授予單位】:江蘇大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP393.092;TP18
【目錄】:
- 摘要4-6
- ABSTRACT6-11
- 第一章 緒論11-19
- 1.1 研究背景及意義11-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-17
- 1.2.1 社交網(wǎng)絡(luò)用戶影響力分析12-15
- 1.2.2 基于Hadoop平臺的分布式并行算法設(shè)計15-17
- 1.3 論文的主要工作17-18
- 1.4 論文的組織結(jié)構(gòu)18-19
- 第二章 相關(guān)理論和技術(shù)簡介19-30
- 2.1 常用的社交網(wǎng)絡(luò)用戶影響力評估算法19-21
- 2.1.1 基于PageRank的評估算法19
- 2.1.2 基于URL追蹤的評估算法19-20
- 2.1.3 基于用戶聯(lián)系強度的評估算法20
- 2.1.4 基于節(jié)點相關(guān)原則的評估算法20-21
- 2.2 經(jīng)典粒子群優(yōu)化算法21-22
- 2.2.1 粒子群優(yōu)化算法簡介21-22
- 2.2.2 相比于其它群體智能優(yōu)化算法的優(yōu)勢22
- 2.3 Hadoop平臺關(guān)鍵技術(shù)22-29
- 2.3.1 分布式并行化編程模型MapReduce22-26
- 2.3.2 分布式文件系統(tǒng)HDFS26-27
- 2.3.3 分布式文件存儲系統(tǒng)HBase27-29
- 2.4 本章小結(jié)29-30
- 第三章 基于PageRank的評估算法URank研究與設(shè)計30-40
- 3.1 PageRank算法分析30-33
- 3.1.1 PageRank算法基本原理30-32
- 3.1.2 PageRank算法適用環(huán)境32-33
- 3.2 基于改進PageRank算法的URank算法設(shè)計33-36
- 3.2.1 URank算法設(shè)計思想33-34
- 3.2.2 URank算法設(shè)計34-35
- 3.2.3 URank算法實現(xiàn)35-36
- 3.3 基于MapReduce的URank算法并行化實現(xiàn)36-38
- 3.3.1 算法并行設(shè)計思想36-37
- 3.3.2 算法并行化實現(xiàn)37-38
- 3.4 本章小結(jié)38-40
- 第四章 基于粒子群優(yōu)化的評估算法PsoRank研究與設(shè)計40-48
- 4.1 粒子群優(yōu)化算法基本原理40-41
- 4.2 基于改進粒子群優(yōu)化算法的PsoRank算法設(shè)計41-44
- 4.2.1 PsoRank算法設(shè)計思想41
- 4.2.2 PsoRank算法設(shè)計與實現(xiàn)41-44
- 4.2.3 對粒子群算法的改進44
- 4.3 基于MapReduce的PsoRank算法并行化實現(xiàn)44-47
- 4.3.1 算法并行化設(shè)計思想44-45
- 4.3.2 算法并行化實現(xiàn)45-47
- 4.4 本章小結(jié)47-48
- 第五章 實驗平臺搭建與實驗結(jié)果分析48-67
- 5.1 實驗平臺搭建48-51
- 5.1.1 Hadoop集群搭建流程48-51
- 5.1.2 HBase數(shù)據(jù)庫系統(tǒng)配置51
- 5.2 實驗數(shù)據(jù)獲取與分析51-53
- 5.3 實驗數(shù)據(jù)預(yù)處理與數(shù)據(jù)存儲53-61
- 5.3.1 實驗數(shù)據(jù)預(yù)處理53-58
- 5.3.2 實驗數(shù)據(jù)存儲58-61
- 5.4 實驗平臺性能分析61-62
- 5.5 實驗結(jié)果分析62-66
- 5.6 本章小結(jié)66-67
- 第六章 總結(jié)與展望67-69
- 6.1 總結(jié)67-68
- 6.2 展望68-69
- 參考文獻69-73
- 致謝73-74
- 攻讀碩士學(xué)位期間發(fā)表的論文74
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 李號;張保穩(wěn);張京海;楊冰;;一種網(wǎng)絡(luò)空間實體信用動態(tài)評估算法[J];信息安全與通信保密;2014年02期
2 吳同;韓臻;;基于類選的電子證據(jù)評估算法[J];北京交通大學(xué)學(xué)報;2013年05期
3 楊林;陶慶云;全惠云;;求解矩形物體布局問題的分布評估算法[J];湖南師范大學(xué)自然科學(xué)學(xué)報;2007年03期
4 侯碧,
本文編號:498792
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/498792.html
最近更新
教材專著