社交網(wǎng)絡(luò)用戶影響力評(píng)估算法研究與分布式實(shí)現(xiàn)
發(fā)布時(shí)間:2017-06-29 18:07
本文關(guān)鍵詞:社交網(wǎng)絡(luò)用戶影響力評(píng)估算法研究與分布式實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:以微博為代表的新型社交網(wǎng)絡(luò)不同于傳統(tǒng)網(wǎng)絡(luò),其信息傳播和擴(kuò)散主要依賴于海量用戶之間的關(guān)系。如何使信息被更多的用戶所接收,即用戶影響力最大化問題,已經(jīng)成為社交網(wǎng)絡(luò)平臺(tái)及其應(yīng)用的研究熱點(diǎn)。但是由于用戶數(shù)據(jù)量巨大,傳統(tǒng)集中式數(shù)據(jù)處理方式在海量數(shù)據(jù)集處理方面的高成本、低效率的限制,使得目前對(duì)于用戶影響力的研究成果并不突出,平臺(tái)上海量數(shù)據(jù)資源也沒有得到充分利用。PageRank算法是由Google開發(fā)的用于評(píng)估頁面等級(jí)的算法,該算法以頁面的鏈出和鏈入情況來對(duì)頁面等級(jí)進(jìn)行評(píng)估。論文將社交網(wǎng)絡(luò)用戶之間的相互關(guān)注關(guān)系抽象為頁面之間的鏈出和鏈入關(guān)系,將PageRank算法應(yīng)用于用戶影響力的分析研究中,并將用戶追隨者的質(zhì)量,即追隨者的影響力的情況也作為重要的參考因素。并以此,設(shè)計(jì)了一種改進(jìn)的用戶影響力評(píng)估算法——URank算法。論文給出了URank算法的設(shè)計(jì)思路和詳細(xì)實(shí)現(xiàn)過程。粒子群PSO優(yōu)化算法是一種群體智能算法,以其收斂快、易實(shí)現(xiàn)等優(yōu)點(diǎn)受到學(xué)術(shù)界廣泛的重視。由于用戶影響力分析也是一種優(yōu)化設(shè)計(jì),因此論文提出一種基于PSO算法的用戶影響力評(píng)估算法——PsoRank算法。算法綜合考慮用戶自身因素和其追隨者質(zhì)量對(duì)用戶影響力的影響,擴(kuò)展了常見的用戶影響力評(píng)估算法所依賴的參考因素。該算法在對(duì)用戶影響力進(jìn)行評(píng)估時(shí),以用戶自身質(zhì)量,即用戶的粉絲數(shù)、發(fā)布信息的頻率和信息被轉(zhuǎn)發(fā)率/被評(píng)論以及用戶是否認(rèn)證等因素為基礎(chǔ),以用戶追隨者的質(zhì)量為條件,并且將用戶影響力增量因子作為算法的適應(yīng)度函數(shù)來判斷是否對(duì)用戶的影響力進(jìn)行更新。從多方面保證算法評(píng)估出的用戶影響力的合理性和公正性。為了使提出的算法能夠適應(yīng)海量數(shù)據(jù)處理,論文提出將URank和PsoRank算法按照MapReduce分布式并行化編程模型將論文設(shè)計(jì)的用戶影響力評(píng)估算法改編成分布式并行化程序。論文用真實(shí)的從新浪微博平臺(tái)爬取的數(shù)據(jù)在Hadoop集群上對(duì)論文提出的分布式并行化URank和PsoRank算法進(jìn)行實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,相對(duì)于其它的用戶影響力評(píng)估算法,論文提出的用戶影響力評(píng)估算法可以更公正合理地反映用戶真實(shí)的影響力大小。并且集群性能分析結(jié)果也表明,論文提出的并行化算法具有良好的加速比和計(jì)算效率比。因此論文提出的分布式并行化用戶影響力評(píng)估算法較適合像新浪微博這樣的大型社交網(wǎng)絡(luò)平臺(tái)。
【關(guān)鍵詞】:社交網(wǎng)絡(luò) 用戶影響力 粒子群算法 PageRank MapReduce
【學(xué)位授予單位】:江蘇大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP393.092;TP18
【目錄】:
- 摘要4-6
- ABSTRACT6-11
- 第一章 緒論11-19
- 1.1 研究背景及意義11-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-17
- 1.2.1 社交網(wǎng)絡(luò)用戶影響力分析12-15
- 1.2.2 基于Hadoop平臺(tái)的分布式并行算法設(shè)計(jì)15-17
- 1.3 論文的主要工作17-18
- 1.4 論文的組織結(jié)構(gòu)18-19
- 第二章 相關(guān)理論和技術(shù)簡(jiǎn)介19-30
- 2.1 常用的社交網(wǎng)絡(luò)用戶影響力評(píng)估算法19-21
- 2.1.1 基于PageRank的評(píng)估算法19
- 2.1.2 基于URL追蹤的評(píng)估算法19-20
- 2.1.3 基于用戶聯(lián)系強(qiáng)度的評(píng)估算法20
- 2.1.4 基于節(jié)點(diǎn)相關(guān)原則的評(píng)估算法20-21
- 2.2 經(jīng)典粒子群優(yōu)化算法21-22
- 2.2.1 粒子群優(yōu)化算法簡(jiǎn)介21-22
- 2.2.2 相比于其它群體智能優(yōu)化算法的優(yōu)勢(shì)22
- 2.3 Hadoop平臺(tái)關(guān)鍵技術(shù)22-29
- 2.3.1 分布式并行化編程模型MapReduce22-26
- 2.3.2 分布式文件系統(tǒng)HDFS26-27
- 2.3.3 分布式文件存儲(chǔ)系統(tǒng)HBase27-29
- 2.4 本章小結(jié)29-30
- 第三章 基于PageRank的評(píng)估算法URank研究與設(shè)計(jì)30-40
- 3.1 PageRank算法分析30-33
- 3.1.1 PageRank算法基本原理30-32
- 3.1.2 PageRank算法適用環(huán)境32-33
- 3.2 基于改進(jìn)PageRank算法的URank算法設(shè)計(jì)33-36
- 3.2.1 URank算法設(shè)計(jì)思想33-34
- 3.2.2 URank算法設(shè)計(jì)34-35
- 3.2.3 URank算法實(shí)現(xiàn)35-36
- 3.3 基于MapReduce的URank算法并行化實(shí)現(xiàn)36-38
- 3.3.1 算法并行設(shè)計(jì)思想36-37
- 3.3.2 算法并行化實(shí)現(xiàn)37-38
- 3.4 本章小結(jié)38-40
- 第四章 基于粒子群優(yōu)化的評(píng)估算法PsoRank研究與設(shè)計(jì)40-48
- 4.1 粒子群優(yōu)化算法基本原理40-41
- 4.2 基于改進(jìn)粒子群優(yōu)化算法的PsoRank算法設(shè)計(jì)41-44
- 4.2.1 PsoRank算法設(shè)計(jì)思想41
- 4.2.2 PsoRank算法設(shè)計(jì)與實(shí)現(xiàn)41-44
- 4.2.3 對(duì)粒子群算法的改進(jìn)44
- 4.3 基于MapReduce的PsoRank算法并行化實(shí)現(xiàn)44-47
- 4.3.1 算法并行化設(shè)計(jì)思想44-45
- 4.3.2 算法并行化實(shí)現(xiàn)45-47
- 4.4 本章小結(jié)47-48
- 第五章 實(shí)驗(yàn)平臺(tái)搭建與實(shí)驗(yàn)結(jié)果分析48-67
- 5.1 實(shí)驗(yàn)平臺(tái)搭建48-51
- 5.1.1 Hadoop集群搭建流程48-51
- 5.1.2 HBase數(shù)據(jù)庫系統(tǒng)配置51
- 5.2 實(shí)驗(yàn)數(shù)據(jù)獲取與分析51-53
- 5.3 實(shí)驗(yàn)數(shù)據(jù)預(yù)處理與數(shù)據(jù)存儲(chǔ)53-61
- 5.3.1 實(shí)驗(yàn)數(shù)據(jù)預(yù)處理53-58
- 5.3.2 實(shí)驗(yàn)數(shù)據(jù)存儲(chǔ)58-61
- 5.4 實(shí)驗(yàn)平臺(tái)性能分析61-62
- 5.5 實(shí)驗(yàn)結(jié)果分析62-66
- 5.6 本章小結(jié)66-67
- 第六章 總結(jié)與展望67-69
- 6.1 總結(jié)67-68
- 6.2 展望68-69
- 參考文獻(xiàn)69-73
- 致謝73-74
- 攻讀碩士學(xué)位期間發(fā)表的論文74
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李號(hào);張保穩(wěn);張京海;楊冰;;一種網(wǎng)絡(luò)空間實(shí)體信用動(dòng)態(tài)評(píng)估算法[J];信息安全與通信保密;2014年02期
2 吳同;韓臻;;基于類選的電子證據(jù)評(píng)估算法[J];北京交通大學(xué)學(xué)報(bào);2013年05期
3 楊林;陶慶云;全惠云;;求解矩形物體布局問題的分布評(píng)估算法[J];湖南師范大學(xué)自然科學(xué)學(xué)報(bào);2007年03期
4 侯碧,
本文編號(hào):498792
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/498792.html
最近更新
教材專著