基于親密度及影響力的微博社交興趣圈挖掘算法研究
發(fā)布時(shí)間:2024-04-01 01:36
社交網(wǎng)絡(luò)是近幾年來迅速崛起的一類新型Web服務(wù),它們以用戶之間的在線朋友關(guān)系為基礎(chǔ),使得人們可以在朋友間自由的分享興趣和活動(dòng)。Twitter和新浪微博是第二代社交網(wǎng)絡(luò),即微博服務(wù)的代表。隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,微博已經(jīng)成為了最為流行的信息傳播平臺(tái),擁有巨大的影響力和海量用戶社交數(shù)據(jù)。 社會(huì)網(wǎng)絡(luò)的分析和挖掘目前已經(jīng)成為了研究的熱門領(lǐng)域,社區(qū)發(fā)現(xiàn)作為社會(huì)網(wǎng)絡(luò)分析中的重要方面,也獲得了極大的關(guān)注,F(xiàn)有的社區(qū)發(fā)現(xiàn)方法大多面向全局網(wǎng)絡(luò),以某節(jié)點(diǎn)為中心的局部網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)算法比較缺乏;現(xiàn)有方法主要考慮網(wǎng)絡(luò)的連接結(jié)構(gòu),忽略了親密度、影響力和用戶交互行為等社交因素;現(xiàn)有方法大部分是單分類算法,能夠發(fā)掘重疊社區(qū)的多分類算法尚不完善。 論文基于以上問題,提出了基于用戶親密度及影響力的微博社交興趣圈挖掘算法。所提算法基于微博用戶個(gè)人交互數(shù)據(jù),采用了逐步擴(kuò)充的策略,同時(shí)考慮到了網(wǎng)絡(luò)連接結(jié)構(gòu)、用戶親密度和影響力三方面因素,主要工作如下: 1、在中心用戶的一級(jí)交互圖中,利用圖論中k團(tuán)社區(qū)的理論,尋找能夠形成用戶多個(gè)社交興趣圈的種子集合。此工作主要考慮網(wǎng)絡(luò)連接結(jié)構(gòu),生成高質(zhì)量的社交興趣圈核心,同時(shí)初步確定用戶社交興趣圈...
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文編號(hào):3944806
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-1微博社交興趣圈算法挖掘目標(biāo)
用戶的多樣性,用戶擁有的社交興趣圈類型和為,在社區(qū)數(shù)量未知的情況下,挖掘多個(gè)高度o-centric)社區(qū)。挖掘目標(biāo)如圖1-1所示。
圖2-1有向社會(huì)關(guān)系圖
動(dòng)者之間的由特定關(guān)系而發(fā)生互動(dòng),進(jìn)而積累起來的聯(lián)系模式。在社會(huì)網(wǎng)絡(luò)分析中,通常使用圖論進(jìn)行研究,即將社會(huì)網(wǎng)絡(luò)抽象為社會(huì)關(guān)系圖和社會(huì)關(guān)系矩陣,如圖2-1和圖2-2所示。圖2-1有向社會(huì)關(guān)系圖
圖3-7KCC算法種子挖掘結(jié)果
圖3-7KCC算法種子挖掘結(jié)果將KCC算法和GCE算法的結(jié)果對(duì)比即可看出,作者一共有3個(gè)社交圈種子,種子1直接包含了所有的中學(xué)同學(xué),完全避免了冰山孤島現(xiàn)象;種子2則是數(shù)據(jù)挖掘和社會(huì)網(wǎng)絡(luò)分析領(lǐng)域的一些專家,反映出了作者在科研方面的興趣;種子3成員包括了兩個(gè)工業(yè)界的人....
圖3-8親密度分析結(jié)果
本文編號(hào):3944806
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3944806.html
最近更新
教材專著