基于人物相似度的互聯(lián)網(wǎng)絡(luò)人物關(guān)系分析方法研究
發(fā)布時(shí)間:2023-02-05 11:55
作為全球最大的職業(yè)社交網(wǎng)絡(luò)平臺(tái),領(lǐng)英在人們的職業(yè)生涯中扮演著重要的角色,成為了用戶之間溝通交流的重要途徑之一。在領(lǐng)英上,用戶通過(guò)完善資料、分享經(jīng)歷以及拓展人脈等方式來(lái)進(jìn)行彼此之間的交互聯(lián)系,從而使得領(lǐng)英社交平臺(tái)上蘊(yùn)含了大量真實(shí)的用戶信息。利用這些信息對(duì)領(lǐng)英用戶之間的關(guān)系進(jìn)行分析,挖掘用戶數(shù)據(jù)背后的信息,將有助于掌握社會(huì)各領(lǐng)域人才的分布情況,實(shí)現(xiàn)有針對(duì)性的人才需求信息投放等目的。本文基于領(lǐng)英社交網(wǎng)絡(luò)平臺(tái)的用戶數(shù)據(jù)集,提出了基于人物相似度的用戶關(guān)系分析方法,并運(yùn)用于人物關(guān)系分析的課題中。本文主要的工作以及貢獻(xiàn)有以下幾個(gè)方面:(1)構(gòu)建了用戶的相似性關(guān)系網(wǎng)絡(luò)。領(lǐng)英用戶具有各種不同的屬性,對(duì)于每一種不同的屬性,計(jì)算用戶之間在該屬性上的相似度,然后以用戶為節(jié)點(diǎn),以用戶之間屬性上的相似性為邊構(gòu)建了用戶相似性關(guān)系網(wǎng)絡(luò),進(jìn)而將領(lǐng)英用戶關(guān)系分析問(wèn)題轉(zhuǎn)化為復(fù)雜網(wǎng)絡(luò)分析問(wèn)題,為后續(xù)研究打下基礎(chǔ)。(2)為了更有效地劃分用戶群體,提升用戶的分類效果,本文提出了基于圖嵌入的用戶分類方法。該方法選取了用戶的詞屬性和文本屬性作為屬性特征,在此基礎(chǔ)上,引入圖嵌入算法在用戶的相似性關(guān)系網(wǎng)絡(luò)中挖掘用戶的拓?fù)鋵傩?并以此作為...
【文章頁(yè)數(shù)】:87 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 用戶社團(tuán)發(fā)現(xiàn)研究
1.2.2 用戶相似性分析研究
1.2.3 用戶分類研究
1.2.4 多層關(guān)系網(wǎng)絡(luò)研究
1.3 論文的主要工作與貢獻(xiàn)
1.4 論文章節(jié)安排
第二章 相關(guān)理論基礎(chǔ)和方法
2.1 人物屬性特征化描述
2.2 文本特征向量化
2.2.1 詞袋模型
2.2.2 詞向量模型
2.3 隱含狄利克雷分布
2.4 主成分分析算法
2.5 分類方法
2.5.1 支持向量機(jī)算法
2.5.2 K近鄰算法
2.5.3 決策樹(shù)算法
2.5.4 隨機(jī)森林算法
2.6 本章小結(jié)
第三章 基于圖嵌入的用戶分類方法研究
3.1 引言
3.2 用戶相似度關(guān)系網(wǎng)絡(luò)構(gòu)建
3.2.1 基于詞屬性的用戶詞特征向量化
3.2.2 基于文本屬性的用戶文本特征向量化
3.2.3 基于人物屬性相似度的用戶關(guān)系網(wǎng)絡(luò)構(gòu)建
3.3 基于圖嵌入的用戶關(guān)系挖掘
3.3.1 基于圖嵌入的用戶拓?fù)涮卣飨蛄繕?gòu)建
3.3.2 特征向量組合
3.4 測(cè)試與分析
3.4.1 實(shí)驗(yàn)數(shù)據(jù)
3.4.2 實(shí)驗(yàn)流程
3.4.3 實(shí)驗(yàn)衡量指標(biāo)
3.4.4 實(shí)驗(yàn)結(jié)果和分析
3.5 本章小結(jié)
第四章 基于多層網(wǎng)絡(luò)的用戶關(guān)系分析方法研究
4.1 引言
4.2 多層用戶關(guān)系網(wǎng)絡(luò)系統(tǒng)構(gòu)建
4.3 用戶多層關(guān)系網(wǎng)絡(luò)聚合方法研究
4.3.1 基于拓?fù)浣Y(jié)構(gòu)的用戶多層關(guān)系網(wǎng)絡(luò)聚合方法
4.3.2 基于層次分析的用戶多層關(guān)系網(wǎng)絡(luò)聚合方法
4.3.3 基于層間相似度的用戶多層關(guān)系網(wǎng)絡(luò)聚合方法
4.4 權(quán)重關(guān)系圖的社團(tuán)劃分算法
4.4.1 基于權(quán)重圖的Girvan–Newman算法
4.4.2 基于權(quán)重圖的Fast-Newman算法
4.4.3 基于權(quán)重圖的Louvain算法
4.5 測(cè)試與分析
4.5.1 實(shí)驗(yàn)數(shù)據(jù)
4.5.2 實(shí)驗(yàn)流程
4.5.3 實(shí)驗(yàn)衡量指標(biāo)
4.5.4 實(shí)驗(yàn)結(jié)果和分析
4.6 本章小結(jié)
第五章 工作總結(jié)與展望
5.1 工作總結(jié)
5.2 工作展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
本文編號(hào):3734927
【文章頁(yè)數(shù)】:87 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 用戶社團(tuán)發(fā)現(xiàn)研究
1.2.2 用戶相似性分析研究
1.2.3 用戶分類研究
1.2.4 多層關(guān)系網(wǎng)絡(luò)研究
1.3 論文的主要工作與貢獻(xiàn)
1.4 論文章節(jié)安排
第二章 相關(guān)理論基礎(chǔ)和方法
2.1 人物屬性特征化描述
2.2 文本特征向量化
2.2.1 詞袋模型
2.2.2 詞向量模型
2.3 隱含狄利克雷分布
2.4 主成分分析算法
2.5 分類方法
2.5.1 支持向量機(jī)算法
2.5.2 K近鄰算法
2.5.3 決策樹(shù)算法
2.5.4 隨機(jī)森林算法
2.6 本章小結(jié)
第三章 基于圖嵌入的用戶分類方法研究
3.1 引言
3.2 用戶相似度關(guān)系網(wǎng)絡(luò)構(gòu)建
3.2.1 基于詞屬性的用戶詞特征向量化
3.2.2 基于文本屬性的用戶文本特征向量化
3.2.3 基于人物屬性相似度的用戶關(guān)系網(wǎng)絡(luò)構(gòu)建
3.3 基于圖嵌入的用戶關(guān)系挖掘
3.3.1 基于圖嵌入的用戶拓?fù)涮卣飨蛄繕?gòu)建
3.3.2 特征向量組合
3.4 測(cè)試與分析
3.4.1 實(shí)驗(yàn)數(shù)據(jù)
3.4.2 實(shí)驗(yàn)流程
3.4.3 實(shí)驗(yàn)衡量指標(biāo)
3.4.4 實(shí)驗(yàn)結(jié)果和分析
3.5 本章小結(jié)
第四章 基于多層網(wǎng)絡(luò)的用戶關(guān)系分析方法研究
4.1 引言
4.2 多層用戶關(guān)系網(wǎng)絡(luò)系統(tǒng)構(gòu)建
4.3 用戶多層關(guān)系網(wǎng)絡(luò)聚合方法研究
4.3.1 基于拓?fù)浣Y(jié)構(gòu)的用戶多層關(guān)系網(wǎng)絡(luò)聚合方法
4.3.2 基于層次分析的用戶多層關(guān)系網(wǎng)絡(luò)聚合方法
4.3.3 基于層間相似度的用戶多層關(guān)系網(wǎng)絡(luò)聚合方法
4.4 權(quán)重關(guān)系圖的社團(tuán)劃分算法
4.4.1 基于權(quán)重圖的Girvan–Newman算法
4.4.2 基于權(quán)重圖的Fast-Newman算法
4.4.3 基于權(quán)重圖的Louvain算法
4.5 測(cè)試與分析
4.5.1 實(shí)驗(yàn)數(shù)據(jù)
4.5.2 實(shí)驗(yàn)流程
4.5.3 實(shí)驗(yàn)衡量指標(biāo)
4.5.4 實(shí)驗(yàn)結(jié)果和分析
4.6 本章小結(jié)
第五章 工作總結(jié)與展望
5.1 工作總結(jié)
5.2 工作展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
本文編號(hào):3734927
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3734927.html
最近更新
教材專著