基于人物相似度的互聯(lián)網(wǎng)絡(luò)人物關(guān)系分析方法研究
發(fā)布時(shí)間:2023-02-05 11:55
作為全球最大的職業(yè)社交網(wǎng)絡(luò)平臺(tái),領(lǐng)英在人們的職業(yè)生涯中扮演著重要的角色,成為了用戶(hù)之間溝通交流的重要途徑之一。在領(lǐng)英上,用戶(hù)通過(guò)完善資料、分享經(jīng)歷以及拓展人脈等方式來(lái)進(jìn)行彼此之間的交互聯(lián)系,從而使得領(lǐng)英社交平臺(tái)上蘊(yùn)含了大量真實(shí)的用戶(hù)信息。利用這些信息對(duì)領(lǐng)英用戶(hù)之間的關(guān)系進(jìn)行分析,挖掘用戶(hù)數(shù)據(jù)背后的信息,將有助于掌握社會(huì)各領(lǐng)域人才的分布情況,實(shí)現(xiàn)有針對(duì)性的人才需求信息投放等目的。本文基于領(lǐng)英社交網(wǎng)絡(luò)平臺(tái)的用戶(hù)數(shù)據(jù)集,提出了基于人物相似度的用戶(hù)關(guān)系分析方法,并運(yùn)用于人物關(guān)系分析的課題中。本文主要的工作以及貢獻(xiàn)有以下幾個(gè)方面:(1)構(gòu)建了用戶(hù)的相似性關(guān)系網(wǎng)絡(luò)。領(lǐng)英用戶(hù)具有各種不同的屬性,對(duì)于每一種不同的屬性,計(jì)算用戶(hù)之間在該屬性上的相似度,然后以用戶(hù)為節(jié)點(diǎn),以用戶(hù)之間屬性上的相似性為邊構(gòu)建了用戶(hù)相似性關(guān)系網(wǎng)絡(luò),進(jìn)而將領(lǐng)英用戶(hù)關(guān)系分析問(wèn)題轉(zhuǎn)化為復(fù)雜網(wǎng)絡(luò)分析問(wèn)題,為后續(xù)研究打下基礎(chǔ)。(2)為了更有效地劃分用戶(hù)群體,提升用戶(hù)的分類(lèi)效果,本文提出了基于圖嵌入的用戶(hù)分類(lèi)方法。該方法選取了用戶(hù)的詞屬性和文本屬性作為屬性特征,在此基礎(chǔ)上,引入圖嵌入算法在用戶(hù)的相似性關(guān)系網(wǎng)絡(luò)中挖掘用戶(hù)的拓?fù)鋵傩?并以此作為...
【文章頁(yè)數(shù)】:87 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 用戶(hù)社團(tuán)發(fā)現(xiàn)研究
1.2.2 用戶(hù)相似性分析研究
1.2.3 用戶(hù)分類(lèi)研究
1.2.4 多層關(guān)系網(wǎng)絡(luò)研究
1.3 論文的主要工作與貢獻(xiàn)
1.4 論文章節(jié)安排
第二章 相關(guān)理論基礎(chǔ)和方法
2.1 人物屬性特征化描述
2.2 文本特征向量化
2.2.1 詞袋模型
2.2.2 詞向量模型
2.3 隱含狄利克雷分布
2.4 主成分分析算法
2.5 分類(lèi)方法
2.5.1 支持向量機(jī)算法
2.5.2 K近鄰算法
2.5.3 決策樹(shù)算法
2.5.4 隨機(jī)森林算法
2.6 本章小結(jié)
第三章 基于圖嵌入的用戶(hù)分類(lèi)方法研究
3.1 引言
3.2 用戶(hù)相似度關(guān)系網(wǎng)絡(luò)構(gòu)建
3.2.1 基于詞屬性的用戶(hù)詞特征向量化
3.2.2 基于文本屬性的用戶(hù)文本特征向量化
3.2.3 基于人物屬性相似度的用戶(hù)關(guān)系網(wǎng)絡(luò)構(gòu)建
3.3 基于圖嵌入的用戶(hù)關(guān)系挖掘
3.3.1 基于圖嵌入的用戶(hù)拓?fù)涮卣飨蛄繕?gòu)建
3.3.2 特征向量組合
3.4 測(cè)試與分析
3.4.1 實(shí)驗(yàn)數(shù)據(jù)
3.4.2 實(shí)驗(yàn)流程
3.4.3 實(shí)驗(yàn)衡量指標(biāo)
3.4.4 實(shí)驗(yàn)結(jié)果和分析
3.5 本章小結(jié)
第四章 基于多層網(wǎng)絡(luò)的用戶(hù)關(guān)系分析方法研究
4.1 引言
4.2 多層用戶(hù)關(guān)系網(wǎng)絡(luò)系統(tǒng)構(gòu)建
4.3 用戶(hù)多層關(guān)系網(wǎng)絡(luò)聚合方法研究
4.3.1 基于拓?fù)浣Y(jié)構(gòu)的用戶(hù)多層關(guān)系網(wǎng)絡(luò)聚合方法
4.3.2 基于層次分析的用戶(hù)多層關(guān)系網(wǎng)絡(luò)聚合方法
4.3.3 基于層間相似度的用戶(hù)多層關(guān)系網(wǎng)絡(luò)聚合方法
4.4 權(quán)重關(guān)系圖的社團(tuán)劃分算法
4.4.1 基于權(quán)重圖的Girvan–Newman算法
4.4.2 基于權(quán)重圖的Fast-Newman算法
4.4.3 基于權(quán)重圖的Louvain算法
4.5 測(cè)試與分析
4.5.1 實(shí)驗(yàn)數(shù)據(jù)
4.5.2 實(shí)驗(yàn)流程
4.5.3 實(shí)驗(yàn)衡量指標(biāo)
4.5.4 實(shí)驗(yàn)結(jié)果和分析
4.6 本章小結(jié)
第五章 工作總結(jié)與展望
5.1 工作總結(jié)
5.2 工作展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
本文編號(hào):3734927
【文章頁(yè)數(shù)】:87 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 用戶(hù)社團(tuán)發(fā)現(xiàn)研究
1.2.2 用戶(hù)相似性分析研究
1.2.3 用戶(hù)分類(lèi)研究
1.2.4 多層關(guān)系網(wǎng)絡(luò)研究
1.3 論文的主要工作與貢獻(xiàn)
1.4 論文章節(jié)安排
第二章 相關(guān)理論基礎(chǔ)和方法
2.1 人物屬性特征化描述
2.2 文本特征向量化
2.2.1 詞袋模型
2.2.2 詞向量模型
2.3 隱含狄利克雷分布
2.4 主成分分析算法
2.5 分類(lèi)方法
2.5.1 支持向量機(jī)算法
2.5.2 K近鄰算法
2.5.3 決策樹(shù)算法
2.5.4 隨機(jī)森林算法
2.6 本章小結(jié)
第三章 基于圖嵌入的用戶(hù)分類(lèi)方法研究
3.1 引言
3.2 用戶(hù)相似度關(guān)系網(wǎng)絡(luò)構(gòu)建
3.2.1 基于詞屬性的用戶(hù)詞特征向量化
3.2.2 基于文本屬性的用戶(hù)文本特征向量化
3.2.3 基于人物屬性相似度的用戶(hù)關(guān)系網(wǎng)絡(luò)構(gòu)建
3.3 基于圖嵌入的用戶(hù)關(guān)系挖掘
3.3.1 基于圖嵌入的用戶(hù)拓?fù)涮卣飨蛄繕?gòu)建
3.3.2 特征向量組合
3.4 測(cè)試與分析
3.4.1 實(shí)驗(yàn)數(shù)據(jù)
3.4.2 實(shí)驗(yàn)流程
3.4.3 實(shí)驗(yàn)衡量指標(biāo)
3.4.4 實(shí)驗(yàn)結(jié)果和分析
3.5 本章小結(jié)
第四章 基于多層網(wǎng)絡(luò)的用戶(hù)關(guān)系分析方法研究
4.1 引言
4.2 多層用戶(hù)關(guān)系網(wǎng)絡(luò)系統(tǒng)構(gòu)建
4.3 用戶(hù)多層關(guān)系網(wǎng)絡(luò)聚合方法研究
4.3.1 基于拓?fù)浣Y(jié)構(gòu)的用戶(hù)多層關(guān)系網(wǎng)絡(luò)聚合方法
4.3.2 基于層次分析的用戶(hù)多層關(guān)系網(wǎng)絡(luò)聚合方法
4.3.3 基于層間相似度的用戶(hù)多層關(guān)系網(wǎng)絡(luò)聚合方法
4.4 權(quán)重關(guān)系圖的社團(tuán)劃分算法
4.4.1 基于權(quán)重圖的Girvan–Newman算法
4.4.2 基于權(quán)重圖的Fast-Newman算法
4.4.3 基于權(quán)重圖的Louvain算法
4.5 測(cè)試與分析
4.5.1 實(shí)驗(yàn)數(shù)據(jù)
4.5.2 實(shí)驗(yàn)流程
4.5.3 實(shí)驗(yàn)衡量指標(biāo)
4.5.4 實(shí)驗(yàn)結(jié)果和分析
4.6 本章小結(jié)
第五章 工作總結(jié)與展望
5.1 工作總結(jié)
5.2 工作展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
本文編號(hào):3734927
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3734927.html
最近更新
教材專(zhuān)著