融合網(wǎng)絡結構和文本內容的群體畫像構建方法研究
發(fā)布時間:2021-11-20 06:39
信息網(wǎng)絡的迅速發(fā)展,使得用戶數(shù)據(jù)日漸增多,基于網(wǎng)絡數(shù)據(jù)進行用戶畫像構建研究,對精準推薦等個性化服務研究領域具有重要意義。針對現(xiàn)有群體畫像構建方法多基于用戶在網(wǎng)絡上發(fā)表的文本內容,較少考慮網(wǎng)絡結構信息所造成的用戶建模精度低、網(wǎng)絡群體相似性和緊密性差的問題,提出了一種融合網(wǎng)絡結構和文本內容的群體畫像構建方法。首先,采用LINE模型的一階鄰近度和二階鄰近度建模局部和全局網(wǎng)絡結構,通過目標函數(shù)優(yōu)化合并局部和全局結構建模向量;借助注意力機制,在神經(jīng)網(wǎng)絡的隱藏層引入注意力矩陣對文本內容的上下文進行表示,進而實現(xiàn)文本內容建模;融合兩種模型并采用卷積神經(jīng)網(wǎng)絡方法訓練,將網(wǎng)絡用戶表示為空間向量。其次,采用密度峰值聚類算法對用戶空間向量聚類,通過計算每個用戶的局部密度和距離,確定用戶類別標簽,并利用結構-內容模塊度對聚類結果迭代優(yōu)化,實現(xiàn)網(wǎng)絡群體構建。最后,采用LDA主題建模法進行主題劃分,得到每個群體的關注話題標簽,并利用可視化工具刻畫群體畫像。采用知乎、Cora和Hep Th三種數(shù)據(jù)集,進行建模精度和群體構建效果對比實驗。本文方法同Deep Walk、LINE、Node2vec、SDNE、TADW六種...
【文章來源】:遼寧工程技術大學遼寧省
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【部分圖文】:
群體畫像構建總體流程
?囟砸丫?裳?慕詰闃馗捶夢剩?鋇鉸?閔瓚?的序列長度閾值。根據(jù)采樣情況,會得到一個概率公式,通過詞向量中的skip-gram模型對概率公式進行優(yōu)化,最終得到所需的節(jié)點向量表示。1)隨機游走隨機游走是指,從網(wǎng)絡中的一個節(jié)點出發(fā),隨機選擇與當前節(jié)點相連的下一個節(jié)點游走,不斷重復這個過程,直到滿足終止條件為止,最終生成一條連貫的網(wǎng)絡路徑。例如,圖2.2中的紅色路徑,即為一條隨機游走路徑。隨機游走只能對局部網(wǎng)絡結構建模,對于含有成千上萬節(jié)點的大型網(wǎng)絡來說,可以多節(jié)點并行隨機游走,以提高游走采樣的效率。圖2.2DeepWalk隨機游走路徑Figure2.2RandomwalkpathofDeepWalk2)skip-gram模型對于隨機游走產生的概率公式,采用skip-gram模型進行優(yōu)化。由于網(wǎng)絡嵌入思想源于文本嵌入,且具有相似特性,因此,在DeepWalk中通過引用詞向量模型,得到skip-gram優(yōu)化模型。所謂的詞向量模型,就是對于一個單詞序列),...,,(10niuwwww,當知道單詞序
一階鄰近度和二階鄰近度Figure2.3First-orderproximityandsecond-orderproximity
【參考文獻】:
期刊論文
[1]基于網(wǎng)絡結構和文本內容的群體畫像構建方法研究[J]. 邱云飛,張偉竹. 圖書情報工作. 2019(22)
[2]基于用戶畫像的數(shù)字圖書館精準推薦服務體系構建研究[J]. 張晗,畢強,李潔,丁夢曉. 情報理論與實踐. 2019(11)
[3]基于大數(shù)據(jù)的用戶畫像構建方法與運用[J]. 譚浩,郭雅婷. 包裝工程. 2019(22)
[4]Inferring user profiles in social media by joint modeling of text and networks[J]. Ruifeng XU,Jiachen DU,Zhishan ZHAO,Yulan HE,Qinghong GAO,Lin GUI. Science China(Information Sciences). 2019(11)
[5]考慮全局和局部信息的科研人員科研行為立體精準畫像構建方法[J]. 張亞楠,黃晶麗,王剛. 情報學報. 2019(10)
[6]融合用戶智能標簽與社會化標簽的推薦服務[J]. 賈偉,劉旭艷,徐彤陽. 情報科學. 2019(10)
[7]基于輿情畫像的在線社交用戶信息傳播特征統(tǒng)計分析[J]. 劉海鷗,劉旭,姚蘇梅,謝姝琳. 現(xiàn)代情報. 2019(09)
[8]學術用戶畫像的行為與興趣標簽構建與應用[J]. 王仁武,張文慧. 現(xiàn)代情報. 2019(09)
[9]社交媒體用戶畫像的構建及資源聚合模型研究[J]. 徐海玲,張海濤,魏明珠,尹慧子. 圖書情報工作. 2019(09)
[10]國內外圖書情報領域用戶畫像研究現(xiàn)狀及展望[J]. 張海濤,徐海玲,張梟慧,武慧娟. 圖書情報工作. 2019(07)
博士論文
[1]基于社交大數(shù)據(jù)的用戶信用畫像方法研究[D]. 郭光明.中國科學技術大學 2017
碩士論文
[1]基于動態(tài)主題模型的微博用戶分類畫像應用研究[D]. 任金玥.華東師范大學 2019
[2]屬性推理在用戶畫像系統(tǒng)的應用研究[D]. 宋光晨.陜西師范大學 2019
[3]在線社交網(wǎng)絡中用戶畫像構建及其應用研究[D]. 汪強兵.南京理工大學 2018
[4]融入社交網(wǎng)絡信息的DIT用戶偏好預測模型[D]. 張長紅.浙江工商大學 2018
[5]基于文本挖掘的社交網(wǎng)絡用戶畫像建模與應用[D]. 徐英楠.北京郵電大學 2016
本文編號:3506775
【文章來源】:遼寧工程技術大學遼寧省
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【部分圖文】:
群體畫像構建總體流程
?囟砸丫?裳?慕詰闃馗捶夢剩?鋇鉸?閔瓚?的序列長度閾值。根據(jù)采樣情況,會得到一個概率公式,通過詞向量中的skip-gram模型對概率公式進行優(yōu)化,最終得到所需的節(jié)點向量表示。1)隨機游走隨機游走是指,從網(wǎng)絡中的一個節(jié)點出發(fā),隨機選擇與當前節(jié)點相連的下一個節(jié)點游走,不斷重復這個過程,直到滿足終止條件為止,最終生成一條連貫的網(wǎng)絡路徑。例如,圖2.2中的紅色路徑,即為一條隨機游走路徑。隨機游走只能對局部網(wǎng)絡結構建模,對于含有成千上萬節(jié)點的大型網(wǎng)絡來說,可以多節(jié)點并行隨機游走,以提高游走采樣的效率。圖2.2DeepWalk隨機游走路徑Figure2.2RandomwalkpathofDeepWalk2)skip-gram模型對于隨機游走產生的概率公式,采用skip-gram模型進行優(yōu)化。由于網(wǎng)絡嵌入思想源于文本嵌入,且具有相似特性,因此,在DeepWalk中通過引用詞向量模型,得到skip-gram優(yōu)化模型。所謂的詞向量模型,就是對于一個單詞序列),...,,(10niuwwww,當知道單詞序
一階鄰近度和二階鄰近度Figure2.3First-orderproximityandsecond-orderproximity
【參考文獻】:
期刊論文
[1]基于網(wǎng)絡結構和文本內容的群體畫像構建方法研究[J]. 邱云飛,張偉竹. 圖書情報工作. 2019(22)
[2]基于用戶畫像的數(shù)字圖書館精準推薦服務體系構建研究[J]. 張晗,畢強,李潔,丁夢曉. 情報理論與實踐. 2019(11)
[3]基于大數(shù)據(jù)的用戶畫像構建方法與運用[J]. 譚浩,郭雅婷. 包裝工程. 2019(22)
[4]Inferring user profiles in social media by joint modeling of text and networks[J]. Ruifeng XU,Jiachen DU,Zhishan ZHAO,Yulan HE,Qinghong GAO,Lin GUI. Science China(Information Sciences). 2019(11)
[5]考慮全局和局部信息的科研人員科研行為立體精準畫像構建方法[J]. 張亞楠,黃晶麗,王剛. 情報學報. 2019(10)
[6]融合用戶智能標簽與社會化標簽的推薦服務[J]. 賈偉,劉旭艷,徐彤陽. 情報科學. 2019(10)
[7]基于輿情畫像的在線社交用戶信息傳播特征統(tǒng)計分析[J]. 劉海鷗,劉旭,姚蘇梅,謝姝琳. 現(xiàn)代情報. 2019(09)
[8]學術用戶畫像的行為與興趣標簽構建與應用[J]. 王仁武,張文慧. 現(xiàn)代情報. 2019(09)
[9]社交媒體用戶畫像的構建及資源聚合模型研究[J]. 徐海玲,張海濤,魏明珠,尹慧子. 圖書情報工作. 2019(09)
[10]國內外圖書情報領域用戶畫像研究現(xiàn)狀及展望[J]. 張海濤,徐海玲,張梟慧,武慧娟. 圖書情報工作. 2019(07)
博士論文
[1]基于社交大數(shù)據(jù)的用戶信用畫像方法研究[D]. 郭光明.中國科學技術大學 2017
碩士論文
[1]基于動態(tài)主題模型的微博用戶分類畫像應用研究[D]. 任金玥.華東師范大學 2019
[2]屬性推理在用戶畫像系統(tǒng)的應用研究[D]. 宋光晨.陜西師范大學 2019
[3]在線社交網(wǎng)絡中用戶畫像構建及其應用研究[D]. 汪強兵.南京理工大學 2018
[4]融入社交網(wǎng)絡信息的DIT用戶偏好預測模型[D]. 張長紅.浙江工商大學 2018
[5]基于文本挖掘的社交網(wǎng)絡用戶畫像建模與應用[D]. 徐英楠.北京郵電大學 2016
本文編號:3506775
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3506775.html
最近更新
教材專著