用戶(hù)屬性信息推斷方法的研究
發(fā)布時(shí)間:2021-04-05 20:31
近些年來(lái),隨著互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)的發(fā)展,以微博、微信等社交平臺(tái)為代表的社交媒體也迅速發(fā)展起來(lái)。社交媒體促進(jìn)了用戶(hù)之間的溝通和交流,方便了用戶(hù)信息的獲取,正在成為人們?nèi)粘I钪胁豢苫蛉钡囊徊糠。用?hù)在社交媒體上的行為產(chǎn)生了大量的社會(huì)網(wǎng)絡(luò)數(shù)據(jù),其中就包括用戶(hù)的屬性信息數(shù)據(jù)。然而,由于用戶(hù)不愿意暴露隱私信息等原因,用戶(hù)的屬性信息存在著缺失、不完整的現(xiàn)象,這給人們對(duì)于在線(xiàn)社會(huì)網(wǎng)絡(luò)的研究帶來(lái)了困難。因此一些研究者開(kāi)始研究社會(huì)網(wǎng)絡(luò)中的用戶(hù)屬性信息推斷問(wèn)題,來(lái)增補(bǔ)和還原用戶(hù)屬性信息中缺失和不完整的部分。然而目前的屬性推斷方法主要是根據(jù)無(wú)權(quán)網(wǎng)絡(luò)來(lái)解決屬性推斷問(wèn)題,沒(méi)有考慮到用戶(hù)節(jié)點(diǎn)之間關(guān)系的強(qiáng)弱,在屬性推斷問(wèn)題上,關(guān)系強(qiáng)的鄰居節(jié)點(diǎn)應(yīng)當(dāng)比關(guān)系弱的鄰居節(jié)點(diǎn)起到更大的作用。本課題在微博用戶(hù)構(gòu)成的社會(huì)網(wǎng)絡(luò)中進(jìn)行了屬性推斷的研究。首先,本文介紹了幾種傳統(tǒng)的屬性推斷算法,并考察了傳統(tǒng)屬性推斷方法在實(shí)驗(yàn)數(shù)據(jù)集上的屬性推斷效果。然后,本文采用兩種方法來(lái)判別社會(huì)網(wǎng)絡(luò)中的強(qiáng)關(guān)系和弱關(guān)系,一種是設(shè)定相似性閾值的方法,另一種是基于社區(qū)發(fā)現(xiàn)的方法。在判別了強(qiáng)弱關(guān)系的社會(huì)網(wǎng)絡(luò)中,使用強(qiáng)關(guān)系鄰居加權(quán)投票的方法來(lái)完成屬性信息的推斷任...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
研究框架圖
圖 2-1 用戶(hù) u 的二跳網(wǎng)絡(luò)示意圖 a,b 和 c 處于用戶(hù) u 的一跳網(wǎng)絡(luò)中,用戶(hù) d,從用戶(hù) ID 為 1654619934 的互相關(guān)注的好友中用戶(hù)的互相關(guān)注好友拓展一跳和二跳網(wǎng)絡(luò),得到數(shù)據(jù)集一和數(shù)據(jù)集二的節(jié)點(diǎn)數(shù)和邊數(shù)如表 2-3 訓(xùn)練集,20%的節(jié)點(diǎn)作為測(cè)試集。表 2-3 數(shù)據(jù)集一和數(shù)據(jù)集二的統(tǒng)計(jì)信息 節(jié)點(diǎn)數(shù)(個(gè)) 邊一 20228 二 32049 博數(shù)據(jù)集的處理012 中騰訊公司提供的騰訊微博數(shù)據(jù)集中包含用戶(hù)關(guān)注表、用戶(hù)關(guān)鍵詞表等。本文用到的是用
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文息熵”、“信息增益率”和“基尼指數(shù)”三種方別對(duì)應(yīng)著三種不同的決策樹(shù):ID3 決策樹(shù)算法(Classification And Regression Tree)決策樹(shù)算決策樹(shù)示意圖,從根節(jié)點(diǎn)開(kāi)始,根據(jù)色澤、根不斷分裂,知道最終得出結(jié)果(色澤青綠、根)。成是一個(gè)遞歸的過(guò)程,當(dāng)滿(mǎn)足以下三個(gè)條件中]73-74:(1)當(dāng)前節(jié)點(diǎn)的所有樣本屬于同一類(lèi)別;3)所有樣本屬性取值相同或者當(dāng)前節(jié)點(diǎn)的屬性
【參考文獻(xiàn)】:
期刊論文
[1]社交網(wǎng)絡(luò)用戶(hù)敏感屬性迭代識(shí)別方法[J]. 謝小杰,梁英,董祥祥. 山東大學(xué)學(xué)報(bào)(理學(xué)版). 2019(03)
[2]基于node2vec的社交網(wǎng)絡(luò)用戶(hù)屬性補(bǔ)全攻擊[J]. 裴楊,瞿學(xué)鑫,郭曉博,段丁陽(yáng). 信息網(wǎng)絡(luò)安全. 2017(12)
[3]網(wǎng)絡(luò)表示學(xué)習(xí)綜述[J]. 涂存超,楊成,劉知遠(yuǎn),孫茂松. 中國(guó)科學(xué):信息科學(xué). 2017(08)
[4]基于隨機(jī)森林回歸分析的PM2.5濃度預(yù)測(cè)模型[J]. 杜續(xù),馮景瑜,呂少卿,石薇. 電信科學(xué). 2017(07)
[5]基于社團(tuán)結(jié)構(gòu)的鏈接預(yù)測(cè)和屬性推斷聯(lián)合解決方法[J]. 王銳,吳玲玲,石川,吳斌. 電子學(xué)報(bào). 2016(09)
[6]基于社交網(wǎng)絡(luò)的社交關(guān)系強(qiáng)度分類(lèi)研究[J]. 沈洪洲,袁勤儉. 情報(bào)學(xué)報(bào). 2014 (08)
[7]一種基于隨機(jī)游走模型的多標(biāo)簽分類(lèi)算法[J]. 鄭偉,王朝坤,劉璋,王建民. 計(jì)算機(jī)學(xué)報(bào). 2010(08)
博士論文
[1]社交媒體中的個(gè)性化推薦關(guān)鍵技術(shù)研究[D]. 李舒辰.北京郵電大學(xué) 2018
[2]社交網(wǎng)絡(luò)鏈路預(yù)測(cè)方法研究[D]. 張維玉.北京郵電大學(xué) 2016
[3]社會(huì)網(wǎng)絡(luò)中基于鏈接的分類(lèi)問(wèn)題研究[D]. 萬(wàn)懷宇.北京交通大學(xué) 2012
碩士論文
[1]復(fù)雜網(wǎng)絡(luò)中的社區(qū)發(fā)現(xiàn)算法研究[D]. 陳雨晴.南京郵電大學(xué) 2018
[2]基于強(qiáng)關(guān)系的用戶(hù)屬性信息推斷方法[D]. 喬伊娜.哈爾濱工業(yè)大學(xué) 2018
[3]新媒體時(shí)代:網(wǎng)絡(luò)互動(dòng)在網(wǎng)絡(luò)信息傳播中的作用研究[D]. 孫屹山.浙江大學(xué) 2018
[4]信息網(wǎng)絡(luò)中節(jié)點(diǎn)缺失信息推斷研究[D]. 吳玲玲.北京郵電大學(xué) 2015
本文編號(hào):3120054
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
研究框架圖
圖 2-1 用戶(hù) u 的二跳網(wǎng)絡(luò)示意圖 a,b 和 c 處于用戶(hù) u 的一跳網(wǎng)絡(luò)中,用戶(hù) d,從用戶(hù) ID 為 1654619934 的互相關(guān)注的好友中用戶(hù)的互相關(guān)注好友拓展一跳和二跳網(wǎng)絡(luò),得到數(shù)據(jù)集一和數(shù)據(jù)集二的節(jié)點(diǎn)數(shù)和邊數(shù)如表 2-3 訓(xùn)練集,20%的節(jié)點(diǎn)作為測(cè)試集。表 2-3 數(shù)據(jù)集一和數(shù)據(jù)集二的統(tǒng)計(jì)信息 節(jié)點(diǎn)數(shù)(個(gè)) 邊一 20228 二 32049 博數(shù)據(jù)集的處理012 中騰訊公司提供的騰訊微博數(shù)據(jù)集中包含用戶(hù)關(guān)注表、用戶(hù)關(guān)鍵詞表等。本文用到的是用
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文息熵”、“信息增益率”和“基尼指數(shù)”三種方別對(duì)應(yīng)著三種不同的決策樹(shù):ID3 決策樹(shù)算法(Classification And Regression Tree)決策樹(shù)算決策樹(shù)示意圖,從根節(jié)點(diǎn)開(kāi)始,根據(jù)色澤、根不斷分裂,知道最終得出結(jié)果(色澤青綠、根)。成是一個(gè)遞歸的過(guò)程,當(dāng)滿(mǎn)足以下三個(gè)條件中]73-74:(1)當(dāng)前節(jié)點(diǎn)的所有樣本屬于同一類(lèi)別;3)所有樣本屬性取值相同或者當(dāng)前節(jié)點(diǎn)的屬性
【參考文獻(xiàn)】:
期刊論文
[1]社交網(wǎng)絡(luò)用戶(hù)敏感屬性迭代識(shí)別方法[J]. 謝小杰,梁英,董祥祥. 山東大學(xué)學(xué)報(bào)(理學(xué)版). 2019(03)
[2]基于node2vec的社交網(wǎng)絡(luò)用戶(hù)屬性補(bǔ)全攻擊[J]. 裴楊,瞿學(xué)鑫,郭曉博,段丁陽(yáng). 信息網(wǎng)絡(luò)安全. 2017(12)
[3]網(wǎng)絡(luò)表示學(xué)習(xí)綜述[J]. 涂存超,楊成,劉知遠(yuǎn),孫茂松. 中國(guó)科學(xué):信息科學(xué). 2017(08)
[4]基于隨機(jī)森林回歸分析的PM2.5濃度預(yù)測(cè)模型[J]. 杜續(xù),馮景瑜,呂少卿,石薇. 電信科學(xué). 2017(07)
[5]基于社團(tuán)結(jié)構(gòu)的鏈接預(yù)測(cè)和屬性推斷聯(lián)合解決方法[J]. 王銳,吳玲玲,石川,吳斌. 電子學(xué)報(bào). 2016(09)
[6]基于社交網(wǎng)絡(luò)的社交關(guān)系強(qiáng)度分類(lèi)研究[J]. 沈洪洲,袁勤儉. 情報(bào)學(xué)報(bào). 2014 (08)
[7]一種基于隨機(jī)游走模型的多標(biāo)簽分類(lèi)算法[J]. 鄭偉,王朝坤,劉璋,王建民. 計(jì)算機(jī)學(xué)報(bào). 2010(08)
博士論文
[1]社交媒體中的個(gè)性化推薦關(guān)鍵技術(shù)研究[D]. 李舒辰.北京郵電大學(xué) 2018
[2]社交網(wǎng)絡(luò)鏈路預(yù)測(cè)方法研究[D]. 張維玉.北京郵電大學(xué) 2016
[3]社會(huì)網(wǎng)絡(luò)中基于鏈接的分類(lèi)問(wèn)題研究[D]. 萬(wàn)懷宇.北京交通大學(xué) 2012
碩士論文
[1]復(fù)雜網(wǎng)絡(luò)中的社區(qū)發(fā)現(xiàn)算法研究[D]. 陳雨晴.南京郵電大學(xué) 2018
[2]基于強(qiáng)關(guān)系的用戶(hù)屬性信息推斷方法[D]. 喬伊娜.哈爾濱工業(yè)大學(xué) 2018
[3]新媒體時(shí)代:網(wǎng)絡(luò)互動(dòng)在網(wǎng)絡(luò)信息傳播中的作用研究[D]. 孫屹山.浙江大學(xué) 2018
[4]信息網(wǎng)絡(luò)中節(jié)點(diǎn)缺失信息推斷研究[D]. 吳玲玲.北京郵電大學(xué) 2015
本文編號(hào):3120054
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3120054.html
最近更新
教材專(zhuān)著