天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

微博用戶(hù)社會(huì)關(guān)系離線(xiàn)挖掘算法的研究

發(fā)布時(shí)間:2017-12-27 17:19

  本文關(guān)鍵詞:微博用戶(hù)社會(huì)關(guān)系離線(xiàn)挖掘算法的研究 出處:《北京交通大學(xué)》2016年碩士論文 論文類(lèi)型:學(xué)位論文


  更多相關(guān)文章: 微博 社會(huì)關(guān)系 相似度 用戶(hù)行為 離線(xiàn)挖掘


【摘要】:伴隨著互聯(lián)網(wǎng)和移動(dòng)通信技術(shù)的飛速發(fā)展,社交網(wǎng)絡(luò)平臺(tái)吸引了大量的活躍用戶(hù),用戶(hù)間的社會(huì)關(guān)系形成了錯(cuò)綜復(fù)雜的網(wǎng)絡(luò)圖。如何挖掘網(wǎng)絡(luò)圖中的潛在信息已經(jīng)成為當(dāng)下研究的一個(gè)熱點(diǎn)。微博用戶(hù)社會(huì)關(guān)系挖掘是其中的一個(gè)重要研究方向。它通過(guò)評(píng)估微博用戶(hù)之間潛在關(guān)系強(qiáng)度,找到目標(biāo)用戶(hù)的潛在關(guān)系圈,進(jìn)而可以實(shí)現(xiàn)用戶(hù)追蹤、鏈接預(yù)測(cè)、好友推薦等。本文在對(duì)基于離線(xiàn)微博數(shù)據(jù)的社會(huì)關(guān)系挖掘算法進(jìn)行了研究的基礎(chǔ)上,提出了一種新的挖掘模型以更為全面科學(xué)地評(píng)估用戶(hù)之間的關(guān)系,進(jìn)而找出用戶(hù)的關(guān)系圈。論文的主要工作包括以下幾個(gè)方面:首先對(duì)微博社會(huì)關(guān)系挖掘的研究現(xiàn)狀進(jìn)行了較為詳細(xì)的研究,包括社會(huì)關(guān)系指標(biāo)建立以及評(píng)估模型兩個(gè)主要方面。同時(shí)總結(jié)了當(dāng)前研究方法的不足,包括:現(xiàn)有模型的評(píng)價(jià)指標(biāo)種類(lèi)較少,模型設(shè)計(jì)時(shí)忽視了微博網(wǎng)絡(luò)的部分特征,指標(biāo)融合時(shí)采用簡(jiǎn)單加權(quán)求和,沒(méi)有考慮到不同用戶(hù)的行為偏好對(duì)融合評(píng)估的影響。進(jìn)而,本文提出了基于多維度用戶(hù)相似度信息融合的自適應(yīng)微博用戶(hù)社會(huì)關(guān)系離線(xiàn)挖掘算法。該算法從虛擬微博圖、POI數(shù)據(jù)、虛擬用戶(hù)圖、用戶(hù)-微博二部圖、背景數(shù)據(jù)等五個(gè)角度入手,提出了相應(yīng)的用戶(hù)關(guān)系評(píng)價(jià)子算法,并提出了一種基于最大似然度的微博用戶(hù)社會(huì)關(guān)系評(píng)價(jià)模型(Decision Algorithm Model based on Maximum Likelihood,DAMML)對(duì)五個(gè)指標(biāo)的用戶(hù)關(guān)系評(píng)價(jià)信息進(jìn)行綜合決策。通過(guò)分析該綜合決策信息,可以找出目標(biāo)用戶(hù)的潛在關(guān)系圈。本文提出的五個(gè)用戶(hù)關(guān)系評(píng)價(jià)子算法如下:●結(jié)合虛擬微博圖的用戶(hù)興趣關(guān)系評(píng)價(jià)算法(Interests of Users and Virtual Microblog Graph,IUVMG),該算法使用LDA模型,將用戶(hù)評(píng)論、點(diǎn)贊等行為信息添加到用戶(hù)興趣特征矩陣中,提升用戶(hù)興趣關(guān)系評(píng)價(jià)的準(zhǔn)確性;·考慮行政區(qū)域劃分與簽到信息的用戶(hù)活躍位置相似度評(píng)價(jià)算法(Administrative Region and User Check-in Information, ARUCI),該算法由用戶(hù)活躍駐地提取、考慮相遇時(shí)伺與好友影響的活躍位置相似度兩部分組成,解決了微博網(wǎng)絡(luò)部分用戶(hù)簽到數(shù)據(jù)稀疏的問(wèn)題;·結(jié)合圖出入度的共同好友及擴(kuò)展好友的用戶(hù)關(guān)系評(píng)價(jià)算法(Out-in Degree and Mutual Friends, ODMF),該算法考慮用戶(hù)節(jié)點(diǎn)的出入度,提出虛擬用戶(hù)的概念,將算法推廣到了二級(jí)好友;●考慮交互行為傾向的用戶(hù)交互緊密度算法(Tendency of User Inter Behavior,TUIB),該算法解決了微博用戶(hù)間交互行為的非對(duì)等性問(wèn)題;●用戶(hù)背景屬性的用戶(hù)關(guān)系評(píng)價(jià)算法(User Background Information,UBI),該算法使用主成分分析法提取用戶(hù)背景屬性的主成分,降低了屬性間相關(guān)性對(duì)評(píng)價(jià)結(jié)果的影響。最后,本文自主開(kāi)發(fā)了一套新浪微博爬蟲(chóng),抓取了大量微博數(shù)據(jù),利用該數(shù)據(jù)對(duì)本文提出的算法進(jìn)行了測(cè)試,并與經(jīng)典算法進(jìn)行了比較。實(shí)驗(yàn)結(jié)果驗(yàn)證了本文提出的算法具有較高的有效性與準(zhǔn)確性。利用提出的模型,論文還設(shè)計(jì)并實(shí)現(xiàn)了一套基于B/S架構(gòu)的微博用戶(hù)社會(huì)關(guān)系離線(xiàn)挖掘系統(tǒng)。
[Abstract]:With the rapid development of Internet and mobile communication technology, the social networking platform has attracted a large number of active users, and the social relationships between users have formed an intricate network diagram. How to excavate the potential information in the network map has become a hot topic in the present research. The social relationship mining of micro-blog users is one of the most important research directions. By evaluating the potential relationship strength between micro-blog users, it can find the potential relationship circle of target users, and then achieve user tracking, link prediction, friend recommendation and so on. Based on the research of social relationship mining algorithm based on offline micro-blog data, a new mining model is proposed to evaluate the relationship between users scientifically and comprehensively, so as to find out the user relationship circle. The main works of this paper include the following aspects: first, the research status of micro-blog social relations mining is studied in detail, including two main aspects, namely, the establishment of social relations indicators and the evaluation model. At the same time, summed up the shortcomings of current research methods, including: less species existing model evaluation index, model design ignore some features of micro-blog network, index of fusion using a simple weighted sum, without considering the different user behavior preference for fusion evaluation influence. Furthermore, this paper proposes an adaptive offline mining algorithm for social relations of micro-blog users based on multi dimension user similarity information fusion. Five aspects of the algorithm from POI data, micro-blog map, virtual map, virtual users two users - micro-blog map, the background data of the proposed user evaluation sub algorithm, and proposes a micro-blog user social relationship evaluation model based on the maximum likelihood (Decision Algorithm Model based on Maximum Likelihood. DAMML) the user relationship evaluation information of the five indicators of the comprehensive decision. By analyzing the comprehensive decision information, the potential relationships of the target users can be found. The evaluation of the relationship between five users of the algorithm proposed in this paper: sub - combined with the evaluation of virtual micro-blog maps user interest relation (Interests of Users and algorithm Virtual Microblog Graph, IUVMG), the algorithm uses the LDA model, user reviews, like behavior information added to the user interest feature matrix, improve evaluation accuracy of user interest the relationship between the administrative division; consider and sign information users active position similarity evaluation algorithm (Administrative Region and User Check-in Information, ARUCI), the algorithm of active users by considering active position extraction, resident similarity effect and wait when friends meet two parts, micro-blog network users to solve the problem of data sparseness; user relationship evaluation and combination of common friends and friends of the entry and expansion graph algorithm (Out-in Degree and Mutual Friends, ODM F), the algorithm considers the user node access, and puts forward the concept of virtual users, the algorithm is extended to two friends; - consider the interaction behavior of user interaction algorithm (Tendency of User density Inter Behavior, TUIB), the algorithm solves the micro-blog user interaction behavior of non equivalence problem; user relationship - evaluation of user context attributes algorithm (User Background Information, UBI), the main component of the algorithm using principal component analysis method to extract the user background properties, reduce the impact on the evaluation results of the correlation between attributes. Finally, we developed a set of sina micro-blog crawler independently, and seized a lot of micro-blog data. We used this data to test the algorithm proposed in this paper, and compared it with the classical algorithm. The experimental results show that the proposed algorithm has high effectiveness and accuracy. Using the proposed model, this paper also designs and implements a set of offline mining system for social relations of micro-blog users based on B/S architecture.
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP393.092

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 鄭煒冬;;試卷相似度自動(dòng)評(píng)估技術(shù)的研究[J];智能計(jì)算機(jī)與應(yīng)用;2011年06期

2 趙濤;肖建;;二型模糊相似度及其應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2013年08期

3 徐志明;李棟;劉挺;李生;王剛;袁樹(shù)侖;;微博用戶(hù)的相似性度量及其應(yīng)用[J];計(jì)算機(jī)學(xué)報(bào);2014年01期

4 李桂林,陳曉云;關(guān)于聚類(lèi)分析中相似度的討論[J];計(jì)算機(jī)工程與應(yīng)用;2004年31期

5 秦玉平;楊興凱;;基于案例推理的區(qū)間屬性相似度研究[J];遼寧師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年04期

6 蔣鵬;;基于本體的應(yīng)急案例相似度算法研究[J];南昌高專(zhuān)學(xué)報(bào);2009年03期

7 何亞;;詞語(yǔ)相似度算法的分析與改進(jìn)[J];硅谷;2011年24期

8 仇麗青;陳卓艷;;基于共同鄰居相似度的社區(qū)發(fā)現(xiàn)算法[J];信息系統(tǒng)工程;2014年05期

9 焦鵬;唐見(jiàn)兵;查亞兵;;仿真可信度評(píng)估中相似度方法的改進(jìn)及其應(yīng)用[J];系統(tǒng)仿真學(xué)報(bào);2007年12期

10 姜毅;樂(lè)慶玲;;一種基于興趣相似度的學(xué)習(xí)社區(qū)算法[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年16期

相關(guān)會(huì)議論文 前10條

1 劉海波;鄭德權(quán);趙鐵軍;;基于相似度線(xiàn)性加權(quán)方法的檢索結(jié)果聚類(lèi)研究[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

2 陸勁挺;路強(qiáng);劉曉平;;對(duì)比相似度計(jì)算方法及其在功能樹(shù)擴(kuò)展中的應(yīng)用[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年

3 董刊生;方金云;;基于向量距離的詞序相似度算法[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

4 劉曉平;陸勁挺;;任意功能樹(shù)的物元相似度求解方法[A];全國(guó)第21屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2010)暨全國(guó)第2屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2010年

5 王茜;張衛(wèi)星;;基于分類(lèi)樹(shù)相似度加權(quán)的協(xié)同過(guò)濾算法[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年

6 洪文學(xué);王金甲;常鳳香;宋佳霖;劉文遠(yuǎn);王立強(qiáng);;基于圖形特征增強(qiáng)的相似度分類(lèi)器的研究[A];中國(guó)生物醫(yī)學(xué)工程進(jìn)展——2007中國(guó)生物醫(yī)學(xué)工程聯(lián)合學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2007年

7 雷慶;吳揚(yáng)揚(yáng);;一種基于語(yǔ)義信息計(jì)算XML文檔相似度的新方法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年

8 葉正;林鴻飛;楊志豪;;基于問(wèn)句相似度的中文FAQ問(wèn)答系統(tǒng)研究[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年

9 羅辛;歐陽(yáng)元新;熊璋;袁滿(mǎn);;通過(guò)相似度支持度優(yōu)化基于K近鄰的協(xié)同過(guò)濾算法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯一[C];2010年

10 王健;劉衍珩;焦玉;;VANETs信任傳播建模[A];中國(guó)通信學(xué)會(huì)通信軟件技術(shù)委員會(huì)2009年學(xué)術(shù)會(huì)議論文集[C];2009年

相關(guān)重要報(bào)紙文章 前1條

1 王伽 衛(wèi)江;出入境證件照片應(yīng)及時(shí)更換[N];中國(guó)國(guó)門(mén)時(shí)報(bào);2008年

相關(guān)博士學(xué)位論文 前10條

1 操震洲;矢量數(shù)據(jù)動(dòng)態(tài)多尺度網(wǎng)絡(luò)傳輸研究[D];南京大學(xué);2015年

2 程亮;基于本體的疾病數(shù)據(jù)整合與挖掘方法研究[D];哈爾濱工業(yè)大學(xué);2014年

3 張明西;信息網(wǎng)絡(luò)中的相似度搜索問(wèn)題研究[D];復(fù)旦大學(xué);2013年

4 武威;異質(zhì)數(shù)據(jù)相似度學(xué)習(xí)及其在網(wǎng)絡(luò)搜索中的應(yīng)用[D];北京大學(xué);2012年

5 朱娜斐;基于RTT相似度的網(wǎng)絡(luò)延遲估測(cè)理論和方法[D];北京工業(yè)大學(xué);2012年

6 錢(qián)鵬飛;基于模糊相似度的異構(gòu)本體映射、合并及校驗(yàn)方法的研究[D];上海交通大學(xué);2008年

7 馬海平;基于概率生成模型的相似度建模技術(shù)研究及應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年

8 劉守群;海量網(wǎng)絡(luò)視頻快速檢索關(guān)鍵技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年

9 夏云慶;IHSMTS系統(tǒng)中啟發(fā)式類(lèi)比翻譯處理機(jī)制(HATM)的設(shè)計(jì)與實(shí)現(xiàn)[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2001年

10 姜雅文;復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)若干問(wèn)題研究[D];北京交通大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 楊巧;基于改進(jìn)相似度的社會(huì)網(wǎng)絡(luò)鏈接預(yù)測(cè)研究[D];華南理工大學(xué);2015年

2 張寧;某于《知網(wǎng)》的詞語(yǔ)相似度優(yōu)化算法[D];昆明理工大學(xué);2015年

3 沈迤淳;歌曲中相似片段的檢測(cè)及其應(yīng)用[D];復(fù)旦大學(xué);2014年

4 梁霄;社交網(wǎng)絡(luò)中的社區(qū)聚集研究[D];上海交通大學(xué);2015年

5 王魁;在線(xiàn)社交中基于微博的好友推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2015年

6 洪耀停;基于共同作者圖的合作者推薦系統(tǒng)[D];浙江大學(xué);2015年

7 褚立超;基于相似度評(píng)分模型的人員識(shí)別方法研究[D];廣西大學(xué);2015年

8 蒲進(jìn)興;基于動(dòng)態(tài)相似度的錯(cuò)誤定位優(yōu)先排序[D];北京化工大學(xué);2015年

9 余超;基于Google Map的地理位置查詢(xún)系統(tǒng)[D];電子科技大學(xué);2014年

10 烏蘭;基于動(dòng)力學(xué)行為的復(fù)雜網(wǎng)絡(luò)社區(qū)檢測(cè)研究[D];內(nèi)蒙古工業(yè)大學(xué);2015年



本文編號(hào):1342489

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1342489.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)d23eb***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
在线视频免费看你懂的| 久久热九九这里只有精品| 在线观看欧美视频一区| 日本一区二区三区黄色| 免费精品一区二区三区| 久久精品欧美一区二区三不卡 | 日韩精品一区二区三区射精| 日本午夜免费观看视频| 99福利一区二区视频| 97人妻精品免费一区二区| 不卡视频免费一区二区三区| 日本不卡在线视频你懂的| 日本av在线不卡一区| 日韩特级黄片免费观看| 婷婷色网视频在线播放| 国产一二三区不卡视频| 99国产精品国产精品九九 | 91人人妻人人爽人人狠狠| 亚洲精选91福利在线观看| 九九热精品视频在线观看 | 制服丝袜美腿美女一区二区| 日本熟妇熟女久久综合| 九九热国产这里只有精品| 亚洲天堂一区在线播放| 91精品视频全国免费| 中文字幕中文字幕在线十八区| 91麻豆精品欧美一区| 草草夜色精品国产噜噜竹菊| 最新国产欧美精品91| 亚洲精品中文字幕一二三| 在线精品首页中文字幕亚洲| 日韩日韩欧美国产精品| 免费播放一区二区三区四区| 久久91精品国产亚洲| 日韩欧美高清国内精品| 欧美精品二区中文乱码字幕高清| 久久精品国产亚洲av麻豆| 真实国产乱子伦对白视频不卡| 国产在线不卡中文字幕| 久久机热频这里只精品| 性欧美唯美尤物另类视频|