多階信息模型及推薦技術(shù)研究
發(fā)布時(shí)間:2017-05-30 07:10
本文關(guān)鍵詞:多階信息模型及推薦技術(shù)研究,由筆耕文化傳播整理發(fā)布。
【摘要】:社區(qū)結(jié)構(gòu)刻畫了網(wǎng)絡(luò)中邊連接關(guān)系的局部聚集特性,網(wǎng)絡(luò)中的社區(qū)通常由功能相近或性質(zhì)相似的網(wǎng)絡(luò)節(jié)點(diǎn)所組成,發(fā)現(xiàn)網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)有助于揭示網(wǎng)絡(luò)結(jié)構(gòu)和功能之間的關(guān)系。早前網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)的研究主要集中在博客、郵件等媒體,近幾年隨著web2.0的發(fā)展,諸如Facebook,twitter,微博、人人網(wǎng)等SNS積累了大量的用戶數(shù)據(jù),發(fā)現(xiàn)SNS中的用戶社區(qū)結(jié)構(gòu)極具商業(yè)價(jià)值,也吸引了大量的研究者研究其網(wǎng)絡(luò)社區(qū)結(jié)構(gòu),但這些研究大多基于單一的數(shù)據(jù)源信息構(gòu)建模型,大量的可利用的數(shù)據(jù)沒有得到利用。本文利用從新浪微博抓取的數(shù)據(jù),基于模塊度最大化思想,結(jié)合好友關(guān)系、地理位置和興趣標(biāo)簽的多階情境信息,使用張量分解的思想將多階情境信息降維,采用譜聚類方法尋找社區(qū)結(jié)構(gòu)信息。最后利用聚類系數(shù)評(píng)估聚類質(zhì)量,并采用單一信息源發(fā)現(xiàn)社區(qū)結(jié)構(gòu)算法與本文算法做對(duì)比實(shí)驗(yàn)評(píng)估本文綜合多階情境信息發(fā)現(xiàn)社區(qū)結(jié)構(gòu)模型質(zhì)量。當(dāng)前主流的協(xié)同推薦技術(shù)有基于用戶、基于項(xiàng)目和基于用戶項(xiàng)目的協(xié)同推薦技術(shù);隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,以及用戶興趣漂移等原因,用戶的興趣標(biāo)簽、地理位置數(shù)據(jù)成為推薦技術(shù)研究中的一項(xiàng)新的重要因子,實(shí)現(xiàn)結(jié)合好友關(guān)系、標(biāo)簽信息和地理位置數(shù)據(jù)的的個(gè)性化推薦具有重要的意義。傳統(tǒng)的協(xié)同推薦技術(shù)無法很好解決大眾標(biāo)注數(shù)據(jù)推薦中所面臨的標(biāo)簽語義和數(shù)據(jù)稀疏性問題,本文綜合利用多維信息獲得的社團(tuán)聚類、用戶興趣標(biāo)簽和標(biāo)簽主題構(gòu)造原始張量,并使用高階奇異值分解方法找出推薦結(jié)果,實(shí)驗(yàn)采用結(jié)合召回率和準(zhǔn)確率的F值進(jìn)行評(píng)估。
【關(guān)鍵詞】:社區(qū)結(jié)構(gòu) 社區(qū)發(fā)現(xiàn) 推薦技術(shù) 模塊度最大化 高階奇異值分解
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.3
【目錄】:
- 摘要5-6
- Abstract6-11
- 第1章 緒論11-21
- 1.1 研究背景和意義11-13
- 1.1.1 研究背景11-12
- 1.1.2 研究意義12-13
- 1.2 研究現(xiàn)狀及趨勢(shì)13-16
- 1.2.1 社區(qū)發(fā)現(xiàn)研究概況13-14
- 1.2.2 推薦系統(tǒng)研究概況14-16
- 1.3 研究目標(biāo)及內(nèi)容16-18
- 1.4 論文組織結(jié)構(gòu)18-19
- 1.5 論文符號(hào)及說明19
- 1.6 本章小結(jié)19-21
- 第2章 相關(guān)理論及說明21-34
- 2.1 發(fā)現(xiàn)社區(qū)結(jié)構(gòu)研究21-28
- 2.1.1 社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)21-23
- 2.1.2 社區(qū)結(jié)構(gòu)發(fā)現(xiàn)算法23-25
- 2.1.3 社區(qū)結(jié)構(gòu)的評(píng)價(jià)測(cè)度25-28
- 2.2 推薦技術(shù)相關(guān)研究28-31
- 2.2.1 推薦算法研究28-30
- 2.2.2 推薦質(zhì)量測(cè)度30-31
- 2.3 潛在狄利克雷分配31-33
- 2.4 本章小結(jié)33-34
- 第3章 數(shù)據(jù)預(yù)處理34-49
- 3.1 微博用戶數(shù)據(jù)特征34-35
- 3.2 模塊化矩陣35-36
- 3.3 用戶關(guān)注數(shù)據(jù)處理36-41
- 3.3.1 微博用戶關(guān)注關(guān)系說明36-37
- 3.3.2 基于關(guān)注關(guān)系的用戶相似度計(jì)算37-41
- 3.4 用戶興趣數(shù)據(jù)處理41-48
- 3.4.1 興趣標(biāo)簽數(shù)據(jù)分析41-42
- 3.4.2 分詞及詞語擴(kuò)展42-43
- 3.4.3 抽取興趣主題43-46
- 3.4.5 基于標(biāo)簽信息的用戶相似度計(jì)算46-48
- 3.5 用戶地理位置數(shù)據(jù)處理48
- 3.6 本章小結(jié)48-49
- 第4章 基于模塊度最大化思想結(jié)合多維數(shù)據(jù)發(fā)現(xiàn)社區(qū)結(jié)構(gòu)49-63
- 4.1 社區(qū)發(fā)現(xiàn)49-50
- 4.2 發(fā)現(xiàn)社區(qū)算法及設(shè)計(jì)50-56
- 4.2.1 模塊度最大化50-53
- 4.2.2 多維信息源的社區(qū)聚類53-56
- 4.3 實(shí)驗(yàn)結(jié)果及分析56-62
- 4.3.1 實(shí)驗(yàn)實(shí)施56-59
- 4.3.2 評(píng)估標(biāo)準(zhǔn)59-60
- 4.3.3 實(shí)驗(yàn)方案及結(jié)果分析60-62
- 4.4 本章小結(jié)62-63
- 第5章 基于用戶聚類社團(tuán)和高階奇異值分解的標(biāo)簽推薦63-72
- 5.1 大眾標(biāo)注63-65
- 5.2 推薦模型及設(shè)計(jì)65-69
- 5.2.1 奇異值分解65-66
- 5.2.2 張量分解建模66-69
- 5.3 實(shí)驗(yàn)及結(jié)果分析69-71
- 5.3.1 數(shù)據(jù)集69
- 5.3.2 評(píng)估標(biāo)準(zhǔn)69-70
- 5.3.3 實(shí)驗(yàn)方案及結(jié)果分析70-71
- 5.4 本章小結(jié)71-72
- 第6章 總結(jié)及展望72-74
- 6.1 全文總結(jié)72-73
- 6.2 展望73-74
- 參考文獻(xiàn)74-79
- 致謝79
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 馬柏樟;顏志軍;;基于潛在狄利特雷分布模型的網(wǎng)絡(luò)評(píng)論產(chǎn)品特征抽取方法[J];計(jì)算機(jī)集成制造系統(tǒng);2014年01期
2 閆光輝;舒昕;馬志程;李祥;;基于主題和鏈接分析的微博社區(qū)發(fā)現(xiàn)算法[J];計(jì)算機(jī)應(yīng)用研究;2013年07期
3 孫玲芳;李爍朋;;基于K-means聚類與張量分解的社會(huì)化標(biāo)簽推薦系統(tǒng)研究[J];江蘇科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年06期
4 袁園;孫霄凌;朱慶華;;微博用戶關(guān)注興趣的社會(huì)網(wǎng)絡(luò)分析[J];現(xiàn)代圖書情報(bào)技術(shù);2012年02期
5 楊博;趙鵬飛;;推薦算法綜述[J];山西大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期
6 李實(shí);葉強(qiáng);李一軍;羅嗣卿;;挖掘中文網(wǎng)絡(luò)客戶評(píng)論的產(chǎn)品特征及情感傾向[J];計(jì)算機(jī)應(yīng)用研究;2010年08期
7 高e,
本文編號(hào):406623
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/406623.html
最近更新
教材專著