天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于信任關(guān)系與主題分析的微博用戶推薦技術(shù)

發(fā)布時間:2017-04-03 14:00

  本文關(guān)鍵詞:基于信任關(guān)系與主題分析的微博用戶推薦技術(shù),,由筆耕文化傳播整理發(fā)布。


【摘要】:社交網(wǎng)站的快速發(fā)展深刻影響到了人們的信息共享和交流方式,而作為開放式在線的社交平臺,社交網(wǎng)站的成功基本取決于用戶的交互程度和用戶黏性。隨著用戶規(guī)模的暴發(fā)性增長,推薦準確的潛在好友對社交網(wǎng)站運營方的意義越來越大。 本文首先探討了現(xiàn)行的幾種好友推薦機制,針對傳統(tǒng)推薦算法未考慮推薦過程中的信任問題,設(shè)計了一種社交網(wǎng)絡(luò)中的信任模型,以度量用戶信譽度及用戶間的信任關(guān)系。之后將信譽度小于某一閾值的用戶過濾,并對剩余的可信用戶劃分子群、依據(jù)用戶間話題相似度生成最終推薦列表。旨在向用戶推薦其感興趣的潛在好友,幫助用戶擴大朋友圈子,進而提高用戶粘性。本文主要工作如下: 第一,在進行用戶間信任強度建模時,綜合考慮了社交網(wǎng)絡(luò)中的結(jié)構(gòu)化信息以及用戶之間的交互強度、關(guān)注話題相似度等多個因素,構(gòu)建了包含三類節(jié)點的異構(gòu)網(wǎng)絡(luò)圖,在其上提出了一種多因素綜合考慮的信任模型。針對三種信任度如何加權(quán)的問題,首先從信任關(guān)系的定義出發(fā),給出一個優(yōu)化目標方程,再根據(jù)少量已標注數(shù)據(jù)對方程中的參數(shù)進行求解,最終求得參數(shù)值。 第二,在進行用戶的主題識別時,考慮到微博文本短、有噪音等實際特點,利用微博內(nèi)容上的標簽(hashtag),先將用戶內(nèi)類似的微博聚集起來,通過增加一個文檔中的內(nèi)容,增強詞組之間的共現(xiàn)關(guān)系,再利用主題模型進行識別。 第三,在進行不可信用戶識別時,引入信譽度的概念,針對大規(guī)模社交網(wǎng)絡(luò)中數(shù)據(jù)標注較為困難的特點,利用上一步中的信任關(guān)系模型,從少量已標注數(shù)據(jù)出發(fā),對未標注的節(jié)點計算信譽度。此處傳播的是信譽度,未采用傳統(tǒng)的機器學習算法進行分類判別,而是對于每個節(jié)點更新其信譽度,最終超過0的判別為可信,低于0的判別為不可信。 第四,在進行基于信任模型的社區(qū)劃分算法時,首先參考PGP算法里的推薦者信任模型,在直接信任的基礎(chǔ)上考慮推薦信任,提出一種基于信任傳播的社區(qū)劃分算法。還利用了MapReduce思想對算法進行并行化設(shè)計,使得算法具有較好的可擴展性。
【關(guān)鍵詞】:社交網(wǎng)絡(luò) 信任關(guān)系 信譽度 社區(qū) 主題模型
【學位授予單位】:華東理工大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP393.092;TP391.3
【目錄】:
  • 摘要5-6
  • Abstract6-8
  • 目錄8-10
  • 第1章 緒論10-14
  • 1.1 研究背景10-11
  • 1.2 研究意義11-12
  • 1.3 本文工作12
  • 1.3.1 主要研究內(nèi)容12
  • 1.3.2 研究目標12
  • 1.4 本文結(jié)構(gòu)12-14
  • 第2章 社交網(wǎng)絡(luò)中用戶推薦相關(guān)技術(shù)介紹14-33
  • 2.1 好友推薦技術(shù)的研究現(xiàn)狀14-15
  • 2.1.1 基于用戶特征的好友推薦14
  • 2.1.2 基于用戶關(guān)系網(wǎng)絡(luò)的好友推薦14-15
  • 2.2 社交網(wǎng)絡(luò)中不可信用戶檢測的研究現(xiàn)狀15-16
  • 2.3 社區(qū)劃分的研究現(xiàn)狀16-18
  • 2.3.1 基于優(yōu)化目標函數(shù)的復雜網(wǎng)絡(luò)社區(qū)劃分方法17-18
  • 2.3.2 啟發(fā)式的復雜網(wǎng)絡(luò)聚類方法18
  • 2.4 微博話題識別的研究現(xiàn)狀18-19
  • 2.5 社交網(wǎng)絡(luò)中的信任度19-20
  • 2.6 支持向量機模型20-26
  • 2.6.1 最大間隔超平面21
  • 2.6.2 線性可分支持向量分類機(線性硬間隔分類機)21-22
  • 2.6.3 線性不可分支持向量分類機(線性軟間隔分類機)22-23
  • 2.6.4 非線性可分支持向量分類機(非線性硬間隔分類機)23-24
  • 2.6.5 非線性不可分支持向量分類機(非線性軟間隔分類機)24
  • 2.6.6 核函數(shù)24-26
  • 2.7 并行化編程模型MapReduce26-28
  • 2.7.1 MapReduce編程模型26-28
  • 2.7.2 Hadoop平臺28
  • 2.8 微博爬蟲技術(shù)的研究現(xiàn)狀28-32
  • 2.8.1 JSoup解析器簡介29-31
  • 2.8.2 Socket簡介31
  • 2.8.3 Net平臺下的WebBrowser控件31-32
  • 2.9 本章小結(jié)32-33
  • 第3章 基于信任關(guān)系及主題分析的推薦算法33-56
  • 3.1 算法整體框架33-35
  • 3.2 微博數(shù)據(jù)爬取模塊35-37
  • 3.2.1 AJAX頁面內(nèi)容的獲取35
  • 3.2.2 信息抽取35-36
  • 3.2.3 微博爬蟲模塊設(shè)計36-37
  • 3.3 微博數(shù)據(jù)預處理模塊37-41
  • 3.3.1 LDA(Latent Dirichlet Allocation)主題模型38-39
  • 3.3.2 Gibbs抽樣39-40
  • 3.3.3 用戶關(guān)注主題向量的挖掘40-41
  • 3.4 社交網(wǎng)絡(luò)中信任模型生成模塊41-54
  • 3.4.1 用戶間信任模型的構(gòu)建41-44
  • 3.4.2 不可信用戶的過濾44-46
  • 3.4.3 基于用戶信任鏈的社區(qū)發(fā)現(xiàn)算法46-54
  • 3.5 推薦列表生成模塊54-55
  • 3.6 本章小結(jié)55-56
  • 第4章 實驗效果與評估56-65
  • 4.1 不可信用戶識別實驗效果評估56-58
  • 4.1.1 實驗環(huán)境及實驗數(shù)據(jù)56-57
  • 4.1.2 基準方法的選擇57
  • 4.1.3 實驗結(jié)果分析57-58
  • 4.2 基于信任度的用戶社區(qū)劃分算法實驗效果評估58-61
  • 4.2.1 實驗環(huán)境及實驗數(shù)據(jù)59
  • 4.2.2 精準度對比59-60
  • 4.2.3 可擴展性60-61
  • 4.3 用戶推薦算法實驗效果評估61-63
  • 4.3.1 評價方法61-62
  • 4.3.2 實驗結(jié)果評估與分析62-63
  • 4.4 本章小結(jié)63-65
  • 第5章 總結(jié)和展望65-67
  • 5.1 本文總結(jié)65-66
  • 5.2 不足與展望66-67
  • 參考文獻67-71
  • 致謝71-72
  • 攻讀碩士學位期間發(fā)表的論文72

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 閆瑞;曹先彬;李凱;;面向短文本的動態(tài)組合分類算法[J];電子學報;2009年05期

2 李勇軍;代亞非;;對等網(wǎng)絡(luò)信任機制研究[J];計算機學報;2010年03期

3 雷環(huán);彭艦;;SNS中結(jié)合聲譽與主觀邏輯的信任網(wǎng)絡(luò)分析[J];計算機應(yīng)用研究;2010年06期

4 彭澤映;俞曉明;許洪波;劉春陽;;大規(guī)模短文本的不完全聚類[J];中文信息學報;2011年01期

5 王晟;王子琪;張銘;;個性化微博推薦算法[J];計算機科學與探索;2012年10期

6 胡文江;胡大偉;高永兵;郝斌;;基于關(guān)聯(lián)規(guī)則與標簽的好友推薦算法[J];計算機工程與科學;2013年02期

7 Marcelo G.Armentano;Daniela Godoy;Analía Amandi;;Topology-Based Recommendation of Users in Micro-Blogging Communities[J];Journal of Computer Science & Technology;2012年03期

8 彭澤環(huán);孫樂;韓先培;石貝;;基于排序?qū)W習的微博用戶推薦[J];中文信息學報;2013年04期

9 毛佳昕;劉奕群;張敏;馬少平;;基于用戶行為的微博用戶社會影響力分析[J];計算機學報;2014年04期

10 彭泗清;信任的建立機制:關(guān)系運作與法制手段[J];社會學研究;1999年02期


  本文關(guān)鍵詞:基于信任關(guān)系與主題分析的微博用戶推薦技術(shù),由筆耕文化傳播整理發(fā)布。



本文編號:284410

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/284410.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3b3ed***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com