天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于微博的專家用戶搜索關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2021-06-22 10:19
  近年來(lái),隨著Web2.0的快速發(fā)展,社會(huì)網(wǎng)絡(luò)越來(lái)越普及,Twitter和Weibo等微博客被廣泛使用,并產(chǎn)生了巨大的社會(huì)影響力,改變了人們的生活方式。微博中有數(shù)以億記的用戶,用戶的身份也各不相同,其中有名人機(jī)構(gòu),也有草根大眾。如何從這些海量的用戶中發(fā)現(xiàn)與主題相關(guān)的專家用戶是一件很有挑戰(zhàn)的事情。本文以新浪微博平臺(tái)為基礎(chǔ),通過(guò)用戶標(biāo)簽數(shù)據(jù)和用戶關(guān)注關(guān)系數(shù)據(jù)來(lái)挖掘用戶的專家屬性。本文通過(guò)調(diào)查統(tǒng)計(jì)分析,發(fā)現(xiàn)微博用戶朋友之間興趣趨同的特點(diǎn),提出同質(zhì)性假設(shè)。針對(duì)微博用戶標(biāo)簽數(shù)據(jù)缺失、標(biāo)簽數(shù)量少、信息含量低等問(wèn)題,本文提出改進(jìn)的TF-IDF模型,過(guò)濾低信息含量的用戶自標(biāo)簽,并基于同質(zhì)性假設(shè),設(shè)計(jì)一種標(biāo)簽傳播算法來(lái)擴(kuò)展用戶的興趣標(biāo)簽,形成用戶的興趣圖譜。通過(guò)用戶的興趣圖譜,給用戶關(guān)注關(guān)系附上相應(yīng)語(yǔ)義信息,以此為基礎(chǔ),利用眾包的策略來(lái)推斷話題專家。根據(jù)微博網(wǎng)絡(luò)中的二八原則,即20%的用戶產(chǎn)生80%的內(nèi)容,本文把微博網(wǎng)絡(luò)中的用戶分為核心群體和輔助群體兩大部分。在興趣圖譜基礎(chǔ)之上,本文根據(jù)特定話題構(gòu)建局部網(wǎng)絡(luò),提出基于用戶分級(jí)的SALSA算法來(lái)計(jì)算用戶的話題影響力,推斷用戶的專家屬性,并根據(jù)微博平臺(tái)固有特點(diǎn)... 

【文章來(lái)源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校

【文章頁(yè)數(shù)】:61 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景
        1.1.1 社會(huì)網(wǎng)絡(luò)現(xiàn)狀
        1.1.2 研究熱點(diǎn)
    1.2 研究意義
    1.3 研究現(xiàn)狀
    1.4 論文主要工作
    1.5 論文組織結(jié)構(gòu)
第二章 相關(guān)概念
    2.1 社會(huì)網(wǎng)絡(luò)
        2.1.1 社會(huì)網(wǎng)絡(luò)構(gòu)成
        2.1.2 社會(huì)網(wǎng)絡(luò)的經(jīng)典理論
    2.2 同質(zhì)性
        2.2.1 同質(zhì)性定義
        2.2.2 社會(huì)網(wǎng)絡(luò)中的同質(zhì)性現(xiàn)象
    2.3 專家用戶
    2.4 本章小結(jié)
第三章 微博用戶興趣圖譜挖掘
    3.1 興趣圖譜
        3.1.1 興趣圖譜定義
        3.1.2 微博用戶標(biāo)簽
    3.2 TF-IDF模型
        3.2.1 TF-IDF模型介紹
        3.2.2 改進(jìn)的TF-IDF算法實(shí)現(xiàn)
    3.3 標(biāo)簽傳播
        3.3.1 標(biāo)簽傳播算法
        3.3.2 實(shí)驗(yàn)設(shè)計(jì)
    3.4 結(jié)果分析
    3.5 本章小結(jié)
第四章 微博用戶影響力分析
    4.1 引言
    4.2 基于Topic sensitive Pagerank的影響力分析
        4.2.1 Pagerank算法介紹
        4.2.2 Topic sensitive Pagerank算法介紹
        4.2.3 算法實(shí)現(xiàn)與分析
    4.3 基于SALSA的影響力分析
    4.4 基于用戶分級(jí)SALSA的影響力分析
        4.4.1 用戶分級(jí)模型介紹
        4.4.2 算法實(shí)現(xiàn)與分析
        4.4.3 多特征融合模型
    4.5 本章小結(jié)
第五章 基于微博數(shù)據(jù)集的實(shí)驗(yàn)驗(yàn)證
    5.1 數(shù)據(jù)集描述
    5.2 性能評(píng)測(cè)方法描述
        5.2.1 Precision-Recall
        5.2.2 P@N
        5.2.3 MAP
        5.2.4 NDCG
    5.3 結(jié)果評(píng)測(cè)
        5.3.1 實(shí)驗(yàn)環(huán)境
        5.3.2 評(píng)測(cè)內(nèi)容
    5.4 本章小結(jié)
第六章 總結(jié)
    6.1 工作總結(jié)
    6.2 下一步研究方向
致謝
參考文獻(xiàn)
作者在學(xué)期間取得的學(xué)術(shù)成果
作者在學(xué)期間參加的科研項(xiàng)目


【參考文獻(xiàn)】:
期刊論文
[1]復(fù)雜網(wǎng)絡(luò)聚類方法[J]. 楊博,劉大有,金弟,馬海賓.  軟件學(xué)報(bào). 2009(01)



本文編號(hào):3242661

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3242661.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶aea3d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com