天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 新聞傳播論文 >

基于BTM主題模型的微博群體用戶畫像研究

發(fā)布時(shí)間:2021-11-28 11:54
  隨著信息技術(shù)和互聯(lián)網(wǎng)的不斷發(fā)展,以微博、微信等為代表的社交媒體平臺(tái)發(fā)展十分迅速,逐漸對(duì)人們的日常生活產(chǎn)生了巨大影響。人們?cè)谶@些平臺(tái)上自由地交流、表達(dá)個(gè)人情緒、分享個(gè)人意見的過程中產(chǎn)生了海量的信息數(shù)據(jù),如何有效利用這些海量信息,創(chuàng)造出更有價(jià)值的用戶服務(wù)是當(dāng)今研究的熱點(diǎn)。本論文在充分考慮微博數(shù)據(jù)特點(diǎn)的基礎(chǔ)上,提出一種新穎的基于BTM(Biterm Topic Model)的微博群體用戶畫像模型GUPTM(Group User Profile Model based Topic Model),將用戶的背景信息、社交信息、主題興趣緊密聯(lián)系在一起,從而構(gòu)建出更為精準(zhǔn)、全面、細(xì)致的社交平臺(tái)微博群體的用戶畫像。同時(shí),對(duì)群體用戶畫像在網(wǎng)絡(luò)輿情治理方面的應(yīng)用展開詳細(xì)研究,最終為網(wǎng)絡(luò)輿情治理提出新的治理對(duì)策。論文的主要研究?jī)?nèi)容如下:首先,提出一種新的基于BTM主題模型的微博群體用戶聚類方法。從微博平臺(tái)獲取用戶自由發(fā)布和分享的信息,建立模型數(shù)據(jù)集;對(duì)其進(jìn)行用戶關(guān)系分析和數(shù)據(jù)預(yù)處理,然后利用BTM主題模型挖掘用戶的主題興趣;分別計(jì)算用戶背景信息相似度、用戶社交信息相似度以及用戶主題興趣相似度,再將三種用戶相似... 

【文章來源】:燕山大學(xué)河北省

【文章頁數(shù)】:83 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于BTM主題模型的微博群體用戶畫像研究


BTM生成模型

序列,文本,成詞,概率


1)中文詞匯按照 BEMS 四個(gè)狀態(tài)來標(biāo)記,即開始位置(begin),結(jié)束位置(end位置(middle),單獨(dú)成詞的位置(singgle)。2)通過模型訓(xùn)練得到的概率表,即獲得一個(gè)概率最大的 BEMS 序列(以 B 打尾),進(jìn)行句子的重新組合,最終得到分詞結(jié)果。2.2 停用詞過濾從所獲得的微博用戶數(shù)據(jù)中可以看到,新浪微博中存在著常見的一些信息式以及出現(xiàn)次數(shù)頻繁的詞或符號(hào),如:“轉(zhuǎn)發(fā)”、“#”、“//”、“@”等微博文本本身的話題相關(guān)性并不大,我們將其稱為停用詞。網(wǎng)絡(luò)流行了多種具有各自特點(diǎn)的停用詞表,主要包括“百度停用詞列表”、“哈工大停用詞表”、大學(xué)機(jī)器學(xué)習(xí)智能實(shí)驗(yàn)室停用詞庫(kù)”等。我們對(duì)這些主流的停用詞表進(jìn)行去并加以總結(jié),綜合生成一個(gè)新的停用詞表。該停用詞表共包含 1893 個(gè)停用詞完整的針對(duì)微博文本,具體如圖 3-2 所示。

聚類,主題,輿情,文檔


第 5 章 微博群體用戶畫像模型在網(wǎng)絡(luò)輿情中的應(yīng)用用戶綜合相似度。然后利用 BTM 主題模型得到的文檔-主題矩陣,將率最大的文檔所對(duì)應(yīng)的微博用戶,作為 K-means 聚類的初始中心。最ans 聚類算法進(jìn)行用戶分群,實(shí)驗(yàn)設(shè)定的聚類數(shù) k 分別取 5 和 10,兩次圖 5-4、5-5 所示:

【參考文獻(xiàn)】:
期刊論文
[1]基于用戶畫像的圖書館大數(shù)據(jù)知識(shí)服務(wù)情境化推薦[J]. 劉海鷗,姚蘇梅,黃文娜,張亞明.  圖書館學(xué)研究. 2018(24)
[2]面向情境化推薦服務(wù)的圖書館用戶畫像研究[J]. 劉海鷗,黃文娜,謝姝琳.  圖書館學(xué)研究. 2018(20)
[3]基于云模型理論的群體用戶畫像模型[J]. 姚龍飛,何利力.  計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(06)
[4]一種用戶畫像系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 王洋,丁志剛,鄭樹泉,齊文秀.  計(jì)算機(jī)應(yīng)用與軟件. 2018(03)
[5]一種用于構(gòu)建用戶畫像的多視角融合框架[J]. 費(fèi)鵬,林鴻飛,楊亮,徐博,古麗孜熱·艾尼外.  計(jì)算機(jī)科學(xué). 2018(01)
[6]基于用戶畫像的圖書館知識(shí)發(fā)現(xiàn)服務(wù)研究[J]. 張鈞.  圖書與情報(bào). 2017(06)
[7]一種集成用戶畫像與內(nèi)容的服務(wù)重定向方法[J]. 熊偉,杭波,李兵,吳釗,谷瓊.  小型微型計(jì)算機(jī)系統(tǒng). 2017(12)
[8]基于社會(huì)認(rèn)同理論的微博群體用戶畫像[J]. 林燕霞,謝湘生.  情報(bào)理論與實(shí)踐. 2018(03)
[9]基于動(dòng)態(tài)主題模型融合多維數(shù)據(jù)的微博社區(qū)發(fā)現(xiàn)算法[J]. 劉冰玉,王翠榮,王聰,王軍偉,王興偉,黃敏.  軟件學(xué)報(bào). 2017(02)
[10]UGC網(wǎng)站用戶畫像研究[J]. 陳志明,胡震云.  計(jì)算機(jī)系統(tǒng)應(yīng)用. 2017(01)

碩士論文
[1]基于多模態(tài)社交媒體數(shù)據(jù)源的用戶畫像構(gòu)建的研究[D]. 黃秀.電子科技大學(xué) 2018
[2]基于主題模型的社交網(wǎng)絡(luò)用戶畫像分析方法[D]. 馬超.中國(guó)科學(xué)技術(shù)大學(xué) 2017
[3]基于主題模型的用戶畫像提取算法研究[D]. 王丹.北京工業(yè)大學(xué) 2016
[4]大數(shù)據(jù)背景下用戶畫像的統(tǒng)計(jì)方法實(shí)踐研究[D]. 李映坤.首都經(jīng)濟(jì)貿(mào)易大學(xué) 2016



本文編號(hào):3524378

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/xinwenchuanbolunwen/3524378.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3029e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com