天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 新聞傳播論文 >

基于主題詞的微博用戶興趣模型研究

發(fā)布時間:2020-12-18 02:21
  現(xiàn)如今,我國移動互聯(lián)網(wǎng)發(fā)展逐漸成熟穩(wěn)定,行業(yè)發(fā)展更加注重內(nèi)容品質(zhì),模式創(chuàng)新以及平臺化趨勢。廣告市場的發(fā)展方向是移動化、社交化、視頻化,這就使得微博的商業(yè)價值越來越受到業(yè)內(nèi)肯定,成為行業(yè)內(nèi)廣告主爭相購買的社交平臺。本文以微博平臺的用戶數(shù)據(jù)為基礎,構(gòu)建微博用戶興趣模型。首先,通過對歷史文獻的參考閱讀發(fā)現(xiàn),僅以原創(chuàng)微博作為數(shù)據(jù)來源,挖掘用戶興趣偏好不夠準確。對微博用戶的一系列行為數(shù)據(jù)進行統(tǒng)計分析,最終確定本文的數(shù)據(jù)來源為用戶原創(chuàng)微博、用戶關注分組以及自定義標簽。對于不同的數(shù)據(jù)來源,采用不同的處理方式進行數(shù)據(jù)的預處理,然后通過相應的規(guī)則方法構(gòu)建微博用戶興趣模型,最后得到三個基礎模型,通過算法將這三部分有效的融合,最終構(gòu)建微博用戶興趣模型體系。本文的貢獻在于融合了微博用戶原創(chuàng)微博、用戶關注分組以及自定義標簽三種途徑獲取的用戶興趣模型,對用戶興趣偏好進行了更加精確地挖掘。在前人對LDA改進的基礎上,將模型應用于微博用戶興趣的深度挖掘中,將模型的先驗概率,更換為后驗概率確定用戶興趣模型,提高了主題模型的計算效率,并且保證了主題興趣挖掘的準確度。最后,通過召回率、查準率等評價指標對模型進行評價分析,并... 

【文章來源】:首都經(jīng)濟貿(mào)易大學北京市

【文章頁數(shù)】:58 頁

【學位級別】:碩士

【部分圖文】:

基于主題詞的微博用戶興趣模型研究


微博信息流展示機制微博的產(chǎn)品定位是社交平臺,相比于其它競爭產(chǎn)品而言,微博的最大競爭優(yōu)勢在于名人設計

模型示例,主題,語義


人們對于文本認識的不斷發(fā)展,逐漸開始追求更深層次的理解,希望可以幫更好的解析文本,從而服務于人類社會。這就衍生出,更加深入的文本挖掘研是自然語言任務處理,比如自動問答。人們對于文本表達方式的要求更高,挖掘出文本的潛在語義,從而使表達方式更加的生動靈活。LSA(Latent Semlysis),即潛在語義分析就是早期的自然語言處理思想,以及到后來出現(xiàn)的主是其核心思想的延伸[25]。LSA 在維度上加入了語義維度,打破了人們“文本間上”的思維禁錮。語義維度指的是文檔集合的主題概括,文檔是語義維度式。直觀表示為,由原來的文檔→詞映射表示,新加進了一個語義維度,也→語義→詞。LSA 的核心想法是加入了詞和詞之間在文檔中的共現(xiàn),通過使數(shù)的方法來獲取“語言維度”,從而實現(xiàn)語義空間上的文檔的低維表示。由此,我們可以簡單的理解為主題模型中的主題是指潛在語義分析中的語義和語料庫存在依存關系,在給定的不同語料集合下,獲得的隱藏語義不盡相可以看作是語料集合中語義的概括表示。如圖 2.1 舉例,我們可以看出每一有不同的語義相對應[26]。

概率模型,文檔


第 2 章SA 模型 是對于潛在語義分析的概率拓展[27]。首先,對于一篇文檔,假設它應,那么,將這篇文檔拆分成多個文檔,對于每個文檔而言,都有分布,文檔中詞語的生成步驟如下,第一步,根據(jù)文檔主題分布選;第二步,根據(jù)該主題對應的一元語言模型,生成詞語。,即概率潛在語義分析,是一種建立在雙模式和共現(xiàn)的數(shù)據(jù)分析方法是一種經(jīng)典的統(tǒng)計學方法。PLSA 主要應用于文本機器學習、自然檢索等相關領域,和標準的潛在語義分析相比,PLSA 是在派生自 合矩陣的分解,而標準的 LSA 的表現(xiàn)形式是以共現(xiàn)表的奇異值分解多項式分布和條件概率分布的混合基礎上進行建模,實現(xiàn)共現(xiàn)概率

【參考文獻】:
期刊論文
[1]改進的基于《知網(wǎng)》的詞匯語義相似度計算[J]. 朱征宇,孫俊華.  計算機應用. 2013(08)
[2]構(gòu)建微博用戶興趣模型的主題模型的分析[J]. 陳文濤,張小明,李舟軍.  計算機科學. 2013(04)
[3]基于LDA的微博文本主題建模方法研究述評[J]. 張培晶,宋蕾.  圖書情報工作. 2012(24)
[4]微博用戶關系挖掘研究綜述[J]. 王連喜,蔣盛益,龐觀松,吳美玲.  情報雜志. 2012(12)
[5]微博用戶關注興趣的社會網(wǎng)絡分析[J]. 袁園,孫霄凌,朱慶華.  現(xiàn)代圖書情報技術. 2012(02)
[6]基于綜合用戶信息的用戶興趣建模研究[J]. 邵秀麗,乜聚科,侯樂彩,田振雷.  南開大學學報(自然科學版). 2009(03)
[7]基于行為分析的用戶興趣建模[J]. 許波,張結(jié)魁,周軍.  情報雜志. 2009(06)
[8]主題網(wǎng)絡爬蟲研究綜述[J]. 劉金紅,陸余良.  計算機應用研究. 2007(10)
[9]基于HowNet的詞匯語義傾向計算[J]. 朱嫣嵐,閔錦,周雅倩,黃萱菁,吳立德.  中文信息學報. 2006(01)
[10]一種面向個性化服務的客戶端細粒度用戶建模方法[J]. 應曉敏,劉明,竇文華.  計算機工程與科學. 2003(06)

碩士論文
[1]基于HowNet的短文本語義相似度計算方法研究[D]. 趙謙.太原理工大學 2017
[2]基于主題模型的用戶興趣建模及在新聞推薦中的應用[D]. 陳銘權(quán).華南理工大學 2015
[3]基于主題模型的微博話題檢測與跟蹤研究[D]. 謝黎黎.中南林業(yè)科技大學 2015
[4]基于微博內(nèi)容和用戶關注的微博用戶興趣模型構(gòu)建[D]. 袁博陽.華南理工大學 2015
[5]基于主題模型的個性化信息推薦[D]. 邸亮.北京工業(yè)大學 2014
[6]微博用戶行為特征研究[D]. 韓藝.南京大學 2014
[7]基于主題模型的微博推薦系統(tǒng)研究[D]. 謝昊.華東師范大學 2013
[8]基于微博的用戶興趣分析與個性化信息推薦[D]. 王廣新.上海交通大學 2013



本文編號:2923160

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/xinwenchuanbolunwen/2923160.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b2045***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com