天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 社科論文 > 新聞傳播論文 >

基于主題詞的微博用戶(hù)興趣模型研究

發(fā)布時(shí)間:2020-12-18 02:21
  現(xiàn)如今,我國(guó)移動(dòng)互聯(lián)網(wǎng)發(fā)展逐漸成熟穩(wěn)定,行業(yè)發(fā)展更加注重內(nèi)容品質(zhì),模式創(chuàng)新以及平臺(tái)化趨勢(shì)。廣告市場(chǎng)的發(fā)展方向是移動(dòng)化、社交化、視頻化,這就使得微博的商業(yè)價(jià)值越來(lái)越受到業(yè)內(nèi)肯定,成為行業(yè)內(nèi)廣告主爭(zhēng)相購(gòu)買(mǎi)的社交平臺(tái)。本文以微博平臺(tái)的用戶(hù)數(shù)據(jù)為基礎(chǔ),構(gòu)建微博用戶(hù)興趣模型。首先,通過(guò)對(duì)歷史文獻(xiàn)的參考閱讀發(fā)現(xiàn),僅以原創(chuàng)微博作為數(shù)據(jù)來(lái)源,挖掘用戶(hù)興趣偏好不夠準(zhǔn)確。對(duì)微博用戶(hù)的一系列行為數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,最終確定本文的數(shù)據(jù)來(lái)源為用戶(hù)原創(chuàng)微博、用戶(hù)關(guān)注分組以及自定義標(biāo)簽。對(duì)于不同的數(shù)據(jù)來(lái)源,采用不同的處理方式進(jìn)行數(shù)據(jù)的預(yù)處理,然后通過(guò)相應(yīng)的規(guī)則方法構(gòu)建微博用戶(hù)興趣模型,最后得到三個(gè)基礎(chǔ)模型,通過(guò)算法將這三部分有效的融合,最終構(gòu)建微博用戶(hù)興趣模型體系。本文的貢獻(xiàn)在于融合了微博用戶(hù)原創(chuàng)微博、用戶(hù)關(guān)注分組以及自定義標(biāo)簽三種途徑獲取的用戶(hù)興趣模型,對(duì)用戶(hù)興趣偏好進(jìn)行了更加精確地挖掘。在前人對(duì)LDA改進(jìn)的基礎(chǔ)上,將模型應(yīng)用于微博用戶(hù)興趣的深度挖掘中,將模型的先驗(yàn)概率,更換為后驗(yàn)概率確定用戶(hù)興趣模型,提高了主題模型的計(jì)算效率,并且保證了主題興趣挖掘的準(zhǔn)確度。最后,通過(guò)召回率、查準(zhǔn)率等評(píng)價(jià)指標(biāo)對(duì)模型進(jìn)行評(píng)價(jià)分析,并... 

【文章來(lái)源】:首都經(jīng)濟(jì)貿(mào)易大學(xué)北京市

【文章頁(yè)數(shù)】:58 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于主題詞的微博用戶(hù)興趣模型研究


微博信息流展示機(jī)制微博的產(chǎn)品定位是社交平臺(tái),相比于其它競(jìng)爭(zhēng)產(chǎn)品而言,微博的最大競(jìng)爭(zhēng)優(yōu)勢(shì)在于名人設(shè)計(jì)

模型示例,主題,語(yǔ)義


人們對(duì)于文本認(rèn)識(shí)的不斷發(fā)展,逐漸開(kāi)始追求更深層次的理解,希望可以幫更好的解析文本,從而服務(wù)于人類(lèi)社會(huì)。這就衍生出,更加深入的文本挖掘研是自然語(yǔ)言任務(wù)處理,比如自動(dòng)問(wèn)答。人們對(duì)于文本表達(dá)方式的要求更高,挖掘出文本的潛在語(yǔ)義,從而使表達(dá)方式更加的生動(dòng)靈活。LSA(Latent Semlysis),即潛在語(yǔ)義分析就是早期的自然語(yǔ)言處理思想,以及到后來(lái)出現(xiàn)的主是其核心思想的延伸[25]。LSA 在維度上加入了語(yǔ)義維度,打破了人們“文本間上”的思維禁錮。語(yǔ)義維度指的是文檔集合的主題概括,文檔是語(yǔ)義維度式。直觀表示為,由原來(lái)的文檔→詞映射表示,新加進(jìn)了一個(gè)語(yǔ)義維度,也→語(yǔ)義→詞。LSA 的核心想法是加入了詞和詞之間在文檔中的共現(xiàn),通過(guò)使數(shù)的方法來(lái)獲取“語(yǔ)言維度”,從而實(shí)現(xiàn)語(yǔ)義空間上的文檔的低維表示。由此,我們可以簡(jiǎn)單的理解為主題模型中的主題是指潛在語(yǔ)義分析中的語(yǔ)義和語(yǔ)料庫(kù)存在依存關(guān)系,在給定的不同語(yǔ)料集合下,獲得的隱藏語(yǔ)義不盡相可以看作是語(yǔ)料集合中語(yǔ)義的概括表示。如圖 2.1 舉例,我們可以看出每一有不同的語(yǔ)義相對(duì)應(yīng)[26]。

概率模型,文檔


第 2 章SA 模型 是對(duì)于潛在語(yǔ)義分析的概率拓展[27]。首先,對(duì)于一篇文檔,假設(shè)它應(yīng),那么,將這篇文檔拆分成多個(gè)文檔,對(duì)于每個(gè)文檔而言,都有分布,文檔中詞語(yǔ)的生成步驟如下,第一步,根據(jù)文檔主題分布選;第二步,根據(jù)該主題對(duì)應(yīng)的一元語(yǔ)言模型,生成詞語(yǔ)。,即概率潛在語(yǔ)義分析,是一種建立在雙模式和共現(xiàn)的數(shù)據(jù)分析方法是一種經(jīng)典的統(tǒng)計(jì)學(xué)方法。PLSA 主要應(yīng)用于文本機(jī)器學(xué)習(xí)、自然檢索等相關(guān)領(lǐng)域,和標(biāo)準(zhǔn)的潛在語(yǔ)義分析相比,PLSA 是在派生自 合矩陣的分解,而標(biāo)準(zhǔn)的 LSA 的表現(xiàn)形式是以共現(xiàn)表的奇異值分解多項(xiàng)式分布和條件概率分布的混合基礎(chǔ)上進(jìn)行建模,實(shí)現(xiàn)共現(xiàn)概率

【參考文獻(xiàn)】:
期刊論文
[1]改進(jìn)的基于《知網(wǎng)》的詞匯語(yǔ)義相似度計(jì)算[J]. 朱征宇,孫俊華.  計(jì)算機(jī)應(yīng)用. 2013(08)
[2]構(gòu)建微博用戶(hù)興趣模型的主題模型的分析[J]. 陳文濤,張小明,李舟軍.  計(jì)算機(jī)科學(xué). 2013(04)
[3]基于LDA的微博文本主題建模方法研究述評(píng)[J]. 張培晶,宋蕾.  圖書(shū)情報(bào)工作. 2012(24)
[4]微博用戶(hù)關(guān)系挖掘研究綜述[J]. 王連喜,蔣盛益,龐觀松,吳美玲.  情報(bào)雜志. 2012(12)
[5]微博用戶(hù)關(guān)注興趣的社會(huì)網(wǎng)絡(luò)分析[J]. 袁園,孫霄凌,朱慶華.  現(xiàn)代圖書(shū)情報(bào)技術(shù). 2012(02)
[6]基于綜合用戶(hù)信息的用戶(hù)興趣建模研究[J]. 邵秀麗,乜聚科,侯樂(lè)彩,田振雷.  南開(kāi)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2009(03)
[7]基于行為分析的用戶(hù)興趣建模[J]. 許波,張結(jié)魁,周軍.  情報(bào)雜志. 2009(06)
[8]主題網(wǎng)絡(luò)爬蟲(chóng)研究綜述[J]. 劉金紅,陸余良.  計(jì)算機(jī)應(yīng)用研究. 2007(10)
[9]基于HowNet的詞匯語(yǔ)義傾向計(jì)算[J]. 朱嫣嵐,閔錦,周雅倩,黃萱菁,吳立德.  中文信息學(xué)報(bào). 2006(01)
[10]一種面向個(gè)性化服務(wù)的客戶(hù)端細(xì)粒度用戶(hù)建模方法[J]. 應(yīng)曉敏,劉明,竇文華.  計(jì)算機(jī)工程與科學(xué). 2003(06)

碩士論文
[1]基于HowNet的短文本語(yǔ)義相似度計(jì)算方法研究[D]. 趙謙.太原理工大學(xué) 2017
[2]基于主題模型的用戶(hù)興趣建模及在新聞推薦中的應(yīng)用[D]. 陳銘權(quán).華南理工大學(xué) 2015
[3]基于主題模型的微博話題檢測(cè)與跟蹤研究[D]. 謝黎黎.中南林業(yè)科技大學(xué) 2015
[4]基于微博內(nèi)容和用戶(hù)關(guān)注的微博用戶(hù)興趣模型構(gòu)建[D]. 袁博陽(yáng).華南理工大學(xué) 2015
[5]基于主題模型的個(gè)性化信息推薦[D]. 邸亮.北京工業(yè)大學(xué) 2014
[6]微博用戶(hù)行為特征研究[D]. 韓藝.南京大學(xué) 2014
[7]基于主題模型的微博推薦系統(tǒng)研究[D]. 謝昊.華東師范大學(xué) 2013
[8]基于微博的用戶(hù)興趣分析與個(gè)性化信息推薦[D]. 王廣新.上海交通大學(xué) 2013



本文編號(hào):2923160

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/xinwenchuanbolunwen/2923160.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)b2045***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com