基于TIN-LDA模型的微博推薦方法研究及應(yīng)用
【學(xué)位單位】:安徽理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TP391.3;TP393.092
【部分圖文】:
存在多個(gè)混合主體,而且文章中每個(gè)主題都有著對(duì)應(yīng)的詞的概率分布,可以借助于極大??值算法來完成PLSA模型的構(gòu)建。同時(shí)Hof?Maim也認(rèn)為,這便是真正意義層面的主題??模型,其模型如圖1所示。??該模型以數(shù)學(xué)統(tǒng)計(jì)為基礎(chǔ),對(duì)文檔中不同位置上的詞進(jìn)行概率計(jì)算。在一個(gè)完整的??文檔集中,其每篇文檔d之下的每個(gè)詞V,分成三步來生成:(1)借助于iY必先驗(yàn)概??率,擇選其中的一篇文檔A?(2)再借助于P問勿概率,得到主題二(3)再以??概率,得到單詞w。因此在‘文檔的第w篇中的詞的概率如下公式5所示:??尸卜K)?=?I?Z)*作?K))?=?m)?(5)??9??
現(xiàn)的概率也并非一致:不同文檔的主題概率,以及主題中的詞都屬于Dirichlet分布并呈??現(xiàn)出獨(dú)立性[7Q]。此為,LDA模型還引入了詞袋模型假定,即.?在具體模型之中,對(duì)詞匯??的次序不加考慮,僅僅注重他們出現(xiàn)頻次的分析,LDA模型如圖2所示。??LDA模型主要是使Gibbs抽樣對(duì)參數(shù)進(jìn)行估計(jì)。Gibbs抽樣實(shí)現(xiàn)起來較為容易,且??在大規(guī)模預(yù)料中得到廣泛應(yīng)用。Gibbs的主要思想是不斷釆用條件分布來加以抽樣,使??得抽象結(jié)果更加與全概率分布相近。Gibbs在LDA模型中的抽樣公式如公式7所示:??P{zt?=?k?|?z,?W)?=?(?l'rai,?+ak)/(X,inkmJ?+ak))*{n'kJ?+/S,)/(^,(K,?+?fi,))?(7)??Gibbs抽樣是構(gòu)建LDA模型的重要基礎(chǔ)。LDA模型的訓(xùn)練過程,是借助于Gibbs抽??樣算式,對(duì)文檔中的每個(gè)詞的主題進(jìn)行迭代抽樣,從而預(yù)測(cè)新文檔的主題分布[71]。該訓(xùn)??練流程的步驟為:??(1)
第2章相關(guān)技術(shù)與方法??使用了不同物品之間的相關(guān)性,而非不同用戶之間的相關(guān)性;谖锲返膮f(xié)同過濾如下??圖3所示:??n?^?0??物口口?1??用戶1?J??0?IT!?W??r ̄^l??I?用戶?3??J?J??LL??物品2??用戶2??圖3基于物品的協(xié)同過濾??Figure?3?Item-based?collaborative?filtering??在3圖中,如果1、2兩個(gè)用戶,對(duì)兩個(gè)物品,即物品1與物品2產(chǎn)生過行為。這??樣,就能將兩個(gè)物品納入相似物品。即所有對(duì)1物品有了行為的用戶,那么也會(huì)對(duì)2物??品產(chǎn)生行為。所以,如果用戶3對(duì)1物品產(chǎn)生行為,那么就能向其推薦物品2。??但協(xié)同過濾算法缺乏一定的個(gè)性化,其推薦結(jié)果主要是按照目標(biāo)用戶閱讀歷史數(shù)據(jù)??來進(jìn)行,很難展現(xiàn)出同類用戶群、諸多目標(biāo)用戶群與類似用戶群興趣的差異,這就使得??推薦結(jié)果缺乏個(gè)性化。在構(gòu)筑相似用戶群之前,若A,B兩用戶所瀏覽微博內(nèi)容基本一??致,則A,B用戶便被納入到同一各類似用戶群,用戶群可以獲得一致的推薦結(jié)果。可??實(shí)際生活中他們興趣并不一致
【參考文獻(xiàn)】
相關(guān)期刊論文 前8條
1 張林;錢冠群;樊衛(wèi)國(guó);華琨;張莉;;輕型評(píng)論的情感分析研究[J];軟件學(xué)報(bào);2014年12期
2 高明;金澈清;錢衛(wèi)寧;王曉玲;周傲英;;面向微博系統(tǒng)的實(shí)時(shí)個(gè)性化推薦[J];計(jì)算機(jī)學(xué)報(bào);2014年04期
3 謝昊;江紅;;一種面向微博主題挖掘的改進(jìn)LDA模型[J];華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年06期
4 楊長(zhǎng)春;俞克非;葉施仁;嚴(yán)水歌;丁虹;楊晶;;一種新的中文微博社區(qū)博主影響力的評(píng)估方法[J];計(jì)算機(jī)工程與應(yīng)用;2012年25期
5 王愛國(guó);李廉;楊靜;陳桂林;;一種基于Bayesian網(wǎng)絡(luò)的網(wǎng)頁推薦算法[J];山東大學(xué)學(xué)報(bào)(工學(xué)版);2011年04期
6 李濤;王建東;葉飛躍;馮新宇;張有東;;一種基于用戶聚類的協(xié)同過濾推薦算法[J];系統(tǒng)工程與電子技術(shù);2007年07期
7 蓋杰,王怡,武港山;潛在語義分析理論及其應(yīng)用[J];計(jì)算機(jī)應(yīng)用研究;2004年03期
8 李靜梅,孫麗華,張巧榮,張春生;一種文本處理中的樸素貝葉斯分類器[J];哈爾濱工程大學(xué)學(xué)報(bào);2003年01期
本文編號(hào):2837270
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2837270.html