考慮重疊社區(qū)效應的個性化推薦方法研究
發(fā)布時間:2021-12-24 06:24
信息過載是大數(shù)據(jù)時代的突出問題之一,通過個性化推薦緩解信息過載,提升用戶體驗,已經(jīng)成為目前熱門的研究領域。現(xiàn)有推薦方法多聚焦于用戶和商品的交互數(shù)據(jù),然而電子商務網(wǎng)站存在海量用戶和商品,單一的用戶-商品交互數(shù)據(jù)存在數(shù)據(jù)稀疏和“冷啟動”問題。為了解決這些問題,研究人員考慮引入用戶的在線社交關系輔助建模用戶偏好。用戶在社交活動中通常會加入多個社區(qū),利用多社區(qū)構成的重疊社區(qū)建模用戶偏好的研究目前較少。本文基于用戶加入的重疊社區(qū)可以有效反應用戶興趣偏好這一事實,提出了一種考慮重疊社區(qū)效應的推薦方法。該方法通過用戶的商品交互數(shù)據(jù)和重疊社區(qū)數(shù)據(jù)聯(lián)合建模用戶的興趣偏好,同時利用在語義信息挖掘上表現(xiàn)突出的主題模型挖掘數(shù)據(jù)背后隱藏的興趣主題。該方法通過將用戶類比為文檔、商品和社區(qū)類比為兩類單詞、用戶的興趣偏好類比為文檔主題,將用戶的商品購買決策過程轉化為文檔單詞的生成過程,并基于主題模型原理建模用戶的興趣偏好。本文利用Gibbs抽樣推斷模型參數(shù),根據(jù)模型參數(shù)計算商品對目標用戶的效用值,取效用值較高的商品生成目標用戶的推薦列表。最后,本文利用CiteUlike公開數(shù)據(jù)集比較、驗證所提方法與幾組經(jīng)典的推薦方法...
【文章來源】:合肥工業(yè)大學安徽省 211工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【部分圖文】:
主題模型簡單示意圖
圖 2.3 LDA 的概率圖模型Fig 2.3 Probabilistic Graphical Model of LDA型圖可以拆分為如下兩個過程: ,這個過程表示在生成第 篇文檔的然后根據(jù)這個分布生成了文檔中第 個詞 = ,這個過程表示從 個主題 的分布,然后生成詞匯 。型中,M 篇文檔會對應 M 個獨立 Dirich應 K 個獨立的 Dirichlet-Multinomial 共軛合, 是可以觀察到的已知變量, 和量 、 和 都是未知的隱含變量,計的。根據(jù) LDA 的圖模型,我們可以寫 ) = ( | ) ( |
圖3.1 給出了概率圖模型。模型及其后續(xù)推導中用到的符號及其含義見表 3.1。表 3.1 相關字符含義Tab 3.1 Description of notations used in the model符號 說明 用戶集合、商品集合、社區(qū)集合 隱主題數(shù)量 不重復用戶數(shù)量, = 不重復商品數(shù)量 = 不重復社區(qū)數(shù)量 = 第 個用戶選擇的商品數(shù)量 第 個用戶選擇的社區(qū)數(shù)量 狄利克雷先驗參數(shù) 用戶-興趣主題多項式分布 興趣主題-商品多項式分布 興趣主題-社區(qū)多項式分布 第 個用戶交互的第 個商品的主題 第 個用戶的第 個社區(qū)的主題 商品 社區(qū) ( )用戶購買的商品中,商品屬于主題 的個數(shù) ( )不考慮當前需要更新興趣主題的商品,用戶購買的商品中,商品屬于主題 的個數(shù) 即不考慮主題,用戶夠買的商品個數(shù) ( )社區(qū) 在興趣主題 下出現(xiàn)的次數(shù) ( )不考慮當前需要更新興趣主題的社區(qū),社區(qū) 在興趣主題 下出現(xiàn)的次數(shù) 主題 下分配的商品個數(shù) ( )用戶加入的社區(qū)中,社區(qū)屬于主題 的個數(shù) ( )不考慮當前需要更新興趣主題的社區(qū),戶加入的社區(qū)中,社區(qū)屬于主題 的個數(shù) 即不考慮主題
本文編號:3549978
【文章來源】:合肥工業(yè)大學安徽省 211工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【部分圖文】:
主題模型簡單示意圖
圖 2.3 LDA 的概率圖模型Fig 2.3 Probabilistic Graphical Model of LDA型圖可以拆分為如下兩個過程: ,這個過程表示在生成第 篇文檔的然后根據(jù)這個分布生成了文檔中第 個詞 = ,這個過程表示從 個主題 的分布,然后生成詞匯 。型中,M 篇文檔會對應 M 個獨立 Dirich應 K 個獨立的 Dirichlet-Multinomial 共軛合, 是可以觀察到的已知變量, 和量 、 和 都是未知的隱含變量,計的。根據(jù) LDA 的圖模型,我們可以寫 ) = ( | ) ( |
圖3.1 給出了概率圖模型。模型及其后續(xù)推導中用到的符號及其含義見表 3.1。表 3.1 相關字符含義Tab 3.1 Description of notations used in the model符號 說明 用戶集合、商品集合、社區(qū)集合 隱主題數(shù)量 不重復用戶數(shù)量, = 不重復商品數(shù)量 = 不重復社區(qū)數(shù)量 = 第 個用戶選擇的商品數(shù)量 第 個用戶選擇的社區(qū)數(shù)量 狄利克雷先驗參數(shù) 用戶-興趣主題多項式分布 興趣主題-商品多項式分布 興趣主題-社區(qū)多項式分布 第 個用戶交互的第 個商品的主題 第 個用戶的第 個社區(qū)的主題 商品 社區(qū) ( )用戶購買的商品中,商品屬于主題 的個數(shù) ( )不考慮當前需要更新興趣主題的商品,用戶購買的商品中,商品屬于主題 的個數(shù) 即不考慮主題,用戶夠買的商品個數(shù) ( )社區(qū) 在興趣主題 下出現(xiàn)的次數(shù) ( )不考慮當前需要更新興趣主題的社區(qū),社區(qū) 在興趣主題 下出現(xiàn)的次數(shù) 主題 下分配的商品個數(shù) ( )用戶加入的社區(qū)中,社區(qū)屬于主題 的個數(shù) ( )不考慮當前需要更新興趣主題的社區(qū),戶加入的社區(qū)中,社區(qū)屬于主題 的個數(shù) 即不考慮主題
本文編號:3549978
本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/3549978.html
最近更新
教材專著