基于二階隱馬爾可夫模型的協(xié)同過濾算法的研究與應(yīng)用
發(fā)布時間:2022-08-12 21:49
隨著現(xiàn)代社會互聯(lián)網(wǎng)的發(fā)展,信息資訊大量出現(xiàn),這給用戶在信息的選擇上增加了困難。此時,以協(xié)同過濾為首的推薦技術(shù)逐漸引起了人們的關(guān)注。但是,現(xiàn)有的算法不可避免的存在著數(shù)據(jù)稀疏性以及過度依賴評分矩陣等局限性。在現(xiàn)有算法的基礎(chǔ)上,本文利用隱馬爾可夫模型里觀測值與狀態(tài)之間的雙重隨機(jī)性模擬用戶的評分軌跡,從而對協(xié)同過濾的數(shù)據(jù)稀疏性進(jìn)行改進(jìn),但是由于隱馬爾可夫模型無后效性,它無法表示非相鄰狀態(tài)間的依賴關(guān)系,從而導(dǎo)致用戶偏好中部分有用特征的丟失,該模型繼承了一階隱馬爾可夫模型的優(yōu)點,因此本文提出基于二階隱馬爾可夫模型的改進(jìn)協(xié)同過濾算法,以及針對該算法的運(yùn)行效率和用戶可擴(kuò)展問題而提出的聚類優(yōu)化算法。最后應(yīng)用本文提出的算法設(shè)計一套為大學(xué)生群體服務(wù)的信息資訊推薦原型系統(tǒng)。本文的主要研究工作如下:(1)針對現(xiàn)有的協(xié)同過濾算法中的數(shù)據(jù)稀疏性和過度依賴評分矩陣等問題,提出一種基于二階隱馬爾可夫模型的改進(jìn)協(xié)同過濾算法(CF-2HMM)。該算法利用二階隱馬爾可夫模型中狀態(tài)之間轉(zhuǎn)移的隨機(jī)性來模擬用戶的興趣變遷,根據(jù)用戶的評分軌跡,找到用戶下一時刻評分概率最高的項目候選集,緩解了數(shù)據(jù)稀疏性;并將獲得的概率與余弦相似度加權(quán)...
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 研究相關(guān)的基礎(chǔ)知識介紹
2.1 推薦算法
2.1.1 傳統(tǒng)協(xié)同過濾推薦算法
2.1.2 基于模型的協(xié)同過濾推薦算法
2.2 隱馬爾可夫模型
2.2.1 馬爾可夫模型簡介
2.2.2 隱馬爾可夫模型
2.3 HMM的基本算法
2.3.1 HMM的三個基本問題
2.3.2 前向-后向算法
2.3.3 Viterbi算法
2.3.4 Baum-Welch算法
2.4 本章小結(jié)
第三章 基于二階隱馬爾可夫模型的改進(jìn)協(xié)同過濾算法
3.1 問題描述
3.2 二階隱馬爾可夫模型
3.3 算法描述
3.3.1 模型參數(shù)
3.3.2 概率推理
3.3.3 參數(shù)估計
3.3.4 基于項目的協(xié)同過濾算法
3.3.5 算法整體流程
3.4 數(shù)值實驗
3.4.1 實驗環(huán)境和實驗數(shù)據(jù)
3.4.2 實驗評價指標(biāo)
3.4.3 實驗結(jié)果分析
3.5 本章小結(jié)
第四章 融合評分軌跡的用戶聚類算法
4.1 基于K-Means用戶聚類的CF-2HMM算法
4.2 融合評分軌跡的用戶聚類算法(UCST)
4.2.1 融合評分軌跡的綜合相似度
4.2.2 基于綜合相似度的距離度量方法
4.2.3 優(yōu)化的初始簇中心選擇
4.2.4 算法整體流程
4.3 基于UCST的改進(jìn)CF-2HMM算法(CF-2MHM-UCST)
4.4 數(shù)值實驗
4.4.1 實驗環(huán)境和實驗數(shù)據(jù)
4.4.2 實驗評價指標(biāo)
4.4.3 實驗結(jié)果分析
4.5 本章小結(jié)
第五章 信息資訊推薦原型系統(tǒng)設(shè)計與實現(xiàn)
5.1 系統(tǒng)需求分析
5.2 系統(tǒng)架構(gòu)設(shè)計
5.2.1 系統(tǒng)架構(gòu)圖
5.2.2 系統(tǒng)數(shù)據(jù)庫設(shè)計
5.3 推薦算法的應(yīng)用
5.3.1 數(shù)據(jù)預(yù)處理
5.3.2 整體流程
5.4 核心功能實現(xiàn)
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)
6.2 研究展望
參考文獻(xiàn)
致謝
碩士期間研究成果
【參考文獻(xiàn)】:
期刊論文
[1]新聞推薦算法:問題及優(yōu)化策略[J]. 匡文波,陳小龍. 新聞與寫作. 2018(04)
[2]基于二階HMM的中醫(yī)診斷古文詞性標(biāo)注[J]. 劉博,杜建強(qiáng),聶斌,劉蕾,張鑫,郝竹林. 計算機(jī)工程. 2017(07)
[3]從“今日頭條”看個性化新聞推薦系統(tǒng)的優(yōu)劣[J]. 于黎冰. 傳媒. 2016(19)
[4]概率圖模型表示理論[J]. 劉建偉,黎海恩,羅雄麟. 計算機(jī)科學(xué). 2014(09)
[5]狄拉克δ函數(shù)[J]. 徐玲玲,趙永芳,井孝功. 大學(xué)物理. 2010(08)
[6]一種改進(jìn)Viterbi算法的應(yīng)用研究[J]. 李榮,鄭家恒. 計算機(jī)工程與設(shè)計. 2007(03)
[7]隱馬爾可夫模型在生物信息學(xué)中的應(yīng)用[J]. 杜世平. 大學(xué)數(shù)學(xué). 2004(05)
[8]信息檢索的概率模型[J]. 邢永康,馬少平. 計算機(jī)科學(xué). 2003(08)
[9]隱馬爾可夫模型在語音識別中的應(yīng)用[J]. 段紅梅,汪軍,馬良河,徐冉. 工科數(shù)學(xué). 2002(06)
[10]回溯算法的形式模型[J]. 王巖冰,鄭明春,劉弘. 計算機(jī)研究與發(fā)展. 2001(09)
碩士論文
[1]基于協(xié)同過濾的信息推薦系統(tǒng)研究[D]. 郭世龍.北京郵電大學(xué) 2014
本文編號:3676655
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 研究相關(guān)的基礎(chǔ)知識介紹
2.1 推薦算法
2.1.1 傳統(tǒng)協(xié)同過濾推薦算法
2.1.2 基于模型的協(xié)同過濾推薦算法
2.2 隱馬爾可夫模型
2.2.1 馬爾可夫模型簡介
2.2.2 隱馬爾可夫模型
2.3 HMM的基本算法
2.3.1 HMM的三個基本問題
2.3.2 前向-后向算法
2.3.3 Viterbi算法
2.3.4 Baum-Welch算法
2.4 本章小結(jié)
第三章 基于二階隱馬爾可夫模型的改進(jìn)協(xié)同過濾算法
3.1 問題描述
3.2 二階隱馬爾可夫模型
3.3 算法描述
3.3.1 模型參數(shù)
3.3.2 概率推理
3.3.3 參數(shù)估計
3.3.4 基于項目的協(xié)同過濾算法
3.3.5 算法整體流程
3.4 數(shù)值實驗
3.4.1 實驗環(huán)境和實驗數(shù)據(jù)
3.4.2 實驗評價指標(biāo)
3.4.3 實驗結(jié)果分析
3.5 本章小結(jié)
第四章 融合評分軌跡的用戶聚類算法
4.1 基于K-Means用戶聚類的CF-2HMM算法
4.2 融合評分軌跡的用戶聚類算法(UCST)
4.2.1 融合評分軌跡的綜合相似度
4.2.2 基于綜合相似度的距離度量方法
4.2.3 優(yōu)化的初始簇中心選擇
4.2.4 算法整體流程
4.3 基于UCST的改進(jìn)CF-2HMM算法(CF-2MHM-UCST)
4.4 數(shù)值實驗
4.4.1 實驗環(huán)境和實驗數(shù)據(jù)
4.4.2 實驗評價指標(biāo)
4.4.3 實驗結(jié)果分析
4.5 本章小結(jié)
第五章 信息資訊推薦原型系統(tǒng)設(shè)計與實現(xiàn)
5.1 系統(tǒng)需求分析
5.2 系統(tǒng)架構(gòu)設(shè)計
5.2.1 系統(tǒng)架構(gòu)圖
5.2.2 系統(tǒng)數(shù)據(jù)庫設(shè)計
5.3 推薦算法的應(yīng)用
5.3.1 數(shù)據(jù)預(yù)處理
5.3.2 整體流程
5.4 核心功能實現(xiàn)
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)
6.2 研究展望
參考文獻(xiàn)
致謝
碩士期間研究成果
【參考文獻(xiàn)】:
期刊論文
[1]新聞推薦算法:問題及優(yōu)化策略[J]. 匡文波,陳小龍. 新聞與寫作. 2018(04)
[2]基于二階HMM的中醫(yī)診斷古文詞性標(biāo)注[J]. 劉博,杜建強(qiáng),聶斌,劉蕾,張鑫,郝竹林. 計算機(jī)工程. 2017(07)
[3]從“今日頭條”看個性化新聞推薦系統(tǒng)的優(yōu)劣[J]. 于黎冰. 傳媒. 2016(19)
[4]概率圖模型表示理論[J]. 劉建偉,黎海恩,羅雄麟. 計算機(jī)科學(xué). 2014(09)
[5]狄拉克δ函數(shù)[J]. 徐玲玲,趙永芳,井孝功. 大學(xué)物理. 2010(08)
[6]一種改進(jìn)Viterbi算法的應(yīng)用研究[J]. 李榮,鄭家恒. 計算機(jī)工程與設(shè)計. 2007(03)
[7]隱馬爾可夫模型在生物信息學(xué)中的應(yīng)用[J]. 杜世平. 大學(xué)數(shù)學(xué). 2004(05)
[8]信息檢索的概率模型[J]. 邢永康,馬少平. 計算機(jī)科學(xué). 2003(08)
[9]隱馬爾可夫模型在語音識別中的應(yīng)用[J]. 段紅梅,汪軍,馬良河,徐冉. 工科數(shù)學(xué). 2002(06)
[10]回溯算法的形式模型[J]. 王巖冰,鄭明春,劉弘. 計算機(jī)研究與發(fā)展. 2001(09)
碩士論文
[1]基于協(xié)同過濾的信息推薦系統(tǒng)研究[D]. 郭世龍.北京郵電大學(xué) 2014
本文編號:3676655
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3676655.html
最近更新
教材專著