基于項(xiàng)目云的個(gè)性化推薦算法研究
本文關(guān)鍵詞:基于項(xiàng)目云的個(gè)性化推薦算法研究
更多相關(guān)文章: 推薦系統(tǒng) 協(xié)同過濾 項(xiàng)目云 有序秩聚類 評(píng)分可靠度
【摘要】:近年來,隨著互聯(lián)網(wǎng)科學(xué)技術(shù)的迅速崛起,網(wǎng)絡(luò)數(shù)據(jù)與日俱增,隨之而來的信息過載問題也日趨嚴(yán)重。因此,對(duì)于用戶而言,從大量繁復(fù)的網(wǎng)絡(luò)訊息中快速、準(zhǔn)確獲取目標(biāo)信息是一項(xiàng)十分重要的任務(wù)。推薦系統(tǒng)作為信息過濾的重要手段,已經(jīng)廣泛應(yīng)用于各大電子商務(wù)網(wǎng)站。然而,隨著網(wǎng)絡(luò)經(jīng)濟(jì)平臺(tái)的擴(kuò)大,網(wǎng)購人數(shù)急劇增多,網(wǎng)上商品種類不斷增加,使得推薦系統(tǒng)的冷啟動(dòng)、稀疏性等缺陷逐漸顯露。針對(duì)傳統(tǒng)算法的不足,本文從定性分析和模糊聚類角度出發(fā),構(gòu)建出一套完整的基于項(xiàng)目云的個(gè)性化推薦系統(tǒng)。該系統(tǒng)巧妙融合云模型與有序秩聚類的優(yōu)勢,在傳統(tǒng)算法的基礎(chǔ)上提出一種基于項(xiàng)目云的有序秩聚類協(xié)同過濾推薦算法。本文設(shè)計(jì)的個(gè)性化推薦系統(tǒng)大致可以分成三大模塊:數(shù)據(jù)預(yù)處理、有序秩聚類、預(yù)測和推薦。在數(shù)據(jù)預(yù)處理模塊,本文通過云模型來擬合不同項(xiàng)目的分布情況及其統(tǒng)計(jì)分布特征,并用云發(fā)生器生成的缺失值來還原原始評(píng)分矩陣;其次,該算法將有序秩聚類算法與推薦系統(tǒng)相結(jié)合,用新定義的排序準(zhǔn)則對(duì)項(xiàng)目云進(jìn)行初步分類,生成有序云向量,為之后的相似度計(jì)算奠定基礎(chǔ);此外,本文選擇“聚類-推薦”模式,在聚類簇內(nèi)探索分析項(xiàng)目云之間的關(guān)系,進(jìn)而生成推薦結(jié)果。同傳統(tǒng)推薦算法相比,該算法主要做出了如下改進(jìn):第一,本文探索分析原始數(shù)據(jù)分布特征與數(shù)據(jù)缺失原理,給出合理的數(shù)據(jù)缺失機(jī)制假設(shè);并通過云模型來擬合數(shù)據(jù)分布特征。第二,為從根本上緩解數(shù)據(jù)極端稀疏性,本文提出兩種數(shù)據(jù)填充算法。一種是依據(jù)項(xiàng)目分布進(jìn)行普通填充;另一種則是通過新定義的用戶評(píng)分可靠度進(jìn)行加權(quán)填充。對(duì)比兩種不同的填充機(jī)制,判斷用戶評(píng)分可靠度對(duì)推薦結(jié)果的影響。第三,填充缺失值時(shí),本文利用經(jīng)驗(yàn)分布函數(shù),對(duì)連續(xù)性隨機(jī)數(shù)進(jìn)行離散化轉(zhuǎn)變成符合本研究數(shù)據(jù)打分機(jī)制的評(píng)分?jǐn)?shù)。這一做法充分考慮到了項(xiàng)目本身的性質(zhì)特征,依據(jù)其統(tǒng)計(jì)分布信息生成缺失值來還原原始評(píng)分矩陣,更能科學(xué)反映項(xiàng)目的評(píng)分特征。第四:本文首次將有序秩聚類算法與推薦系統(tǒng)相結(jié)合,根據(jù)新定義的排序準(zhǔn)則對(duì)項(xiàng)目云進(jìn)行有序秩聚類,不僅能提高推薦精度,且大大縮短了計(jì)算時(shí)間。傳統(tǒng)推薦算法需要計(jì)算相似度nn?2)1(次,本文僅需n?1次。最后,為檢驗(yàn)基于項(xiàng)目云的有序秩聚類協(xié)同過濾推薦算法的有效性,本文用R語言軟件分別對(duì)MovieLens Data和Jester Joke Data進(jìn)行試驗(yàn)。實(shí)證分析結(jié)果表明:新提出的數(shù)據(jù)填充機(jī)制能有效改善系統(tǒng)的極端稀疏性;基于項(xiàng)目云的有序秩聚類算法融入了云模型的不確定性,不僅可以緩解推薦系統(tǒng)的冷啟動(dòng)問題,而且能夠更準(zhǔn)確的定位同質(zhì)項(xiàng)目,提高推薦精度;此外,有序秩聚類算法確實(shí)能夠降低計(jì)算復(fù)雜度,提高推薦系統(tǒng)的可擴(kuò)展性。因此,該算法的提出對(duì)于目前個(gè)性化推薦系統(tǒng)的研究與發(fā)展具有十分重要的意義。
【關(guān)鍵詞】:推薦系統(tǒng) 協(xié)同過濾 項(xiàng)目云 有序秩聚類 評(píng)分可靠度
【學(xué)位授予單位】:太原理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3
【目錄】:
- 摘要3-5
- ABSTRACT5-9
- 第一章 緒論9-17
- 1.1 研究背景9-10
- 1.2 研究意義10-11
- 1.3 研究現(xiàn)狀11-13
- 1.3.1 國外研究現(xiàn)狀11-12
- 1.3.2 國內(nèi)研究現(xiàn)狀12-13
- 1.4 研究內(nèi)容13-16
- 1.4.1 要解決的問題13-15
- 1.4.2 本文的工作15-16
- 1.5 論文的組織結(jié)構(gòu)16-17
- 第二章 相關(guān)理論研究基礎(chǔ)17-39
- 2.1 個(gè)性化推薦系統(tǒng)概述17-24
- 2.1.1 個(gè)性化推薦系統(tǒng)概念17-20
- 2.1.2 常用的個(gè)性化推薦技術(shù)20-24
- 2.2 推薦系統(tǒng)中的聚類算法的概述24-32
- 2.2.1 常見聚類算法的比較25-28
- 2.2.2 有序變量聚類算法簡介28-31
- 2.2.3 相似度計(jì)算公式31-32
- 2.3 云模型概述32-39
- 2.3.1 云模型概念32-34
- 2.3.2 正態(tài)云概述34-39
- 第三章 基于項(xiàng)目云的個(gè)性化推薦算法39-53
- 3.1 數(shù)據(jù)預(yù)處理39-47
- 3.1.1 數(shù)據(jù)缺失機(jī)制假設(shè)39-40
- 3.1.2 數(shù)據(jù)分布假設(shè)40-42
- 3.1.3 改進(jìn)的數(shù)據(jù)填充算法42-47
- 3.2 基于項(xiàng)目云的有序秩聚類47-49
- 3.2.1 相似度計(jì)算47-48
- 3.2.2 改進(jìn)的項(xiàng)目云秩聚類48-49
- 3.3 預(yù)測和推薦49-53
- 第四章 實(shí)證分析53-63
- 4.1 試驗(yàn)?zāi)康募霸u(píng)價(jià)指標(biāo)53-55
- 4.1.1 試驗(yàn)?zāi)康?/span>53-54
- 4.1.2 評(píng)價(jià)指標(biāo)54-55
- 4.2 實(shí)驗(yàn)數(shù)據(jù)55-57
- 4.3 實(shí)驗(yàn)方案及結(jié)果分析57-62
- 4.3.1 試驗(yàn)方案57
- 4.3.2 結(jié)果分析57-62
- 4.4 本章小結(jié)62-63
- 第五章 總結(jié)與展望63-67
- 5.1 研究總結(jié)63-64
- 5.2 前景展望64-67
- 參考文獻(xiàn)67-71
- 攻讀碩士學(xué)位期間學(xué)術(shù)情況71-73
- A. 攻讀碩士學(xué)位期間學(xué)術(shù)論文發(fā)表情況71
- B. 攻讀碩士學(xué)位期間參與科研項(xiàng)目情況71-73
- 致謝73
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 徐義峰;徐云青;劉曉平;;一種基于時(shí)間序列性的推薦算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2006年10期
2 余小鵬;;一種基于多層關(guān)聯(lián)規(guī)則的推薦算法研究[J];計(jì)算機(jī)應(yīng)用;2007年06期
3 張海玉;劉志都;楊彩;賈松浩;;基于頁面聚類的推薦算法的改進(jìn)[J];計(jì)算機(jī)應(yīng)用與軟件;2008年09期
4 張立燕;;一種基于用戶事務(wù)模式的推薦算法[J];福建電腦;2009年03期
5 王晗;夏自謙;;基于蟻群算法和瀏覽路徑的推薦算法研究[J];中國科技信息;2009年07期
6 周珊丹;周興社;王海鵬;倪紅波;張桂英;苗強(qiáng);;智能博物館環(huán)境下的個(gè)性化推薦算法[J];計(jì)算機(jī)工程與應(yīng)用;2010年19期
7 王文;;個(gè)性化推薦算法研究[J];電腦知識(shí)與技術(shù);2010年16期
8 張愷;秦亮曦;寧朝波;李文閣;;改進(jìn)評(píng)價(jià)估計(jì)的混合推薦算法研究[J];微計(jì)算機(jī)信息;2010年36期
9 夏秀峰;代沁;叢麗暉;;用戶顯意識(shí)下的多重態(tài)度個(gè)性化推薦算法[J];計(jì)算機(jī)工程與應(yīng)用;2011年16期
10 楊博;趙鵬飛;;推薦算法綜述[J];山西大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 王韜丞;羅喜軍;杜小勇;;基于層次的推薦:一種新的個(gè)性化推薦算法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2007年
2 唐燦;;基于模糊用戶心理模式的個(gè)性化推薦算法[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年
3 秦國;杜小勇;;基于用戶層次信息的協(xié)同推薦算法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
4 周玉妮;鄭會(huì)頌;;基于瀏覽路徑選擇的蟻群推薦算法:用于移動(dòng)商務(wù)個(gè)性化推薦系統(tǒng)[A];社會(huì)經(jīng)濟(jì)發(fā)展轉(zhuǎn)型與系統(tǒng)工程——中國系統(tǒng)工程學(xué)會(huì)第17屆學(xué)術(shù)年會(huì)論文集[C];2012年
5 蘇日啟;胡皓;汪秉宏;;基于網(wǎng)絡(luò)的含時(shí)推薦算法[A];第五屆全國復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文(摘要)匯集[C];2009年
6 梁莘q,
本文編號(hào):783255
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/783255.html