基于協(xié)同過濾的電子商務(wù)推薦算法研究
本文關(guān)鍵詞:基于協(xié)同過濾的電子商務(wù)推薦算法研究
更多相關(guān)文章: 統(tǒng)計模型 最近鄰 協(xié)同過濾 稀疏性 云模型
【摘要】:電子商務(wù)產(chǎn)業(yè)發(fā)展迅猛,網(wǎng)絡(luò)消費群體不斷擴大,網(wǎng)絡(luò)商品推薦技術(shù)應(yīng)運而生。由此而產(chǎn)生的個性化推薦系統(tǒng)不僅能夠快速地發(fā)現(xiàn)用戶興趣并做出推薦,還能發(fā)現(xiàn)用戶潛在興趣,提高電子商務(wù)網(wǎng)站的銷售量。協(xié)同過濾算法(collaborativefiltering)是目前應(yīng)用最廣泛最成功的推薦技術(shù)之一,但該算法有著明顯的缺陷:隨著電子商務(wù)系統(tǒng)規(guī)模的進一步擴大,用戶數(shù)目和項目數(shù)據(jù)急劇增加,嚴(yán)重依賴用戶打分矩陣的協(xié)同過濾算法會因為用戶評分?jǐn)?shù)據(jù)的極端稀疏性而無法正常工作,在這種情況下,傳統(tǒng)的算法得出的最近鄰居不準(zhǔn)確,推薦系統(tǒng)的推薦質(zhì)量急劇下降。 針對現(xiàn)行的電子商務(wù)推薦算法的特點,本文認(rèn)為主要原因在于過于依賴用戶對項目打分矩陣;诖耍疚奶岢鲈谟脩舸蚍植糠植捎没诮y(tǒng)計模型的協(xié)同過濾算法來解決矩陣的稀疏性;同時,利用用戶對項目的文字評論,提取情感特征值,單獨形成推薦,以克服對打分矩陣的依賴性。具體工作如下: 在處理用戶評分矩陣的極端,為了解決用戶評分?jǐn)?shù)據(jù)稀疏性和最近鄰尋找的準(zhǔn)確性問題,本文提出一種基于統(tǒng)計模型的協(xié)同過濾推薦算法。該算法首先利用項目統(tǒng)計信息分類,在類內(nèi)尋找項目的最近鄰居;然后通過預(yù)測項目評分值進行矩陣填充,解決稀疏性問題;最后通過用戶之間的協(xié)同過濾進行推薦。實驗結(jié)果表明,該算法可以準(zhǔn)確地獲取項目及用戶最近鄰,有效地解決數(shù)據(jù)稀疏性問題,同時,該算法還極大地提高了系統(tǒng)的工作效率及推薦的準(zhǔn)確性。 鑒于用戶評論中的情感態(tài)度和偏好程度可以很好地表達(dá)用戶在情感方面的傾向,本文通過建立用戶評論情感傾向語料庫,提取以往用戶評論中的語料詞并根據(jù)模糊算法形成分值,利用云模型形成一個用戶評論情感傾向向量,通過云模型向量間的相似度計算形成最近鄰居從而形成推薦。通過實驗可以得出,在傳統(tǒng)評分矩陣中項目評分稀疏時,仍然能夠通過用戶對項目的情感傾向?qū)Ρ冗M行推薦,并可以以數(shù)據(jù)的形式對用戶情感傾向進行統(tǒng)計。
【關(guān)鍵詞】:統(tǒng)計模型 最近鄰 協(xié)同過濾 稀疏性 云模型
【學(xué)位授予單位】:山東師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.3
【目錄】:
- 摘要7-8
- ABSTRACT8-10
- 第1章 緒論10-18
- 1.1 研究背景10-11
- 1.2 研究意義11
- 1.3 研究現(xiàn)狀11-15
- 1.3.1 協(xié)同過濾算法及稀疏矩陣問題的研究現(xiàn)狀及趨勢11-14
- 1.3.2 用戶評論中的情感分析研究現(xiàn)狀14-15
- 1.4 研究內(nèi)容15-16
- 1.4.1 電子商務(wù)推薦算法需要解決的主要問題15
- 1.4.2 本文的主要工作15-16
- 1.5 論文的組織結(jié)構(gòu)16-18
- 第2章 電子商務(wù)推薦系統(tǒng)概述18-32
- 2.1 基于內(nèi)容的推薦系統(tǒng)20-22
- 2.2 基于協(xié)同過濾的推薦系統(tǒng)22-26
- 2.2.1 相似度計算方法23-24
- 2.2.2 項目分?jǐn)?shù)預(yù)測公式24-25
- 2.2.3 協(xié)同過濾算法的優(yōu)缺點25-26
- 2.3 基于用戶的協(xié)同過濾算法26-27
- 2.4 基于項目的協(xié)同過濾算法27-29
- 2.4.1 生成項目最近鄰28
- 2.4.2 進行推薦28-29
- 2.5 基于模型的推薦系統(tǒng)29-32
- 2.5.1 基于聚類算法的模型29-30
- 2.5.2 網(wǎng)狀貝葉斯模型30
- 2.5.3 基于關(guān)聯(lián)規(guī)則的模型30-32
- 第3章 基于統(tǒng)計模型的協(xié)同過濾算法32-40
- 3.1 基于統(tǒng)計模型的項目分類32-35
- 3.1.1 向域32-33
- 3.1.2 項目分類33-35
- 3.2 項目分?jǐn)?shù)預(yù)測35
- 3.3 項目推薦35-37
- 3.3.1 對稀疏矩陣進行填充35-36
- 3.3.2 產(chǎn)生推薦36-37
- 3.4 實驗及分析37-40
- 3.4.1 實驗數(shù)據(jù)集37
- 3.4.2 測試方法37-38
- 3.4.3 測試標(biāo)準(zhǔn)38
- 3.4.4 實驗結(jié)果及分析38-40
- 第4章 基于云模型的情感傾向?qū)Ρ韧扑]算法40-54
- 4.1 云模型40-43
- 4.1.1 云的定義41-42
- 4.1.2 云的發(fā)生42-43
- 4.2 用戶評論的情感語料庫43-44
- 4.3 推薦過程44-49
- 4.3.1 用戶評論情感計算45-46
- 4.3.2 用戶情感傾向矩陣表示46
- 4.3.3 基于云模型的用戶情感向量46-47
- 4.3.4 相似度計算47-48
- 4.3.5 商品推薦48-49
- 4.4 實驗及分析49-54
- 4.4.1 詞頻統(tǒng)計49-50
- 4.4.2 用戶情感處理50-52
- 4.4.3 情感預(yù)測實驗52-54
- 第5章 總結(jié)與展望54-56
- 5.1 總結(jié)54-55
- 5.2 未來研究展望55-56
- 參考文獻56-60
- 致謝60-61
- 攻讀碩士學(xué)位期間發(fā)表論文61
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 李德毅,劉常昱;論正態(tài)云模型的普適性[J];中國工程科學(xué);2004年08期
2 張仰森,徐波,曹元大;自然語言處理中的語言模型及其比較研究[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2003年01期
3 張鋒;常會友;;使用BP神經(jīng)網(wǎng)絡(luò)緩解協(xié)同過濾推薦算法的稀疏性問題[J];計算機研究與發(fā)展;2006年04期
4 顧曄;呂紅兵;;改進的增量奇異值分解協(xié)同過濾算法[J];計算機工程與應(yīng)用;2011年11期
5 何光輝;魏曙光;王蔚韜;;改進的聚類鄰居協(xié)同過濾推薦算法[J];計算機科學(xué);2004年11期
6 曾艷,麥永浩;基于內(nèi)容預(yù)測和項目評分的協(xié)同過濾推薦[J];計算機應(yīng)用;2004年01期
7 張海燕,丁峰,姜麗紅;基于模糊聚類的協(xié)同過濾推薦方法[J];計算機仿真;2005年08期
8 李德毅,劉常昱,杜瀊,韓旭;不確定性人工智能[J];軟件學(xué)報;2004年11期
9 許海玲;吳瀟;李曉東;閻保平;;互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J];軟件學(xué)報;2009年02期
10 余力,劉魯,羅掌華;我國電子商務(wù)推薦策略的比較分析[J];系統(tǒng)工程理論與實踐;2004年08期
,本文編號:708243
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/708243.html