基于奇異值分解和k-means聚類的電子商務(wù)推薦算法研究
發(fā)布時(shí)間:2017-05-24 06:03
本文關(guān)鍵詞:基于奇異值分解和k-means聚類的電子商務(wù)推薦算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)的大規(guī)模覆蓋和電子商務(wù)的飛速發(fā)展,不斷膨脹的網(wǎng)絡(luò)信息量和網(wǎng)絡(luò)資源,將用戶帶入了一個(gè)信息過載的時(shí)代。伴隨著持續(xù)增長(zhǎng)的海量信息,網(wǎng)絡(luò)用戶無法迅速地找到自己真正需要的部分。如何從海量的資源中主動(dòng)為用戶定位和推送其可能感興趣的內(nèi)容是當(dāng)前推薦系統(tǒng)的主要任務(wù)。推薦系統(tǒng)的最大優(yōu)點(diǎn)在于能夠快速推送用戶真正感興趣的資源,緩解了信息檢索的壓力。目前,在眾多的推薦技術(shù)中,協(xié)同過濾推薦是其最為成功和應(yīng)用最為廣泛的推薦技術(shù)。在協(xié)同過濾推薦研究領(lǐng)域中,主要涉及的模型問題多數(shù)是數(shù)據(jù)的稀疏性和可擴(kuò)展性,以及推薦精度的問題,而k-means聚類算法是一種無監(jiān)督學(xué)習(xí)的算法具有良好分類性能,且適用范圍廣、算法簡(jiǎn)潔。然而面對(duì)數(shù)據(jù)矩陣稀疏性,聚類算法能有效地根據(jù)相似興趣愛好將用戶分配到相同的聚類簇中;聚類產(chǎn)生后,根據(jù)鄰居用戶預(yù)測(cè)評(píng)價(jià)目標(biāo)用戶對(duì)該商品的評(píng)價(jià)。但是由于數(shù)據(jù)稀疏,使得目標(biāo)用戶處在聚類的邊緣,對(duì)該目標(biāo)用戶的推薦精度較低,鑒于此,本文首先采用奇異值分解技術(shù)化解數(shù)據(jù)稀疏性給數(shù)據(jù)對(duì)象聚類造成的不利影響;然后針對(duì)初始聚類中心的隨機(jī)性,提出的改進(jìn)算法與協(xié)同過濾算法進(jìn)行融合,并對(duì)其進(jìn)行仿真實(shí)驗(yàn),實(shí)驗(yàn)驗(yàn)證了改進(jìn)算法具有良好的推薦性能;谄娈愔捣纸獾耐扑]算法的基本思想:首先以協(xié)同過濾算法為主體,針對(duì)出現(xiàn)的稀疏性數(shù)據(jù)造成的推薦精度低問題的基礎(chǔ)上,采用奇異值分解技術(shù),對(duì)評(píng)分矩陣進(jìn)行降維處理,并結(jié)合著梯度下降法對(duì)用戶和項(xiàng)目特征進(jìn)行更新,有效的避免了過擬合現(xiàn)象的發(fā)生,同時(shí)克服了零評(píng)分用戶對(duì)相似度計(jì)算時(shí)出現(xiàn)的推薦不精問題。通過MovieLence數(shù)據(jù)集的測(cè)試,并與傳統(tǒng)的推薦時(shí)推薦算法進(jìn)行對(duì)比,結(jié)果表明該算法在推薦精度方面有較好的改善。一種改進(jìn)初始質(zhì)心的k-means聚類算法的基本思想是:針對(duì)傳統(tǒng)的k-means聚類算法k個(gè)初始聚類中心選擇上的隨機(jī)性,造成聚類結(jié)果的波動(dòng)性,提出了一種能夠生成比較穩(wěn)定的初始聚類中心的改進(jìn)算法;同時(shí),借助均衡化函數(shù)有效尋找最佳k值。通過UCI數(shù)據(jù)集的仿真實(shí)驗(yàn),并與傳統(tǒng)k-means聚類算法進(jìn)行比較,結(jié)果表明該改進(jìn)算法有較好的性能;贙SVD模型的推薦算法的基本思想是:在引入改進(jìn)k-means聚類算法對(duì)數(shù)據(jù)對(duì)象進(jìn)行分類處理時(shí)出現(xiàn)的高維稀疏性數(shù)據(jù)對(duì)算法造成的負(fù)面影響,采用奇異值分解技術(shù),在另一空間進(jìn)行信息傳遞重新表達(dá)數(shù)據(jù)。通過MovieLence數(shù)據(jù)集進(jìn)行函數(shù)仿真,并與其它推薦算法進(jìn)行對(duì)比,結(jié)果表明改進(jìn)算法具有較好的尋優(yōu)能力。
【關(guān)鍵詞】:k-means聚類 奇異值分解 稀疏性數(shù)據(jù) 初始質(zhì)心 梯度下降法
【學(xué)位授予單位】:華中師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:F713.36
【目錄】:
- 摘要6-8
- Abstract8-14
- 1 緒論14-21
- 1.1 研究背景及意義14-15
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀15-18
- 1.2.1 推薦算法的研究現(xiàn)狀15-16
- 1.2.2 奇異值分解算法的研究現(xiàn)狀16-17
- 1.2.3 k-means聚類算法的研究現(xiàn)狀17-18
- 1.3 論文的研究?jī)?nèi)容和創(chuàng)新點(diǎn)18-21
- 1.3.1 論文的主要研究?jī)?nèi)容及組織結(jié)構(gòu)18-19
- 1.3.2 論文的創(chuàng)新點(diǎn)19-21
- 2 個(gè)性化推薦系統(tǒng)及相關(guān)技術(shù)21-31
- 2.1 個(gè)性化推薦系統(tǒng)21-23
- 2.1.1 個(gè)性化推薦系統(tǒng)的基本理論21-22
- 2.1.2 個(gè)性化推薦系統(tǒng)的組成22
- 2.1.3 個(gè)性化推薦系統(tǒng)的功能22-23
- 2.2 推薦算法相關(guān)理論23-26
- 2.2.1 推薦算法概述23-24
- 2.2.2 推薦算法流程24-25
- 2.2.3 推薦算法的應(yīng)用25-26
- 2.3 推薦算法分類26-31
- 2.3.1 協(xié)同過濾推薦算法26-27
- 2.3.2 基于內(nèi)容的推薦算法27-28
- 2.3.3 基于圖結(jié)構(gòu)的推薦算法28-29
- 2.3.4 混合推薦29-31
- 3 基于奇異值分解的推薦算法模型31-45
- 3.1 引言31-32
- 3.2 奇異值分解32-37
- 3.2.1 奇異值分解算法的概述32-34
- 3.2.2 奇異值分解的幾點(diǎn)解釋和標(biāo)注34-35
- 3.2.3 基于SDM的奇異值分解算法35-37
- 3.3 相似度計(jì)算方法37-39
- 3.3.1 基于用戶屬性的相似度算法37-38
- 3.3.2 基于評(píng)分的相似度計(jì)算38-39
- 3.3.3 混合相似度計(jì)算39
- 3.4 推薦算法模型39-41
- 3.4.1 離線預(yù)處理評(píng)分矩陣39-40
- 3.4.2 在線搜索最近鄰居查詢40
- 3.4.3 算法時(shí)間復(fù)雜度40-41
- 3.5 實(shí)證研究和結(jié)果分析41-44
- 3.5.1 測(cè)試數(shù)據(jù)集41-42
- 3.5.2 性能評(píng)價(jià)標(biāo)準(zhǔn)42
- 3.5.3 實(shí)驗(yàn)結(jié)果分析42-44
- 3.6 小結(jié)44-45
- 4 一種改進(jìn)初始質(zhì)心的K-MEANS聚類算法45-55
- 4.1 引言45-46
- 4.2 K-MEANS聚類算法46-48
- 4.2.1 k-means聚類算法的概述46-48
- 4.2.2 k-means聚類算法的性能分析48
- 4.3 算法的改進(jìn)策略48-52
- 4.3.1 初始質(zhì)心的選擇48-50
- 4.3.2 均衡化評(píng)價(jià)函數(shù)50
- 4.3.3 基于初始化中心點(diǎn)和均衡化函數(shù)的k-means算法50-51
- 4.3.4 算法的時(shí)間復(fù)雜度51-52
- 4.4 實(shí)驗(yàn)結(jié)果及分析52-54
- 4.4.1 初始聚類中心的驗(yàn)證52-53
- 4.4.2 均衡化函數(shù)實(shí)驗(yàn)結(jié)果53
- 4.4.3 算法性能比較53-54
- 4.5 小結(jié)54-55
- 5 KSVD模型55-62
- 5.1 引言55-56
- 5.2 KSVD模型實(shí)現(xiàn)56-57
- 5.3 實(shí)證研究和結(jié)果分析57-61
- 5.3.1 實(shí)驗(yàn)數(shù)據(jù)57-58
- 5.3.2 性能評(píng)價(jià)指標(biāo)58
- 5.3.3 實(shí)驗(yàn)結(jié)果分析58-61
- 5.4 小結(jié)61-62
- 6 總結(jié)與展望62-64
- 6.1 總結(jié)62-63
- 6.2 對(duì)未來工作的展望63-64
- 參考文獻(xiàn)64-68
- 在校期間發(fā)表的論文和科研成果68-69
- 致謝69
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前4條
1 蔡浩;賈宇波;黃成偉;;結(jié)合用戶信任模型的協(xié)同過濾推薦方法研究[J];計(jì)算機(jī)工程與應(yīng)用;2010年35期
2 曾小波;魏祖寬;金在弘;;協(xié)同過濾系統(tǒng)的矩陣稀疏性問題的研究[J];計(jì)算機(jī)應(yīng)用;2010年04期
3 吳顏;沈潔;顧天竺;陳曉紅;李慧;張舒;;協(xié)同過濾推薦系統(tǒng)中數(shù)據(jù)稀疏問題的解決[J];計(jì)算機(jī)應(yīng)用研究;2007年06期
4 劉麗;;基于改進(jìn)的迭代式核方法協(xié)同過濾推薦算法研究[J];信息技術(shù)與信息化;2014年12期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 廖文彬;基于矩陣奇異值分解的圖像壓縮方法研究[D];成都理工大學(xué);2007年
2 劉高英;基于位置信息的改進(jìn)LEACH算法研究[D];東北大學(xué);2010年
本文關(guān)鍵詞:基于奇異值分解和k-means聚類的電子商務(wù)推薦算法研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):389931
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/389931.html
最近更新
教材專著