天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

協(xié)同過濾中數據稀疏問題與推薦實時性的研究

發(fā)布時間:2017-05-17 04:12

  本文關鍵詞:協(xié)同過濾中數據稀疏問題與推薦實時性的研究,由筆耕文化傳播整理發(fā)布。


【摘要】:數據爆炸的現(xiàn)今使得推薦系統(tǒng)技術變得越來越熱門,越來越重要,幾乎所有的電子商務網站以及部分門戶網站,甚至是搜索引擎都有推薦系統(tǒng)相關技術的身影?偨Y其中的原因,一是在唾手可得的海量信息里,人們所期望獲得的卻是其中極小的一部分;二是人們期望獲得的信息里有一些潛在的偏好,利用這些偏好可以做更多的事情。推薦系統(tǒng)的發(fā)展非常迅速,它分為協(xié)同過濾,基于知識的推薦,混合推薦等等,而各種類別的推薦算法下又有很多成熟的技術。協(xié)同過濾一直是這其中的研究最多的技術,同時也是在電子商務有著廣泛應用的技術之一。典型的協(xié)同過濾,通過維護一個評分者—物品評分矩陣,計算相似度確定近鄰來產生推薦。不幸的是,這種算法的性能隨著用戶和商品的增加會產生很多問題:高維度,高稀疏度。此二者對于該技術在電子商務網站的應用產生巨大挑戰(zhàn)。本文著眼于此,提出或改進了若干方法,以解決數據稀疏問題和推薦實時性。對于數據稀疏問題,主要對外部信息做適當提取,計算其Jaccard相似度產生預測值,并將預測值有節(jié)制地填充至測試集,以此來提高傳統(tǒng)推薦技術的準確性。具體的,評分外的信息,如:用戶的年齡、職業(yè),物品的類別等,通過Jaccard相似度做初步調整,再與經典協(xié)同過濾得到的最近鄰相似性進行加權,通過多組具體的實驗,確定了較為理想的權重系數。在這樣權重下,我們得到的結果相對基準實驗有了一些提高。對于實時性的解決,我們引入聚類中的簇代表點技術(CURE,Clustering Using Representatives),主要是將搜尋所有用戶空間問題轉變?yōu)樗阉鞔卮睃c的集合中的近鄰問題,從而減少了近鄰搜尋空間的規(guī)模,以提高實時性。解決這一問題的關鍵,亦或是本文的核心工作,在于簇代表點的計算上。通過對前人所提算法的研究,我們進行了適當的修改,通過平行實驗對比,我們修改的算法得到的最終結果相對較好。
【關鍵詞】:CURE 推薦系統(tǒng) Movielens 協(xié)同過濾
【學位授予單位】:蘭州大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.3
【目錄】:
  • 中文摘要3-4
  • Abstract4-9
  • 第一章 引言9-14
  • 1.1 研究背景及意義9-10
  • 1.2 研究現(xiàn)狀10-12
  • 1.3 本文的研究內容12-13
  • 1.4 本文的組織結構13-14
  • 第二章 相關理論及技術綜述14-22
  • 2.1 推薦系統(tǒng)14-18
  • 2.1.1 推薦算法14-15
  • 2.1.2 相似性度量15-16
  • 2.1.3 推薦評估16-17
  • 2.1.4 存在的問題17-18
  • 2.2 聚類18-21
  • 2.2.1 聚類分析的類型18-19
  • 2.2.2 K-均值聚類19-20
  • 2.2.3 DBSCAN算法20-21
  • 2.3 Mahout21-22
  • 第三章 協(xié)同過濾數據稀疏問題的研究22-31
  • 3.1 數據稀疏問題及解決方法的選擇22-23
  • 3.2 基于相似度加權融合的數據填充(DPFS)23-25
  • 3.3 實驗過程及結果25-30
  • 3.3.1 數據集25-26
  • 3.3.2 概念分層26-27
  • 3.3.3 相似度加權求和27-28
  • 3.3.4 實驗結果分析28-30
  • 3.4 本章小結30-31
  • 第四章 協(xié)同過濾推薦實時性問題的研究31-57
  • 4.1 推薦實時性問題及解決方法的選擇31-33
  • 4.2 基于聚類簇代表點的協(xié)同過濾(CFRC)33-42
  • 4.2.1 算法的詳述34-41
  • 4.2.2 算法的目標及評估41-42
  • 4.3 實驗過程42-48
  • 4.3.1 數據的抽樣42-44
  • 4.3.2 產生簇、確定簇代表點44-47
  • 4.3.3 產生推薦47
  • 4.3.4 計算MAE47-48
  • 4.3.5 實驗小結48
  • 4.4 實驗結果與討論48-53
  • 4.4.1 簇的個數49-50
  • 4.4.2 閾值 β50-51
  • 4.4.3 近鄰個數51-52
  • 4.4.4 簇代表點52-53
  • 4.4.5 小結53
  • 4.5 基于模糊聚類簇代表點的協(xié)同過濾(CFRFC)53-55
  • 4.5.1 模糊K均值聚類54-55
  • 4.5.2 實驗結果及分析55
  • 4.6 本章小結55-57
  • 第五章 總結與展望57-60
  • 5.1 總結57-58
  • 5.2 展望58-60
  • 參考文獻60-64
  • 在學期間的研究成果64-65
  • 致謝65

【相似文獻】

中國期刊全文數據庫 前10條

1 楊風召;;一種基于特征表的協(xié)同過濾算法[J];計算機工程與應用;2007年06期

2 王嵐;翟正軍;;基于時間加權的協(xié)同過濾算法[J];計算機應用;2007年09期

3 曾子明;張李義;;基于多屬性決策和協(xié)同過濾的智能導購系統(tǒng)[J];武漢大學學報(工學版);2008年02期

4 張富國;;用戶多興趣下基于信任的協(xié)同過濾算法研究[J];小型微型計算機系統(tǒng);2008年08期

5 侯翠琴;焦李成;張文革;;一種壓縮稀疏用戶評分矩陣的協(xié)同過濾算法[J];西安電子科技大學學報;2009年04期

6 廖新考;;基于用戶特征和項目屬性的混合協(xié)同過濾推薦[J];福建電腦;2010年07期

7 沈磊;周一民;李舟軍;;基于心理學模型的協(xié)同過濾推薦方法[J];計算機工程;2010年20期

8 徐紅;彭黎;郭艾寅;徐云劍;;基于用戶多興趣的協(xié)同過濾策略改進研究[J];計算機技術與發(fā)展;2011年04期

9 焦晨斌;王世卿;;基于模型填充的混合協(xié)同過濾算法[J];微計算機信息;2011年11期

10 鄭婕;鮑海琴;;基于協(xié)同過濾推薦技術的個性化網絡教學平臺研究[J];科技風;2012年06期

中國重要會議論文全文數據庫 前10條

1 沈杰峰;杜亞軍;唐俊;;一種基于項目分類的協(xié)同過濾算法[A];第二十二屆中國數據庫學術會議論文集(技術報告篇)[C];2005年

2 周軍鋒;湯顯;郭景峰;;一種優(yōu)化的協(xié)同過濾推薦算法[A];第二十一屆中國數據庫學術會議論文集(研究報告篇)[C];2004年

3 董全德;;基于雙信息源的協(xié)同過濾算法研究[A];全國第20屆計算機技術與應用學術會議(CACIS·2009)暨全國第1屆安全關鍵技術與應用學術會議論文集(上冊)[C];2009年

4 張光衛(wèi);康建初;李鶴松;劉常昱;李德毅;;面向場景的協(xié)同過濾推薦算法[A];中國系統(tǒng)仿真學會第五次全國會員代表大會暨2006年全國學術年會論文集[C];2006年

5 李建國;姚良超;湯庸;郭歡;;基于認知度的協(xié)同過濾推薦算法[A];第26屆中國數據庫學術會議論文集(B輯)[C];2009年

6 王明文;陶紅亮;熊小勇;;雙向聚類迭代的協(xié)同過濾推薦算法[A];第三屆全國信息檢索與內容安全學術會議論文集[C];2007年

7 胡必云;李舟軍;王君;;基于心理測量學的協(xié)同過濾相似度方法(英文)[A];NDBC2010第27屆中國數據庫學術會議論文集(B輯)[C];2010年

8 林麗冰;師瑞峰;周一民;李月雷;;基于雙聚類的協(xié)同過濾推薦算法[A];2008'中國信息技術與應用學術論壇論文集(一)[C];2008年

9 羅喜軍;王韜丞;杜小勇;劉紅巖;何軍;;基于類別的推薦——一種解決協(xié)同推薦中冷啟動問題的方法[A];第二十四屆中國數據庫學術會議論文集(研究報告篇)[C];2007年

10 黃創(chuàng)光;印鑒;汪靜;劉玉葆;王甲海;;不確定近鄰的協(xié)同過濾推薦算法[A];NDBC2010第27屆中國數據庫學術會議論文集A輯一[C];2010年

中國博士學位論文全文數據庫 前10條

1 李聰;電子商務推薦系統(tǒng)中協(xié)同過濾瓶頸問題研究[D];合肥工業(yè)大學;2009年

2 郭艷紅;推薦系統(tǒng)的協(xié)同過濾算法與應用研究[D];大連理工大學;2008年

3 羅恒;基于協(xié)同過濾視角的受限玻爾茲曼機研究[D];上海交通大學;2011年

4 薛福亮;電子商務協(xié)同過濾推薦質量影響因素及其改進機制研究[D];天津大學;2012年

5 高e,

本文編號:372526


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/372526.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶8c11f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com