基于用戶興趣建模的協(xié)同過濾推薦方法研究
發(fā)布時間:2020-12-03 02:47
互聯(lián)網時代,伴隨電子商務網站與社交媒體平臺的飛速發(fā)展,用戶、商品、評論等各類信息呈爆炸式增長。面對海量、復雜信息,用戶高效獲取有用信息變得更加困難,信息過載問題日益突出。為了有效緩解信息過載問題,個性化推薦技術應運而生。該技術通過分析用戶的歷史行為信息及其相關偏好,將可能會被用戶喜歡的產品、信息或服務推薦給用戶,在提升用戶信息獲取效率的同時,增強了用戶黏性,促進了相關利益主體的業(yè)績提升。協(xié)同過濾推薦方法作為應用最廣泛的個性化推薦技術之一,受到學術界與產業(yè)界的重點關注。從現(xiàn)有研究進展來看,盡管協(xié)同過濾推薦技術取得了系列有價值的研究成果,但數(shù)據(jù)稀疏、用戶興趣漂移等難題仍然制約著其推薦性能的提升。本文面向數(shù)據(jù)稀疏、用戶興趣漂移等難題,以用戶興趣的深入分析為切入,通過融合用戶的項目屬性偏好與興趣變化信息,綜合運用非線性遺忘函數(shù)、k-means聚類等方法,建立了基于用戶興趣建模的協(xié)同過濾推薦算法。主要的研究成果如下:(1)面向數(shù)據(jù)稀疏問題,著眼于更為細致的考慮用戶興趣,本文基于用戶評分信息與項目屬性信息的融合,將用戶-項目評分矩陣轉化為用戶-項目屬性偏好矩陣,降低了矩陣的稀疏程度。(2)面向用戶...
【文章來源】:山西大學山西省
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【部分圖文】:
艾賓浩斯遺忘曲線圖
基于用戶興趣建模的協(xié)同過濾推薦方法研究26圖3-2k-means聚類流程圖在此根據(jù)先前得到的各用戶的興趣屬性偏好向量,對其執(zhí)行k-means聚類算法。3.3.2相似性計算傳統(tǒng)的協(xié)同過濾算法認為只要兩個用戶間存在共同評分的項目,這兩個用戶便視為近鄰。但隨著用戶和項目數(shù)在系統(tǒng)內的增多,部分用戶間共同評分的項目數(shù)很少,甚至只有一至兩個項目的情況。用戶間共同評論的項目數(shù)很少并不能表明兩個用戶之間存在近鄰關系。因此,在尋找用戶近鄰的階段,本文加入考慮用戶間共同評分的項目數(shù)M,通過選取不同的閾值M,來決定兩個用戶間是否存在近鄰關系。如表3-6是3個用戶對7部電影的評分矩陣。趙明與孫華共同評論的電影只有少年派,這不能說明這兩個人存在近鄰關系。趙明與李芳共同的評論的電影是
基于用戶興趣建模的協(xié)同過濾推薦方法研究32該用戶評價過電影的不同年齡段的遺忘函數(shù)值(表4-6所示),當遺忘系數(shù)越大,用戶的遺忘速率也就越快,即用戶較大時間間隔以前評價過的電影對現(xiàn)在的用戶的興趣影響不大。為了檢驗引入基于年齡變化的遺忘函數(shù)的有效性,本節(jié)建立用戶興趣模型預測測試集中相關用戶的電影評分。結果表明,引入基于年齡變化的遺忘函數(shù)用戶模型的準確率要高于未引入的用戶興趣模型。圖4-1列示了部分用戶在不同遺忘系數(shù)下的MAE值?梢钥闯,除了ID為580的用戶,其余用戶引入基于年齡變化的遺忘函數(shù)的預測準確率提高了,這表明大部分用戶的興趣變化比較快。圖4-1不同遺忘系數(shù)下部分用戶的推薦精度比較
本文編號:2895863
【文章來源】:山西大學山西省
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【部分圖文】:
艾賓浩斯遺忘曲線圖
基于用戶興趣建模的協(xié)同過濾推薦方法研究26圖3-2k-means聚類流程圖在此根據(jù)先前得到的各用戶的興趣屬性偏好向量,對其執(zhí)行k-means聚類算法。3.3.2相似性計算傳統(tǒng)的協(xié)同過濾算法認為只要兩個用戶間存在共同評分的項目,這兩個用戶便視為近鄰。但隨著用戶和項目數(shù)在系統(tǒng)內的增多,部分用戶間共同評分的項目數(shù)很少,甚至只有一至兩個項目的情況。用戶間共同評論的項目數(shù)很少并不能表明兩個用戶之間存在近鄰關系。因此,在尋找用戶近鄰的階段,本文加入考慮用戶間共同評分的項目數(shù)M,通過選取不同的閾值M,來決定兩個用戶間是否存在近鄰關系。如表3-6是3個用戶對7部電影的評分矩陣。趙明與孫華共同評論的電影只有少年派,這不能說明這兩個人存在近鄰關系。趙明與李芳共同的評論的電影是
基于用戶興趣建模的協(xié)同過濾推薦方法研究32該用戶評價過電影的不同年齡段的遺忘函數(shù)值(表4-6所示),當遺忘系數(shù)越大,用戶的遺忘速率也就越快,即用戶較大時間間隔以前評價過的電影對現(xiàn)在的用戶的興趣影響不大。為了檢驗引入基于年齡變化的遺忘函數(shù)的有效性,本節(jié)建立用戶興趣模型預測測試集中相關用戶的電影評分。結果表明,引入基于年齡變化的遺忘函數(shù)用戶模型的準確率要高于未引入的用戶興趣模型。圖4-1列示了部分用戶在不同遺忘系數(shù)下的MAE值?梢钥闯,除了ID為580的用戶,其余用戶引入基于年齡變化的遺忘函數(shù)的預測準確率提高了,這表明大部分用戶的興趣變化比較快。圖4-1不同遺忘系數(shù)下部分用戶的推薦精度比較
本文編號:2895863
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2895863.html
最近更新
教材專著