個性化推薦系統(tǒng)中的推薦算法研究
本文關鍵詞: 推薦系統(tǒng) K-means算法 加權關聯(lián)規(guī)則 協(xié)同過濾算法 出處:《北京交通大學》2017年碩士論文 論文類型:學位論文
【摘要】:隨著電子商務的發(fā)展,電商網站的規(guī)模在不斷增大,網上商品的種類越來越多。推薦系統(tǒng)的出現(xiàn)可以幫助用戶在面對如此繁多的商品信息時做出選擇。但目前推薦算法依然在發(fā)展中,其精確性還不能滿足人們的需求,所以有很多關于此方面的研究。如何根據用戶的特定喜好進行更準確、更便捷的推薦服務成為了越來越多專家學者致力研究的內容。關聯(lián)規(guī)則和協(xié)同過濾是兩種重要的推薦算法。但是由于事物數(shù)據庫中項目分布的不均勻性以及協(xié)同過濾算法中的數(shù)據稀疏性造成的冷啟動問題,這些算法的精確性還有待提高。本文針對這些問題,對關聯(lián)規(guī)則和協(xié)同過濾算法提出了改進,并將改進后的算法應用在個性化web商城推薦系統(tǒng)中。論文的研究工作得到了國家自然科學基金項目(No.61172072、61271308)、北京市自然科學基金項目(No.4112045)和高等學校博士學科點專項科研基金(No.20100009110002)的支持。本論文的主要研究工作包括:(1)根據Apriori算法及Partition算法的問題,改進了關聯(lián)規(guī)則。針對事物數(shù)據庫中具有強規(guī)律性的項目,設計了一種權重公式給予其相應加權,以此來提高事務數(shù)據庫中具有穩(wěn)定時間間隔規(guī)律項的支持度;(2)為了解決協(xié)同過濾算法中的數(shù)據稀疏性問題,本文根據后臺數(shù)據庫中的數(shù)據記錄,獲取其中的隱式信息,并結合MapReduce技術將其應用在個性化推薦系統(tǒng)中來優(yōu)化稀疏矩陣;(3)為了尋找用戶的鄰居集合,本文提出了一種基于二進制循環(huán)指數(shù)的多重K-means協(xié)同過濾算法來發(fā)掘目標用戶的最近鄰居集合并為其進行商品推薦服務。將提出的算法應用在web商城推薦系統(tǒng)中,在個性化的推薦系統(tǒng)中優(yōu)化根據用戶個人喜好的推薦以及根據最近鄰居集合預測目標用戶感興趣項的推薦模式;(4)將改進的加權關聯(lián)規(guī)則和優(yōu)化的協(xié)同過濾算法進行有機的結合,本文設計出了一個推薦系統(tǒng)原型,并通過實驗對此系統(tǒng)的性能效果進行了分析。實驗結果表明:改進后的關聯(lián)規(guī)在精確度上得到了提高;采用MapReduce技術挖掘用戶隱式信息可以彌補web商城單一使用用戶的顯示信息造成的缺陷;改進的協(xié)同過濾算法在發(fā)掘最近鄰居的效率及精確度上得到了提高;融合上述兩種算法的推薦系統(tǒng)的性能得到了優(yōu)化。
[Abstract]:With the development of electronic commerce, the scale of e-commerce website is increasing. There are more and more kinds of goods on the Internet. The appearance of recommendation system can help users to make choices in the face of so many commodity information. However, the recommendation algorithm is still in the process of development. Its accuracy can not meet the needs of people, so there is a lot of research on this aspect. How to carry out more accurate according to the specific preferences of users. More and more experts and scholars devote themselves to the research of more and more convenient recommendation services. Association rules and collaborative filtering are two important recommendation algorithms. However, because of the uneven distribution of items in the transaction database and collaboration. Cold start problem caused by data sparsity in filtering algorithm. The accuracy of these algorithms still needs to be improved. Aiming at these problems, this paper proposes some improvements on association rules and collaborative filtering algorithms. And the improved algorithm is applied to the personalized web mall recommendation system. The research work of this paper has been obtained by the National Natural Science Foundation Project No. 61172072 / 61271308). Beijing Natural Science Foundation Project No. 4112045) and the Special Research Foundation for doctoral subject points in institutions of higher Learning No. 20100009110002). The main research work of this thesis includes the problem of Apriori algorithm and Partition algorithm. The association rules are improved. For the items with strong regularity in the transaction database, a weight formula is designed to give the corresponding weights, so as to improve the support degree of the items with stable time interval in the transaction database. In order to solve the problem of data sparsity in the collaborative filtering algorithm, the implicit information is obtained according to the data records in the background database. The sparse matrix is optimized by using MapReduce technology in personalized recommendation system. In order to find a set of neighbors of the user. In this paper, a binary cyclic exponent based multifold K-means collaborative filtering algorithm is proposed to discover the nearest neighbor set of the target user and to recommend goods for the target user. The proposed algorithm is applied to web. In the Mall recommendation system. In the personalized recommendation system, we optimize the recommendation mode based on the user's personal preferences and the nearest neighbor set to predict the items of interest to the target user. 4) combining the improved weighted association rules with the optimized collaborative filtering algorithm, a prototype of the recommendation system is designed in this paper. The performance of the system is analyzed by experiments. The experimental results show that the precision of the improved correlation gauge is improved. Using MapReduce technology to mine the implicit information of users can make up for the defects caused by the single use of user's display information in web Mall. The improved collaborative filtering algorithm improves the efficiency and accuracy of finding the nearest neighbor. The performance of the recommendation system which combines the above two algorithms is optimized.
【學位授予單位】:北京交通大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.3
【參考文獻】
相關期刊論文 前10條
1 李曉瑛;夏光輝;李丹亞;;主題標引文獻的語義關系發(fā)現(xiàn)研究[J];現(xiàn)代圖書情報技術;2016年Z1期
2 趙志剛;萬軍;王芳;;一種基于向量的概率加權關聯(lián)規(guī)則挖掘算法[J];計算機工程與科學;2014年02期
3 卞藝杰;陳超;馬玲玲;陳遠磊;;一種改進的LSH/MinHash協(xié)同過濾算法[J];計算機與現(xiàn)代化;2013年12期
4 吳湖;王永吉;王哲;王秀利;杜栓柱;;兩階段聯(lián)合聚類協(xié)同過濾算法[J];軟件學報;2010年05期
5 程舒通;徐從富;;關聯(lián)規(guī)則挖掘技術研究進展[J];計算機應用研究;2009年09期
6 張國萍;黃美鳳;;一個使用JavaBeans實現(xiàn)訪問計數(shù)器的JSP應用[J];科技廣場;2009年05期
7 張光衛(wèi);李德毅;李鵬;康建初;陳桂生;;基于云模型的協(xié)同過濾推薦算法[J];軟件學報;2007年10期
8 劉立軍;周軍;梅紅巖;;Web使用挖掘的數(shù)據預處理[J];計算機科學;2007年05期
9 鄒力濵;張其善;;基于多最小支持度的加權關聯(lián)規(guī)則挖掘算法[J];北京航空航天大學學報;2007年05期
10 邢春曉;高鳳榮;戰(zhàn)思南;周立柱;;適應用戶興趣變化的協(xié)同過濾推薦算法[J];計算機研究與發(fā)展;2007年02期
相關博士學位論文 前2條
1 劉樹棟;基于位置的移動社會化網絡推薦技術研究[D];北京郵電大學;2015年
2 劉青文;基于協(xié)同過濾的推薦算法研究[D];中國科學技術大學;2013年
相關碩士學位論文 前5條
1 張淼;基于位置社交網絡的興趣點推薦方法研究[D];西南大學;2015年
2 孫浩楠;左邊還是右邊?電商網站個性化推薦位置研究[D];大連理工大學;2015年
3 李楊曦;基于圖模型的視頻推薦算法研究及實現(xiàn)[D];電子科技大學;2015年
4 成軍;面向電子商務的協(xié)同過濾推薦算法與推薦系統(tǒng)研究[D];南京理工大學;2013年
5 王林林;基于Web日志的個性化推薦系統(tǒng)的研究[D];山東大學;2012年
,本文編號:1468494
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/1468494.html