基于用戶的協(xié)同過濾推薦算法中若干關(guān)鍵技術(shù)研究
本文選題:推薦系統(tǒng) + 協(xié)同過濾 ; 參考:《安徽工業(yè)大學(xué)》2017年碩士論文
【摘要】:隨著互聯(lián)網(wǎng)及電子商務(wù)的迅速發(fā)展,在豐富了人們生活的同時(shí),也帶來了信息過載的問題。推薦系統(tǒng)是解決該問題的一種技術(shù),它能為用戶提供準(zhǔn)確的、智能化、個(gè)性化的推薦服務(wù)。推薦技術(shù)關(guān)鍵的兩步分別是為用戶確定K近鄰的個(gè)數(shù)和預(yù)測用戶對項(xiàng)目的評分。首先,對于K近鄰,即相似用戶的個(gè)數(shù),一般是根據(jù)經(jīng)驗(yàn)或者多次實(shí)驗(yàn)來確定。因此,現(xiàn)有方法存在主觀性較強(qiáng)和過程比較繁瑣等問題,影響推薦算法的準(zhǔn)確度。其次,對于評分的預(yù)測:存在多個(gè)近鄰時(shí),若采用余弦、皮爾遜等經(jīng)典相似度計(jì)算,用戶間的相似度值將大多為1,此時(shí)再利用傳統(tǒng)的預(yù)測方法計(jì)算,其結(jié)果大都是近似于用戶的均值;當(dāng)只有一個(gè)近鄰對目標(biāo)項(xiàng)目打過分時(shí),用戶間的相似度對最終評分預(yù)測值的貢獻(xiàn)度為零,預(yù)測結(jié)果都是目標(biāo)用戶的打分均值,對用戶的偏好區(qū)分度不高。針對以上問題,本文在基于用戶協(xié)同過濾算法的基礎(chǔ)上對最近鄰的選擇和評分值預(yù)測方法進(jìn)行深入的分析和研究,并分別建立了K近鄰優(yōu)化模型和提出了改進(jìn)的評分值預(yù)測方法,主要內(nèi)容可歸納如下:(1)基于差分進(jìn)化算法的最近鄰優(yōu)化方法該方法首先結(jié)合用戶實(shí)際打分和預(yù)測分值,以最小化平均絕對誤差作為目標(biāo)函數(shù)建立優(yōu)化模型,然后通過差分優(yōu)化算法計(jì)算出最優(yōu)結(jié)果。最后利用平均絕對誤差、準(zhǔn)確度和召回率三個(gè)指標(biāo)驗(yàn)證了新方法的優(yōu)越性。新方法打破了傳統(tǒng)最近鄰?fù)ㄟ^人為設(shè)定相似度閾值的局限,可通過差分優(yōu)化算法快速找到最優(yōu)的K值。(2)基于SlopeOne算法的改進(jìn)預(yù)測方法該方法在傳統(tǒng)評分預(yù)測方法的基礎(chǔ)上借鑒SlopeOne算法的思想,充分考慮當(dāng)前用戶和最近鄰用戶共同打分情況的同時(shí),并融合相似度來體現(xiàn)不同近鄰用戶對預(yù)測當(dāng)前用戶評分行為的貢獻(xiàn)度,設(shè)計(jì)了一種改進(jìn)的評分值預(yù)測算法。新的方法有效解決了傳統(tǒng)評分預(yù)測方法對用戶的偏好區(qū)分度不高、沒有充分利用用戶評分信息、將最近鄰用戶相同對待等問題。本文區(qū)分冷啟動(dòng)和非冷啟動(dòng)兩種情況,在MovieLens、Epinions、Netflix三個(gè)經(jīng)典數(shù)據(jù)集上驗(yàn)證了所提出的兩個(gè)新方法的性能。新方法在MAE、準(zhǔn)確度和召回率上比傳統(tǒng)的預(yù)測方法具有明顯的優(yōu)勢,顯著提高了基于用戶的協(xié)同過濾推薦算法的準(zhǔn)確度和推薦質(zhì)量。本文提出的兩種方法適用于冷啟動(dòng)和非冷啟動(dòng)兩種環(huán)境,與現(xiàn)有推薦系統(tǒng)集成度高,應(yīng)用推廣價(jià)值較高。
[Abstract]:With the rapid development of internet and e-commerce, it not only enriches people's life, but also brings the problem of information overload. Recommendation system is a technology to solve this problem. It can provide users with accurate, intelligent and personalized recommendation service. The two key steps of recommendation technology are to determine the number of K-nearest neighbors for users and to predict the evaluation of items by users. First of all, the number of K nearest neighbors, that is, the number of similar users, is generally determined by experience or multiple experiments. Therefore, the existing methods have some problems, such as subjectivity and tedious process, which affect the accuracy of the recommendation algorithm. Secondly, for the prediction of score: when there are more than one nearest neighbor, if the classical similarity calculation such as cosine and Pearson are used, the similarity value between users will be mostly 1, and then the traditional prediction method is used to calculate the similarity between users. The results are mostly approximate to the average value of the user. When only one neighbor overdoes the target item, the contribution of the similarity between the users to the final score prediction value is zero, and the prediction results are the mean value of the target user. The degree of preference to users is not high. Aiming at the above problems, this paper makes a deep analysis and research on the nearest neighbor selection and score prediction method based on the user collaborative filtering algorithm. The K-nearest neighbor optimization model and the improved score prediction method are established respectively. The main contents can be summarized as follows: (1) the nearest neighbor optimization method based on differential evolutionary algorithm (DEA). The optimization model is established with minimizing the mean absolute error as the objective function, and then the optimal result is calculated by the difference optimization algorithm. Finally, the superiority of the new method is verified by three indexes: average absolute error, accuracy and recall rate. The new method breaks the limitation of traditional nearest neighbor by artificially setting similarity threshold. The improved prediction method based on SlopeOne algorithm. Considering the current users and nearest neighbor users scoring together, and combining similarity to reflect the contribution of different nearest neighbor users to the prediction of current users' rating behavior, an improved scoring prediction algorithm is designed. The new method effectively solves the problem that the traditional scoring prediction method has not high discrimination of users' preference, does not make full use of the user's scoring information, and treats the nearest neighbor users the same. This paper distinguishes between cold start and non cold start, and verifies the performance of the proposed two new methods on the three classical data sets of Movie Lenson Epinion / Netflix. The new method has obvious advantages over the traditional prediction method in mae accuracy and recall rate and improves the accuracy and quality of the user-based collaborative filtering recommendation algorithm. The two methods proposed in this paper are suitable for cold start and non cold start, and have high integration with the existing recommendation system and high application value.
【學(xué)位授予單位】:安徽工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 周鴻鐸;;我理解的“互聯(lián)網(wǎng)+”——“互聯(lián)網(wǎng)+”是一種融合[J];現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報(bào));2015年08期
2 于洪;李俊華;;一種解決新項(xiàng)目冷啟動(dòng)問題的推薦算法[J];軟件學(xué)報(bào);2015年06期
3 丁少衡;姬東鴻;王路路;;基于用戶屬性和評分的協(xié)同過濾推薦算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2015年02期
4 鄭志高;劉京;王平;孫圣力;;時(shí)間加權(quán)不確定近鄰協(xié)同過濾算法[J];計(jì)算機(jī)科學(xué);2014年08期
5 蔡騏;李玲;;信息過載時(shí)代的新媒介素養(yǎng)[J];現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報(bào));2013年09期
6 賈冬艷;張付志;;基于雙重鄰居選取策略的協(xié)同過濾推薦算法[J];計(jì)算機(jī)研究與發(fā)展;2013年05期
7 蔡孟松;李學(xué)明;尹衍騰;;基于社交用戶標(biāo)簽的混合top-N推薦方法[J];計(jì)算機(jī)應(yīng)用研究;2013年05期
8 尹航;常桂然;王興偉;;采用聚類算法優(yōu)化的K近鄰協(xié)同過濾算法[J];小型微型計(jì)算機(jī)系統(tǒng);2013年04期
9 陶維安;范會(huì)聯(lián);;基于評分支持度的最近鄰協(xié)同過濾推薦算法[J];計(jì)算機(jī)應(yīng)用研究;2012年05期
10 呂成戍;王維國;丁永健;;基于KNN-SVM的混合協(xié)同過濾推薦算法[J];計(jì)算機(jī)應(yīng)用研究;2012年05期
相關(guān)博士學(xué)位論文 前8條
1 趙向宇;Top-N協(xié)同過濾推薦技術(shù)研究[D];北京理工大學(xué);2014年
2 孔維梁;協(xié)同過濾推薦系統(tǒng)關(guān)鍵問題研究[D];華中師范大學(xué);2013年
3 劉淇;基于用戶興趣建模的推薦方法及應(yīng)用研究[D];中國科學(xué)技術(shù)大學(xué);2013年
4 冷亞軍;協(xié)同過濾技術(shù)及其在推薦系統(tǒng)中的應(yīng)用研究[D];合肥工業(yè)大學(xué);2013年
5 任磊;推薦系統(tǒng)關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2012年
6 張亮;推薦系統(tǒng)中協(xié)同過濾算法若干問題的研究[D];北京郵電大學(xué);2009年
7 李聰;電子商務(wù)推薦系統(tǒng)中協(xié)同過濾瓶頸問題研究[D];合肥工業(yè)大學(xué);2009年
8 郭艷紅;推薦系統(tǒng)的協(xié)同過濾算法與應(yīng)用研究[D];大連理工大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 霍淑華;基于協(xié)同過濾的評分預(yù)測推薦算法研究[D];北京工業(yè)大學(xué);2015年
2 張明敏;基于Spark平臺的協(xié)同過濾推薦算法的研究與實(shí)現(xiàn)[D];南京理工大學(xué);2015年
3 鄧雄杰;基于Hadoop的推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華南理工大學(xué);2013年
4 雷震;基于聚類的個(gè)性化推薦算法研究[D];電子科技大學(xué);2013年
5 張川;基于矩陣分解的協(xié)同過濾推薦算法研究[D];吉林大學(xué);2013年
6 廖貴明;個(gè)性化推薦引擎系統(tǒng)研究[D];電子科技大學(xué);2013年
7 徐小偉;基于信任的協(xié)同過濾推薦算法在電子商務(wù)推薦系統(tǒng)的應(yīng)用研究[D];東華大學(xué);2013年
8 張學(xué)勝;面向數(shù)據(jù)稀疏的協(xié)同過濾推薦算法研究[D];中國科學(xué)技術(shù)大學(xué);2011年
9 劉芳先;電子商務(wù)個(gè)性化推薦算法設(shè)計(jì)與實(shí)現(xiàn)[D];江蘇大學(xué);2010年
10 高建煌;個(gè)性化推薦系統(tǒng)技術(shù)與應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2010年
,本文編號:2033854
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/2033854.html