基于用戶的協(xié)同過(guò)濾推薦算法中若干關(guān)鍵技術(shù)研究
本文選題:推薦系統(tǒng) + 協(xié)同過(guò)濾 ; 參考:《安徽工業(yè)大學(xué)》2017年碩士論文
【摘要】:隨著互聯(lián)網(wǎng)及電子商務(wù)的迅速發(fā)展,在豐富了人們生活的同時(shí),也帶來(lái)了信息過(guò)載的問(wèn)題。推薦系統(tǒng)是解決該問(wèn)題的一種技術(shù),它能為用戶提供準(zhǔn)確的、智能化、個(gè)性化的推薦服務(wù)。推薦技術(shù)關(guān)鍵的兩步分別是為用戶確定K近鄰的個(gè)數(shù)和預(yù)測(cè)用戶對(duì)項(xiàng)目的評(píng)分。首先,對(duì)于K近鄰,即相似用戶的個(gè)數(shù),一般是根據(jù)經(jīng)驗(yàn)或者多次實(shí)驗(yàn)來(lái)確定。因此,現(xiàn)有方法存在主觀性較強(qiáng)和過(guò)程比較繁瑣等問(wèn)題,影響推薦算法的準(zhǔn)確度。其次,對(duì)于評(píng)分的預(yù)測(cè):存在多個(gè)近鄰時(shí),若采用余弦、皮爾遜等經(jīng)典相似度計(jì)算,用戶間的相似度值將大多為1,此時(shí)再利用傳統(tǒng)的預(yù)測(cè)方法計(jì)算,其結(jié)果大都是近似于用戶的均值;當(dāng)只有一個(gè)近鄰對(duì)目標(biāo)項(xiàng)目打過(guò)分時(shí),用戶間的相似度對(duì)最終評(píng)分預(yù)測(cè)值的貢獻(xiàn)度為零,預(yù)測(cè)結(jié)果都是目標(biāo)用戶的打分均值,對(duì)用戶的偏好區(qū)分度不高。針對(duì)以上問(wèn)題,本文在基于用戶協(xié)同過(guò)濾算法的基礎(chǔ)上對(duì)最近鄰的選擇和評(píng)分值預(yù)測(cè)方法進(jìn)行深入的分析和研究,并分別建立了K近鄰優(yōu)化模型和提出了改進(jìn)的評(píng)分值預(yù)測(cè)方法,主要內(nèi)容可歸納如下:(1)基于差分進(jìn)化算法的最近鄰優(yōu)化方法該方法首先結(jié)合用戶實(shí)際打分和預(yù)測(cè)分值,以最小化平均絕對(duì)誤差作為目標(biāo)函數(shù)建立優(yōu)化模型,然后通過(guò)差分優(yōu)化算法計(jì)算出最優(yōu)結(jié)果。最后利用平均絕對(duì)誤差、準(zhǔn)確度和召回率三個(gè)指標(biāo)驗(yàn)證了新方法的優(yōu)越性。新方法打破了傳統(tǒng)最近鄰?fù)ㄟ^(guò)人為設(shè)定相似度閾值的局限,可通過(guò)差分優(yōu)化算法快速找到最優(yōu)的K值。(2)基于SlopeOne算法的改進(jìn)預(yù)測(cè)方法該方法在傳統(tǒng)評(píng)分預(yù)測(cè)方法的基礎(chǔ)上借鑒SlopeOne算法的思想,充分考慮當(dāng)前用戶和最近鄰用戶共同打分情況的同時(shí),并融合相似度來(lái)體現(xiàn)不同近鄰用戶對(duì)預(yù)測(cè)當(dāng)前用戶評(píng)分行為的貢獻(xiàn)度,設(shè)計(jì)了一種改進(jìn)的評(píng)分值預(yù)測(cè)算法。新的方法有效解決了傳統(tǒng)評(píng)分預(yù)測(cè)方法對(duì)用戶的偏好區(qū)分度不高、沒(méi)有充分利用用戶評(píng)分信息、將最近鄰用戶相同對(duì)待等問(wèn)題。本文區(qū)分冷啟動(dòng)和非冷啟動(dòng)兩種情況,在MovieLens、Epinions、Netflix三個(gè)經(jīng)典數(shù)據(jù)集上驗(yàn)證了所提出的兩個(gè)新方法的性能。新方法在MAE、準(zhǔn)確度和召回率上比傳統(tǒng)的預(yù)測(cè)方法具有明顯的優(yōu)勢(shì),顯著提高了基于用戶的協(xié)同過(guò)濾推薦算法的準(zhǔn)確度和推薦質(zhì)量。本文提出的兩種方法適用于冷啟動(dòng)和非冷啟動(dòng)兩種環(huán)境,與現(xiàn)有推薦系統(tǒng)集成度高,應(yīng)用推廣價(jià)值較高。
[Abstract]:With the rapid development of internet and e-commerce, it not only enriches people's life, but also brings the problem of information overload. Recommendation system is a technology to solve this problem. It can provide users with accurate, intelligent and personalized recommendation service. The two key steps of recommendation technology are to determine the number of K-nearest neighbors for users and to predict the evaluation of items by users. First of all, the number of K nearest neighbors, that is, the number of similar users, is generally determined by experience or multiple experiments. Therefore, the existing methods have some problems, such as subjectivity and tedious process, which affect the accuracy of the recommendation algorithm. Secondly, for the prediction of score: when there are more than one nearest neighbor, if the classical similarity calculation such as cosine and Pearson are used, the similarity value between users will be mostly 1, and then the traditional prediction method is used to calculate the similarity between users. The results are mostly approximate to the average value of the user. When only one neighbor overdoes the target item, the contribution of the similarity between the users to the final score prediction value is zero, and the prediction results are the mean value of the target user. The degree of preference to users is not high. Aiming at the above problems, this paper makes a deep analysis and research on the nearest neighbor selection and score prediction method based on the user collaborative filtering algorithm. The K-nearest neighbor optimization model and the improved score prediction method are established respectively. The main contents can be summarized as follows: (1) the nearest neighbor optimization method based on differential evolutionary algorithm (DEA). The optimization model is established with minimizing the mean absolute error as the objective function, and then the optimal result is calculated by the difference optimization algorithm. Finally, the superiority of the new method is verified by three indexes: average absolute error, accuracy and recall rate. The new method breaks the limitation of traditional nearest neighbor by artificially setting similarity threshold. The improved prediction method based on SlopeOne algorithm. Considering the current users and nearest neighbor users scoring together, and combining similarity to reflect the contribution of different nearest neighbor users to the prediction of current users' rating behavior, an improved scoring prediction algorithm is designed. The new method effectively solves the problem that the traditional scoring prediction method has not high discrimination of users' preference, does not make full use of the user's scoring information, and treats the nearest neighbor users the same. This paper distinguishes between cold start and non cold start, and verifies the performance of the proposed two new methods on the three classical data sets of Movie Lenson Epinion / Netflix. The new method has obvious advantages over the traditional prediction method in mae accuracy and recall rate and improves the accuracy and quality of the user-based collaborative filtering recommendation algorithm. The two methods proposed in this paper are suitable for cold start and non cold start, and have high integration with the existing recommendation system and high application value.
【學(xué)位授予單位】:安徽工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 周鴻鐸;;我理解的“互聯(lián)網(wǎng)+”——“互聯(lián)網(wǎng)+”是一種融合[J];現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào));2015年08期
2 于洪;李俊華;;一種解決新項(xiàng)目冷啟動(dòng)問(wèn)題的推薦算法[J];軟件學(xué)報(bào);2015年06期
3 丁少衡;姬東鴻;王路路;;基于用戶屬性和評(píng)分的協(xié)同過(guò)濾推薦算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2015年02期
4 鄭志高;劉京;王平;孫圣力;;時(shí)間加權(quán)不確定近鄰協(xié)同過(guò)濾算法[J];計(jì)算機(jī)科學(xué);2014年08期
5 蔡騏;李玲;;信息過(guò)載時(shí)代的新媒介素養(yǎng)[J];現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào));2013年09期
6 賈冬艷;張付志;;基于雙重鄰居選取策略的協(xié)同過(guò)濾推薦算法[J];計(jì)算機(jī)研究與發(fā)展;2013年05期
7 蔡孟松;李學(xué)明;尹衍騰;;基于社交用戶標(biāo)簽的混合top-N推薦方法[J];計(jì)算機(jī)應(yīng)用研究;2013年05期
8 尹航;常桂然;王興偉;;采用聚類算法優(yōu)化的K近鄰協(xié)同過(guò)濾算法[J];小型微型計(jì)算機(jī)系統(tǒng);2013年04期
9 陶維安;范會(huì)聯(lián);;基于評(píng)分支持度的最近鄰協(xié)同過(guò)濾推薦算法[J];計(jì)算機(jī)應(yīng)用研究;2012年05期
10 呂成戍;王維國(guó);丁永健;;基于KNN-SVM的混合協(xié)同過(guò)濾推薦算法[J];計(jì)算機(jī)應(yīng)用研究;2012年05期
相關(guān)博士學(xué)位論文 前8條
1 趙向宇;Top-N協(xié)同過(guò)濾推薦技術(shù)研究[D];北京理工大學(xué);2014年
2 孔維梁;協(xié)同過(guò)濾推薦系統(tǒng)關(guān)鍵問(wèn)題研究[D];華中師范大學(xué);2013年
3 劉淇;基于用戶興趣建模的推薦方法及應(yīng)用研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年
4 冷亞軍;協(xié)同過(guò)濾技術(shù)及其在推薦系統(tǒng)中的應(yīng)用研究[D];合肥工業(yè)大學(xué);2013年
5 任磊;推薦系統(tǒng)關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2012年
6 張亮;推薦系統(tǒng)中協(xié)同過(guò)濾算法若干問(wèn)題的研究[D];北京郵電大學(xué);2009年
7 李聰;電子商務(wù)推薦系統(tǒng)中協(xié)同過(guò)濾瓶頸問(wèn)題研究[D];合肥工業(yè)大學(xué);2009年
8 郭艷紅;推薦系統(tǒng)的協(xié)同過(guò)濾算法與應(yīng)用研究[D];大連理工大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 霍淑華;基于協(xié)同過(guò)濾的評(píng)分預(yù)測(cè)推薦算法研究[D];北京工業(yè)大學(xué);2015年
2 張明敏;基于Spark平臺(tái)的協(xié)同過(guò)濾推薦算法的研究與實(shí)現(xiàn)[D];南京理工大學(xué);2015年
3 鄧雄杰;基于Hadoop的推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華南理工大學(xué);2013年
4 雷震;基于聚類的個(gè)性化推薦算法研究[D];電子科技大學(xué);2013年
5 張川;基于矩陣分解的協(xié)同過(guò)濾推薦算法研究[D];吉林大學(xué);2013年
6 廖貴明;個(gè)性化推薦引擎系統(tǒng)研究[D];電子科技大學(xué);2013年
7 徐小偉;基于信任的協(xié)同過(guò)濾推薦算法在電子商務(wù)推薦系統(tǒng)的應(yīng)用研究[D];東華大學(xué);2013年
8 張學(xué)勝;面向數(shù)據(jù)稀疏的協(xié)同過(guò)濾推薦算法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年
9 劉芳先;電子商務(wù)個(gè)性化推薦算法設(shè)計(jì)與實(shí)現(xiàn)[D];江蘇大學(xué);2010年
10 高建煌;個(gè)性化推薦系統(tǒng)技術(shù)與應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
,本文編號(hào):2033854
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/2033854.html