基于內(nèi)容和協(xié)同過濾的混合算法在推薦系統(tǒng)中的應(yīng)用研究
本文選題:推薦系統(tǒng) 切入點(diǎn):協(xié)同過濾算法 出處:《東華大學(xué)》2016年碩士論文 論文類型:學(xué)位論文
【摘要】:在電子商務(wù)為越來越多用戶提供便利的同時(shí),它的結(jié)構(gòu)也越發(fā)復(fù)雜。用戶擁有了更大的選擇空間,然而海量信息的同時(shí)呈現(xiàn),也讓用戶無法快速準(zhǔn)確地尋找到自己想要的商品。推薦系統(tǒng)就是為解決這樣的困境產(chǎn)生的,它能為用戶個(gè)性化定制,產(chǎn)生用戶希望看到的結(jié)果。如今,幾乎所有的電子商務(wù)網(wǎng)站都應(yīng)用了推薦系統(tǒng),例如淘寶、ePay等。為了能產(chǎn)生更高的推薦質(zhì)量,技術(shù)人員已經(jīng)提出了多種推薦技術(shù),包括基于內(nèi)容的推薦,協(xié)同過濾推薦,關(guān)聯(lián)挖掘推薦等。然而隨著研究的深入以及用戶要求的提升,推薦算法漸漸暴露了諸多缺點(diǎn),例如協(xié)同過濾推薦的冷啟動(dòng)和數(shù)據(jù)稀疏性問題、推薦質(zhì)量和實(shí)時(shí)性的平衡等。本文主要對基于內(nèi)容和協(xié)同過濾算法進(jìn)行研究,具體內(nèi)容如下:(1)對推薦算法的發(fā)展情況及關(guān)鍵技術(shù)進(jìn)行綜述;(2)針對協(xié)同過濾算法運(yùn)行時(shí)間長、推薦速度慢的缺陷,提出了將k-means聚類應(yīng)用于協(xié)同過濾算法,通過離線預(yù)處理用戶—項(xiàng)目評分矩陣對用戶進(jìn)行聚類,并生成虛擬用戶空間,替代全部用戶的集合,縮小了鄰居用戶的搜尋范圍,可以提高在線推薦的實(shí)時(shí)性,解決了傳統(tǒng)協(xié)同過濾算法的速度瓶頸問題;(3)在改進(jìn)后協(xié)同過濾算法的基礎(chǔ)上,提出了基于內(nèi)容和改進(jìn)后協(xié)同過濾的混合算法,將用戶評分和項(xiàng)目特征相結(jié)合,建立用戶特征評分矩陣,替代傳統(tǒng)的用戶—項(xiàng)目評分矩陣,對用戶集進(jìn)行k-means聚類,并進(jìn)行推薦。改進(jìn)后的算法不僅能解決傳統(tǒng)協(xié)同過濾算法的數(shù)據(jù)稀疏性問題;同時(shí)針對新項(xiàng)目,也能根據(jù)項(xiàng)目特征與用戶特征評分矩陣的匹配,來預(yù)測可能對新項(xiàng)目感興趣的用戶,并生成推送列表,有效解決“冷啟動(dòng)”中的新項(xiàng)目問題。實(shí)驗(yàn)證明,本文改進(jìn)的算法在解決數(shù)據(jù)稀疏、冷啟動(dòng)和在線推薦的速度瓶頸問題方面,有顯著的作用,能保證較好的推薦質(zhì)量。
[Abstract]:While e-commerce provides convenience for more and more users, its structure is becoming more and more complicated. It also makes it impossible for users to find the product they want quickly and accurately. Recommendation systems are created to solve this dilemma. It can be customized for the user and produce the results that the user wants to see. Today, Almost all e-commerce websites use recommendation systems, such as Taobao ePay. In order to generate higher recommendation quality, technicians have proposed a variety of recommendation technologies, including content-based recommendations, collaborative filtering recommendations, etc. However, with the deepening of research and the improvement of user requirements, the recommendation algorithm gradually exposes many shortcomings, such as cold start of collaborative filtering recommendation and data sparsity. This paper mainly studies the content-based and collaborative filtering algorithms, which are as follows: (1) A review of the development and key technologies of the recommendation algorithms; (2) the long running time of the collaborative filtering algorithms. In this paper, we apply k-means clustering to collaborative filtering algorithm, and cluster users by off-line preprocessing user-item scoring matrix, and generate virtual user space to replace the set of all users. It reduces the search range of neighbor users, improves the real-time performance of online recommendation, and solves the speed bottleneck problem of traditional collaborative filtering algorithm based on the improved collaborative filtering algorithm. A hybrid algorithm based on content and improved collaborative filtering is proposed, which combines user score with item feature, establishes user feature scoring matrix, replaces the traditional user-item scoring matrix, and carries out k-means clustering on user set. The improved algorithm can not only solve the data sparsity problem of the traditional collaborative filtering algorithm, but also match the scoring matrix according to the item features and user characteristics. To predict users who might be interested in new projects, and generate push lists to effectively solve the problem of new projects in "cold start". Experiments show that the improved algorithm in this paper is to solve the problem of sparse data. The speed bottleneck of cold start and online recommendation plays a significant role in ensuring better recommendation quality.
【學(xué)位授予單位】:東華大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張付志;張啟鳳;;融合多系統(tǒng)用戶信息的協(xié)同過濾算法[J];計(jì)算機(jī)工程;2009年21期
2 周麗娟;徐明升;張研研;張璋;;基于協(xié)同過濾的課程推薦模型[J];計(jì)算機(jī)應(yīng)用研究;2010年04期
3 劉淇;陳恩紅;;結(jié)合二部圖投影與排序的協(xié)同過濾[J];小型微型計(jì)算機(jī)系統(tǒng);2010年05期
4 董全德;;基于雙信息源的協(xié)同過濾算法研究[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年07期
5 李聰;;電子商務(wù)協(xié)同過濾可擴(kuò)展性研究綜述[J];現(xiàn)代圖書情報(bào)技術(shù);2010年11期
6 傅鶴崗;李冉;;基于用戶實(shí)時(shí)反饋的協(xié)同過濾算法[J];計(jì)算機(jī)應(yīng)用;2011年07期
7 辛勤芳;;基于項(xiàng)目聚類的協(xié)同過濾算法研究[J];赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年09期
8 楊君;汪會(huì)玲;艾丹祥;;一種基于情景的多維協(xié)同過濾新方法研究[J];圖書情報(bào)工作;2011年21期
9 王宗武;;基于信任用戶聯(lián)合聚類的協(xié)同過濾算法[J];計(jì)算機(jī)與現(xiàn)代化;2013年09期
10 杜永萍;黃亮;何明;;融合信任計(jì)算的協(xié)同過濾推薦方法[J];模式識別與人工智能;2014年05期
相關(guān)會(huì)議論文 前10條
1 沈杰峰;杜亞軍;唐俊;;一種基于項(xiàng)目分類的協(xié)同過濾算法[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
2 周軍鋒;湯顯;郭景峰;;一種優(yōu)化的協(xié)同過濾推薦算法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
3 董全德;;基于雙信息源的協(xié)同過濾算法研究[A];全國第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(上冊)[C];2009年
4 張光衛(wèi);康建初;李鶴松;劉常昱;李德毅;;面向場景的協(xié)同過濾推薦算法[A];中國系統(tǒng)仿真學(xué)會(huì)第五次全國會(huì)員代表大會(huì)暨2006年全國學(xué)術(shù)年會(huì)論文集[C];2006年
5 李建國;姚良超;湯庸;郭歡;;基于認(rèn)知度的協(xié)同過濾推薦算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
6 王明文;陶紅亮;熊小勇;;雙向聚類迭代的協(xié)同過濾推薦算法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
7 胡必云;李舟軍;王君;;基于心理測量學(xué)的協(xié)同過濾相似度方法(英文)[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
8 林麗冰;師瑞峰;周一民;李月雷;;基于雙聚類的協(xié)同過濾推薦算法[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
9 羅喜軍;王韜丞;杜小勇;劉紅巖;何軍;;基于類別的推薦——一種解決協(xié)同推薦中冷啟動(dòng)問題的方法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
10 黃創(chuàng)光;印鑒;汪靜;劉玉葆;王甲海;;不確定近鄰的協(xié)同過濾推薦算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集A輯一[C];2010年
相關(guān)博士學(xué)位論文 前10條
1 李聰;電子商務(wù)推薦系統(tǒng)中協(xié)同過濾瓶頸問題研究[D];合肥工業(yè)大學(xué);2009年
2 郭艷紅;推薦系統(tǒng)的協(xié)同過濾算法與應(yīng)用研究[D];大連理工大學(xué);2008年
3 羅恒;基于協(xié)同過濾視角的受限玻爾茲曼機(jī)研究[D];上海交通大學(xué);2011年
4 薛福亮;電子商務(wù)協(xié)同過濾推薦質(zhì)量影響因素及其改進(jìn)機(jī)制研究[D];天津大學(xué);2012年
5 高e,
本文編號:1637259
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/1637259.html