推薦系統(tǒng)中基于相似性計算的協(xié)同過濾算法研究
本文選題:協(xié)同過濾 + 稀疏性; 參考:《鄭州大學》2017年碩士論文
【摘要】:信息技術的快速發(fā)展,互聯(lián)網(wǎng)用戶量和信息量規(guī)模的不斷擴大,網(wǎng)絡空間的信息生產(chǎn)者由傳統(tǒng)媒體逐步趨向大眾化和平臺化。隨著個人影響力的提升和人工智能的普及發(fā)展,人人都是信息的生產(chǎn)者,任何同網(wǎng)絡傳輸相連接的設備也是信息制造者。大規(guī)模信息量的產(chǎn)生在為用戶提供充足信息的同時也帶來相當大的困擾,即如何從龐大繁瑣的數(shù)據(jù)空間獲取需要的信息內(nèi)容,該現(xiàn)象即是信息過載。推薦系統(tǒng)的出現(xiàn),有效地緩解了過載問題。其中的協(xié)同過濾推薦技術,利用用戶間相關信息,產(chǎn)生合理推薦,并能由反饋信息進行動態(tài)調(diào)整,突破了專業(yè)領域知識的限制,提高了推薦性能。但同時協(xié)同過濾也面臨著一些問題,由于用戶規(guī)模和項目數(shù)量的不斷增大,不可避免地會出現(xiàn)維度災難的問題,該問題具體會反映在數(shù)據(jù)稀疏性上,如何有效地利用已存在的數(shù)據(jù)信息,為解決推薦系統(tǒng)所面臨問題的關鍵。針對稀疏問題,本文由相似性出發(fā)展開研究。第一,在用戶對應的項目領域,根據(jù)項目屬性進行用戶分類,得到用戶初始興趣分布。在用戶所具有的興趣分布特征基礎上進行數(shù)據(jù)信息量化處理,獲取用戶本身興趣特征,通過計算用戶的興趣特征差異,經(jīng)過數(shù)量關系調(diào)整后得到新的相似性,最終在協(xié)同框架下進行預測評分數(shù)值計算,最終完成推薦過程。第二,根據(jù)用戶評分結構所具有的隸屬特點,以及用戶間評分體系所體現(xiàn)的差異性,分別得到具有用戶評分結構性和用戶評分混亂性特點的相似性計算方法。在有限的用戶數(shù)據(jù)空間,通過將兩方面特性進行有效融合,形成新的相似性計算方法。最后,由興趣分布和評分結構出發(fā)得到的相似性方法,在協(xié)同過濾過程中能更好地得到用戶間相似關系。實驗驗證對比顯示,在新的相似計算方法下,推薦算法能夠緩解稀疏狀況,降低推薦誤差。
[Abstract]:With the rapid development of information technology, the number of Internet users and the scale of information are expanding, and the information producers in cyberspace are gradually becoming popular and platform from traditional media. With the improvement of personal influence and the popularization of artificial intelligence, everyone is the producer of information, and any equipment connected to the network transmission is also the information maker. The production of large-scale information not only provides sufficient information for users, but also brings considerable trouble, that is, how to obtain the required information content from the huge and cumbersome data space, which is called information overload. The appearance of recommendation system effectively alleviates the overload problem. The collaborative filtering recommendation technology can make use of relevant information among users to produce reasonable recommendation and can be dynamically adjusted by feedback information. It breaks through the limitation of professional domain knowledge and improves the performance of recommendation. But at the same time, collaborative filtering also faces some problems. Due to the increasing number of users and projects, the problem of dimensionality disaster will inevitably occur, which will be reflected in the data sparsity. How to utilize the existing data information effectively is the key to solve the problem of recommendation system. To solve the sparse problem, this paper starts with similarity. First, in the corresponding project domain, the user is classified according to the item attribute, and the initial interest distribution is obtained. On the basis of the interest distribution characteristics of users, the quantization of data information is carried out to obtain the interest characteristics of users themselves, and the new similarity is obtained by calculating the differences of interest characteristics of users and adjusting the quantitative relationship. Finally, the prediction score numerical calculation is carried out under the collaborative framework, and the recommendation process is finally completed. Secondly, according to the membership characteristics of the user scoring structure and the difference of the scoring system between users, the similarity calculation method with the characteristics of the user scoring structure and the user rating confusion is obtained respectively. In the limited user data space, a new similarity calculation method is formed by combining the two features effectively. Finally, the similarity method based on interest distribution and scoring structure can better obtain the similarity relationship between users in the process of collaborative filtering. The experimental results show that the proposed algorithm can reduce the sparse state and the recommendation error under the new similarity calculation method.
【學位授予單位】:鄭州大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.3
【相似文獻】
相關期刊論文 前10條
1 徐義峰;陳春明;徐云青;;一種基于分類的協(xié)同過濾算法[J];計算機系統(tǒng)應用;2007年01期
2 楊風召;;一種基于特征表的協(xié)同過濾算法[J];計算機工程與應用;2007年06期
3 王嵐;翟正軍;;基于時間加權的協(xié)同過濾算法[J];計算機應用;2007年09期
4 曾子明;張李義;;基于多屬性決策和協(xié)同過濾的智能導購系統(tǒng)[J];武漢大學學報(工學版);2008年02期
5 張富國;;用戶多興趣下基于信任的協(xié)同過濾算法研究[J];小型微型計算機系統(tǒng);2008年08期
6 侯翠琴;焦李成;張文革;;一種壓縮稀疏用戶評分矩陣的協(xié)同過濾算法[J];西安電子科技大學學報;2009年04期
7 廖新考;;基于用戶特征和項目屬性的混合協(xié)同過濾推薦[J];福建電腦;2010年07期
8 沈磊;周一民;李舟軍;;基于心理學模型的協(xié)同過濾推薦方法[J];計算機工程;2010年20期
9 徐紅;彭黎;郭艾寅;徐云劍;;基于用戶多興趣的協(xié)同過濾策略改進研究[J];計算機技術與發(fā)展;2011年04期
10 焦晨斌;王世卿;;基于模型填充的混合協(xié)同過濾算法[J];微計算機信息;2011年11期
相關會議論文 前10條
1 沈杰峰;杜亞軍;唐俊;;一種基于項目分類的協(xié)同過濾算法[A];第二十二屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2005年
2 周軍鋒;湯顯;郭景峰;;一種優(yōu)化的協(xié)同過濾推薦算法[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2004年
3 董全德;;基于雙信息源的協(xié)同過濾算法研究[A];全國第20屆計算機技術與應用學術會議(CACIS·2009)暨全國第1屆安全關鍵技術與應用學術會議論文集(上冊)[C];2009年
4 張光衛(wèi);康建初;李鶴松;劉常昱;李德毅;;面向場景的協(xié)同過濾推薦算法[A];中國系統(tǒng)仿真學會第五次全國會員代表大會暨2006年全國學術年會論文集[C];2006年
5 李建國;姚良超;湯庸;郭歡;;基于認知度的協(xié)同過濾推薦算法[A];第26屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2009年
6 王明文;陶紅亮;熊小勇;;雙向聚類迭代的協(xié)同過濾推薦算法[A];第三屆全國信息檢索與內(nèi)容安全學術會議論文集[C];2007年
7 胡必云;李舟軍;王君;;基于心理測量學的協(xié)同過濾相似度方法(英文)[A];NDBC2010第27屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2010年
8 林麗冰;師瑞峰;周一民;李月雷;;基于雙聚類的協(xié)同過濾推薦算法[A];2008'中國信息技術與應用學術論壇論文集(一)[C];2008年
9 羅喜軍;王韜丞;杜小勇;劉紅巖;何軍;;基于類別的推薦——一種解決協(xié)同推薦中冷啟動問題的方法[A];第二十四屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2007年
10 黃創(chuàng)光;印鑒;汪靜;劉玉葆;王甲海;;不確定近鄰的協(xié)同過濾推薦算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學術會議論文集A輯一[C];2010年
相關博士學位論文 前10條
1 紀科;融合上下文信息的混合協(xié)同過濾推薦算法研究[D];北京交通大學;2016年
2 程殿虎;基于協(xié)同過濾的社會網(wǎng)絡推薦系統(tǒng)關鍵技術研究[D];中國海洋大學;2015年
3 于程遠;基于QoS的Web服務推薦技術研究[D];上海交通大學;2015年
4 李聰;電子商務推薦系統(tǒng)中協(xié)同過濾瓶頸問題研究[D];合肥工業(yè)大學;2009年
5 郭艷紅;推薦系統(tǒng)的協(xié)同過濾算法與應用研究[D];大連理工大學;2008年
6 羅恒;基于協(xié)同過濾視角的受限玻爾茲曼機研究[D];上海交通大學;2011年
7 薛福亮;電子商務協(xié)同過濾推薦質量影響因素及其改進機制研究[D];天津大學;2012年
8 高e,
本文編號:2077046
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2077046.html