推薦系統(tǒng)中基于相似性計(jì)算的協(xié)同過濾算法研究
本文選題:協(xié)同過濾 + 稀疏性 ; 參考:《鄭州大學(xué)》2017年碩士論文
【摘要】:信息技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)用戶量和信息量規(guī)模的不斷擴(kuò)大,網(wǎng)絡(luò)空間的信息生產(chǎn)者由傳統(tǒng)媒體逐步趨向大眾化和平臺(tái)化。隨著個(gè)人影響力的提升和人工智能的普及發(fā)展,人人都是信息的生產(chǎn)者,任何同網(wǎng)絡(luò)傳輸相連接的設(shè)備也是信息制造者。大規(guī)模信息量的產(chǎn)生在為用戶提供充足信息的同時(shí)也帶來相當(dāng)大的困擾,即如何從龐大繁瑣的數(shù)據(jù)空間獲取需要的信息內(nèi)容,該現(xiàn)象即是信息過載。推薦系統(tǒng)的出現(xiàn),有效地緩解了過載問題。其中的協(xié)同過濾推薦技術(shù),利用用戶間相關(guān)信息,產(chǎn)生合理推薦,并能由反饋信息進(jìn)行動(dòng)態(tài)調(diào)整,突破了專業(yè)領(lǐng)域知識(shí)的限制,提高了推薦性能。但同時(shí)協(xié)同過濾也面臨著一些問題,由于用戶規(guī)模和項(xiàng)目數(shù)量的不斷增大,不可避免地會(huì)出現(xiàn)維度災(zāi)難的問題,該問題具體會(huì)反映在數(shù)據(jù)稀疏性上,如何有效地利用已存在的數(shù)據(jù)信息,為解決推薦系統(tǒng)所面臨問題的關(guān)鍵。針對(duì)稀疏問題,本文由相似性出發(fā)展開研究。第一,在用戶對(duì)應(yīng)的項(xiàng)目領(lǐng)域,根據(jù)項(xiàng)目屬性進(jìn)行用戶分類,得到用戶初始興趣分布。在用戶所具有的興趣分布特征基礎(chǔ)上進(jìn)行數(shù)據(jù)信息量化處理,獲取用戶本身興趣特征,通過計(jì)算用戶的興趣特征差異,經(jīng)過數(shù)量關(guān)系調(diào)整后得到新的相似性,最終在協(xié)同框架下進(jìn)行預(yù)測(cè)評(píng)分?jǐn)?shù)值計(jì)算,最終完成推薦過程。第二,根據(jù)用戶評(píng)分結(jié)構(gòu)所具有的隸屬特點(diǎn),以及用戶間評(píng)分體系所體現(xiàn)的差異性,分別得到具有用戶評(píng)分結(jié)構(gòu)性和用戶評(píng)分混亂性特點(diǎn)的相似性計(jì)算方法。在有限的用戶數(shù)據(jù)空間,通過將兩方面特性進(jìn)行有效融合,形成新的相似性計(jì)算方法。最后,由興趣分布和評(píng)分結(jié)構(gòu)出發(fā)得到的相似性方法,在協(xié)同過濾過程中能更好地得到用戶間相似關(guān)系。實(shí)驗(yàn)驗(yàn)證對(duì)比顯示,在新的相似計(jì)算方法下,推薦算法能夠緩解稀疏狀況,降低推薦誤差。
[Abstract]:With the rapid development of information technology, the number of Internet users and the scale of information are expanding, and the information producers in cyberspace are gradually becoming popular and platform from traditional media. With the improvement of personal influence and the popularization of artificial intelligence, everyone is the producer of information, and any equipment connected to the network transmission is also the information maker. The production of large-scale information not only provides sufficient information for users, but also brings considerable trouble, that is, how to obtain the required information content from the huge and cumbersome data space, which is called information overload. The appearance of recommendation system effectively alleviates the overload problem. The collaborative filtering recommendation technology can make use of relevant information among users to produce reasonable recommendation and can be dynamically adjusted by feedback information. It breaks through the limitation of professional domain knowledge and improves the performance of recommendation. But at the same time, collaborative filtering also faces some problems. Due to the increasing number of users and projects, the problem of dimensionality disaster will inevitably occur, which will be reflected in the data sparsity. How to utilize the existing data information effectively is the key to solve the problem of recommendation system. To solve the sparse problem, this paper starts with similarity. First, in the corresponding project domain, the user is classified according to the item attribute, and the initial interest distribution is obtained. On the basis of the interest distribution characteristics of users, the quantization of data information is carried out to obtain the interest characteristics of users themselves, and the new similarity is obtained by calculating the differences of interest characteristics of users and adjusting the quantitative relationship. Finally, the prediction score numerical calculation is carried out under the collaborative framework, and the recommendation process is finally completed. Secondly, according to the membership characteristics of the user scoring structure and the difference of the scoring system between users, the similarity calculation method with the characteristics of the user scoring structure and the user rating confusion is obtained respectively. In the limited user data space, a new similarity calculation method is formed by combining the two features effectively. Finally, the similarity method based on interest distribution and scoring structure can better obtain the similarity relationship between users in the process of collaborative filtering. The experimental results show that the proposed algorithm can reduce the sparse state and the recommendation error under the new similarity calculation method.
【學(xué)位授予單位】:鄭州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 徐義峰;陳春明;徐云青;;一種基于分類的協(xié)同過濾算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2007年01期
2 楊風(fēng)召;;一種基于特征表的協(xié)同過濾算法[J];計(jì)算機(jī)工程與應(yīng)用;2007年06期
3 王嵐;翟正軍;;基于時(shí)間加權(quán)的協(xié)同過濾算法[J];計(jì)算機(jī)應(yīng)用;2007年09期
4 曾子明;張李義;;基于多屬性決策和協(xié)同過濾的智能導(dǎo)購(gòu)系統(tǒng)[J];武漢大學(xué)學(xué)報(bào)(工學(xué)版);2008年02期
5 張富國(guó);;用戶多興趣下基于信任的協(xié)同過濾算法研究[J];小型微型計(jì)算機(jī)系統(tǒng);2008年08期
6 侯翠琴;焦李成;張文革;;一種壓縮稀疏用戶評(píng)分矩陣的協(xié)同過濾算法[J];西安電子科技大學(xué)學(xué)報(bào);2009年04期
7 廖新考;;基于用戶特征和項(xiàng)目屬性的混合協(xié)同過濾推薦[J];福建電腦;2010年07期
8 沈磊;周一民;李舟軍;;基于心理學(xué)模型的協(xié)同過濾推薦方法[J];計(jì)算機(jī)工程;2010年20期
9 徐紅;彭黎;郭艾寅;徐云劍;;基于用戶多興趣的協(xié)同過濾策略改進(jìn)研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年04期
10 焦晨斌;王世卿;;基于模型填充的混合協(xié)同過濾算法[J];微計(jì)算機(jī)信息;2011年11期
相關(guān)會(huì)議論文 前10條
1 沈杰峰;杜亞軍;唐俊;;一種基于項(xiàng)目分類的協(xié)同過濾算法[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
2 周軍鋒;湯顯;郭景峰;;一種優(yōu)化的協(xié)同過濾推薦算法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
3 董全德;;基于雙信息源的協(xié)同過濾算法研究[A];全國(guó)第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國(guó)第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年
4 張光衛(wèi);康建初;李鶴松;劉常昱;李德毅;;面向場(chǎng)景的協(xié)同過濾推薦算法[A];中國(guó)系統(tǒng)仿真學(xué)會(huì)第五次全國(guó)會(huì)員代表大會(huì)暨2006年全國(guó)學(xué)術(shù)年會(huì)論文集[C];2006年
5 李建國(guó);姚良超;湯庸;郭歡;;基于認(rèn)知度的協(xié)同過濾推薦算法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
6 王明文;陶紅亮;熊小勇;;雙向聚類迭代的協(xié)同過濾推薦算法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
7 胡必云;李舟軍;王君;;基于心理測(cè)量學(xué)的協(xié)同過濾相似度方法(英文)[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
8 林麗冰;師瑞峰;周一民;李月雷;;基于雙聚類的協(xié)同過濾推薦算法[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
9 羅喜軍;王韜丞;杜小勇;劉紅巖;何軍;;基于類別的推薦——一種解決協(xié)同推薦中冷啟動(dòng)問題的方法[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
10 黃創(chuàng)光;印鑒;汪靜;劉玉葆;王甲海;;不確定近鄰的協(xié)同過濾推薦算法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯一[C];2010年
相關(guān)博士學(xué)位論文 前10條
1 紀(jì)科;融合上下文信息的混合協(xié)同過濾推薦算法研究[D];北京交通大學(xué);2016年
2 程殿虎;基于協(xié)同過濾的社會(huì)網(wǎng)絡(luò)推薦系統(tǒng)關(guān)鍵技術(shù)研究[D];中國(guó)海洋大學(xué);2015年
3 于程遠(yuǎn);基于QoS的Web服務(wù)推薦技術(shù)研究[D];上海交通大學(xué);2015年
4 李聰;電子商務(wù)推薦系統(tǒng)中協(xié)同過濾瓶頸問題研究[D];合肥工業(yè)大學(xué);2009年
5 郭艷紅;推薦系統(tǒng)的協(xié)同過濾算法與應(yīng)用研究[D];大連理工大學(xué);2008年
6 羅恒;基于協(xié)同過濾視角的受限玻爾茲曼機(jī)研究[D];上海交通大學(xué);2011年
7 薛福亮;電子商務(wù)協(xié)同過濾推薦質(zhì)量影響因素及其改進(jìn)機(jī)制研究[D];天津大學(xué);2012年
8 高e,
本文編號(hào):2077046
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2077046.html