基于鄰域的協(xié)同過(guò)濾推薦系統(tǒng)相似度研究
發(fā)布時(shí)間:2018-05-28 05:07
本文選題:鄰域 + 協(xié)同過(guò)濾。 參考:《江西財(cái)經(jīng)大學(xué)》2017年博士論文
【摘要】:在當(dāng)今這個(gè)信息過(guò)載的時(shí)代,如何有效地選擇和推薦滿(mǎn)足用戶(hù)需求的信息,已經(jīng)成為服務(wù)計(jì)算領(lǐng)域的關(guān)鍵問(wèn)題之一。推薦系統(tǒng)能有效地減輕用戶(hù)的認(rèn)知負(fù)擔(dān),為其提供個(gè)性化的服務(wù)和信息。協(xié)同過(guò)濾推薦系統(tǒng)是現(xiàn)有推薦系統(tǒng)中最流行,應(yīng)用最廣泛一種。基于鄰域的協(xié)同過(guò)濾推薦系統(tǒng)是最早出現(xiàn)的協(xié)同過(guò)濾系統(tǒng),因其簡(jiǎn)單、高效及可解釋性好,可擴(kuò)展性和穩(wěn)定性強(qiáng)等特點(diǎn),被廣泛應(yīng)用于商業(yè)系統(tǒng)之中。其主要思想是根據(jù)近鄰的喜好來(lái)產(chǎn)生推薦,沒(méi)有近鄰就無(wú)法進(jìn)行推薦。近鄰的選擇是通過(guò)度量彼此之間的相似度來(lái)完成的。現(xiàn)有的相似度計(jì)算方法是通過(guò)比較評(píng)價(jià)矩陣中兩個(gè)向量的共同評(píng)價(jià)部分得到的。沒(méi)有共同評(píng)價(jià)就無(wú)法度量相似度,從而導(dǎo)致無(wú)法推薦。在實(shí)際應(yīng)用中,評(píng)價(jià)矩陣的稀疏性往往導(dǎo)致共同評(píng)價(jià)部分過(guò)少甚至沒(méi)有,造成現(xiàn)有的相似度度量方法會(huì)出現(xiàn)計(jì)算不準(zhǔn)確甚至無(wú)法計(jì)算的問(wèn)題。本文針對(duì)現(xiàn)有的相似度計(jì)算方法中存在的計(jì)算不準(zhǔn)確,不完整,以及無(wú)法計(jì)算的問(wèn)題,展開(kāi)一系列研究工作,主要的研究?jī)?nèi)容和創(chuàng)新性可以歸納為以下幾個(gè)方面:(1)本文提出了一種整體性相似度計(jì)算方法。現(xiàn)有的相似度計(jì)算方法是通過(guò)比較共同評(píng)價(jià)而不是所有評(píng)價(jià)得到的。評(píng)價(jià)數(shù)據(jù)的稀疏性會(huì)導(dǎo)致共同評(píng)價(jià)部分往往較少,由此造成所得到的相似度只能反映出局部的相似性,而與其實(shí)際整體的相似性存在偏差。用戶(hù)和物品評(píng)價(jià)矩陣越稀疏,共同評(píng)價(jià)就越少,相似度偏差也越大。為此,我們將所有評(píng)價(jià)的整體相似度和原有的共同評(píng)價(jià)的局部相似度相結(jié)合,提出一種新的相似度度量方法,并在此基礎(chǔ)上對(duì)其準(zhǔn)確性做出進(jìn)一步改進(jìn)。該方法能保持其原有方法的簡(jiǎn)單性和高效性。實(shí)驗(yàn)結(jié)果表明,新的相似度計(jì)算方法產(chǎn)生的推薦結(jié)果比現(xiàn)有方法更準(zhǔn)確。(2)本文提出了一種傳遞相似度計(jì)算方法;卩徲虻耐扑]方法是依靠相似的近鄰來(lái)產(chǎn)生推薦的,而近鄰的選擇則是根據(jù)相似度來(lái)篩選的。用戶(hù)和物品評(píng)價(jià)矩陣的稀疏性會(huì)導(dǎo)致共同評(píng)價(jià)部分非常稀少甚至沒(méi)有。沒(méi)有共同評(píng)價(jià)部分就意味著相似度無(wú)法度量,無(wú)法度量相似度也就無(wú)法選擇近鄰,最終導(dǎo)致無(wú)法產(chǎn)生推薦結(jié)果。對(duì)此,我們采用“朋友的朋友是朋友”的策略,將兩個(gè)無(wú)法直接度量相似性的用戶(hù)或物品,通過(guò)與第三方的相似關(guān)系,間接地計(jì)算出雙方之間的相似性。該方法不僅可以處理因?yàn)闆](méi)有共同評(píng)價(jià)而無(wú)法度量相似度問(wèn)題,還可以修正因共同評(píng)價(jià)過(guò)少而造成相似度不準(zhǔn)確的情況。實(shí)驗(yàn)結(jié)果表明,傳遞相似度計(jì)算方法是有效的,尤其是在評(píng)價(jià)非常稀疏時(shí),能產(chǎn)生更多的推薦結(jié)果,對(duì)現(xiàn)有相似度計(jì)算方法是一個(gè)很好的補(bǔ)充。(3)本文提出了一種基于負(fù)相關(guān)的相似度計(jì)算方法;卩徲虻膮f(xié)同過(guò)濾推薦系統(tǒng)中通常都是采用基于相關(guān)性的相似度計(jì)算方法,由此得到相關(guān)性有正相關(guān)和負(fù)相關(guān)。正相關(guān)可以直接反映出兩個(gè)用戶(hù)或兩個(gè)物品之間的相似關(guān)系相似度,因此被認(rèn)為是可靠的相似度。而負(fù)相關(guān)由于不能直接反映出相似關(guān)系而往往被過(guò)濾掉。沒(méi)有正相關(guān)就意味著相似性無(wú)法計(jì)算。對(duì)此,在兩個(gè)用戶(hù)或物品因?yàn)闆](méi)有正相關(guān)而無(wú)法度量其相似性的時(shí)候,我們采用“敵人的敵人是朋友”的策略,通過(guò)負(fù)相關(guān)找到“敵人”的“敵人”,并將其作為自己的朋友來(lái)產(chǎn)生推薦。該方法可以應(yīng)對(duì)因沒(méi)有正相關(guān)性而無(wú)法度量相似度的問(wèn)題,同時(shí)也可以修正因共同評(píng)價(jià)過(guò)少而正相關(guān)相似度不準(zhǔn)確的情況。實(shí)驗(yàn)結(jié)果表明,該方法能產(chǎn)生更多的推薦結(jié)果,尤其是在正相關(guān)相似度不準(zhǔn)確或無(wú)法獲得時(shí),是一個(gè)很好的補(bǔ)充。
[Abstract]:This paper puts forward a new similarity measure method by comparing the similarity between the two vectors in the evaluation matrix . ( 3 ) In this paper , a kind of similarity calculation method based on negative correlation is presented in this paper . It is usually used to calculate the similarity between two users or two objects based on the similarity calculation method based on correlation .
【學(xué)位授予單位】:江西財(cái)經(jīng)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TP391.3;F274
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 朱云峰;;余弦距離算法在固定資產(chǎn)管理系統(tǒng)中文本相似度查詢(xún)的應(yīng)用[J];無(wú)錫商業(yè)職業(yè)技術(shù)學(xué)院學(xué)報(bào);2013年06期
2 馮霞;高峰;劉秀麗;;基于改進(jìn)T-S模型的HAZOP方法在化工生產(chǎn)安全中的應(yīng)用[J];科技與企業(yè);2012年14期
3 李聰;;電子商務(wù)協(xié)同過(guò)濾可擴(kuò)展性研究綜述[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2010年11期
4 夏秀峰;郝仲模;李磊;;考慮年度日程表事件的協(xié)同過(guò)濾推薦[J];計(jì)算機(jī)工程與應(yīng)用;2010年11期
5 朱敏;蘇博;;基于奇異值分解的協(xié)同過(guò)濾推薦算法研究[J];計(jì)算機(jī)安全;2010年07期
6 龔松杰;;電子商務(wù)中協(xié)同過(guò)濾推薦技術(shù)研究[J];商場(chǎng)現(xiàn)代化;2008年03期
7 李雪峰;劉魯;張f,
本文編號(hào):1945400
本文鏈接:http://sikaile.net/jingjilunwen/xmjj/1945400.html
最近更新
教材專(zhuān)著