天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于常數(shù)復(fù)雜度距離函數(shù)的推薦算法研究

發(fā)布時(shí)間:2017-12-13 18:01

  本文關(guān)鍵詞:基于常數(shù)復(fù)雜度距離函數(shù)的推薦算法研究


  更多相關(guān)文章: 距離函數(shù) 鄰居 時(shí)間復(fù)雜度 推薦系統(tǒng)


【摘要】:推薦系統(tǒng)是指通過(guò)分析用戶(hù)的歷史行為,主動(dòng)給用戶(hù)推薦他們可能感興趣的信息。它能夠大大縮短用戶(hù)篩選信息的時(shí)間,從而被廣泛應(yīng)用于電子商務(wù),電影視頻網(wǎng)絡(luò),社交網(wǎng)絡(luò)等領(lǐng)域。推薦系統(tǒng)的研究方法有很多,其中應(yīng)用最廣泛的是協(xié)同過(guò)濾推薦算法。該算法的核心思想是尋找與目標(biāo)興趣愛(ài)好相似的對(duì)象作為樣本的鄰居,然后通過(guò)分析其鄰居的行為來(lái)預(yù)測(cè)目標(biāo)的行為,F(xiàn)有大量距離度量函數(shù)可以用來(lái)確定目標(biāo)的鄰居,例如余弦相似度,Pearson相關(guān)系數(shù),歐幾里得距離等。但這些距離度量函數(shù)的計(jì)算過(guò)程均比較復(fù)雜,當(dāng)數(shù)據(jù)規(guī)模較大時(shí),距離的計(jì)算會(huì)非常耗時(shí)。本文提出了一個(gè)以平均距離為核心的協(xié)同過(guò)濾推薦算法MBR(M-distance based recommend)。該算法首先定義了一個(gè)新的距離函數(shù)M-distance,該函數(shù)的復(fù)雜度僅有常數(shù)級(jí)。M-distance將對(duì)象與樣本之間的平均評(píng)分差作為二者之間的距離,當(dāng)已知對(duì)象與樣本的平均評(píng)分后,計(jì)算二者距離的時(shí)間復(fù)雜度僅為O(1)。其次提出了以半徑5來(lái)尋找鄰居的方法。在計(jì)算出對(duì)象間的距離后,kNN算法將距離樣本最近的k個(gè)對(duì)象作為樣本的鄰居,但是這樣預(yù)先設(shè)定好鄰居數(shù)量的方法不夠靈活。而以半徑來(lái)尋找鄰居是通過(guò)樣本的平均評(píng)分和δ先確定出樣本的鄰居域,當(dāng)對(duì)象與樣本的距離在這個(gè)鄰居域范圍內(nèi)時(shí),我們就將該對(duì)象作為待選鄰居。通過(guò)這樣的方法來(lái)選擇鄰居,鄰居數(shù)量的多少完全取決于對(duì)象與樣本之間的相似程度,相似度越高,選擇出來(lái)的鄰居就越多,預(yù)測(cè)也就越準(zhǔn)確。然后定義了評(píng)分預(yù)測(cè)方法。當(dāng)選擇出樣本的所有鄰居后,就可以根據(jù)用戶(hù)對(duì)鄰居的行為來(lái)預(yù)測(cè)用戶(hù)對(duì)樣本的行為。當(dāng)有鄰居時(shí),將鄰居的平均評(píng)分作為樣本的最終預(yù)測(cè)值,而沒(méi)有鄰居時(shí)將用戶(hù)對(duì)樣本的平均評(píng)分值作為最終的預(yù)測(cè)值。最后在MBR推薦算法的基礎(chǔ)上繼續(xù)定義了一個(gè)推薦閾值(threshold)。當(dāng)MBR算法計(jì)算出的預(yù)測(cè)值大于推薦閾值時(shí),就將樣本推薦給用戶(hù),反之不推薦。threshold主要由誤推薦率和誤推薦代價(jià)兩者共同決定。本文選取了四個(gè)常用的公開(kāi)數(shù)據(jù)集:MovieLens,DouBan,EachMovie,Netflix來(lái)進(jìn)行試驗(yàn)。主要比較了 MBR推薦算法與kNN,Slope One算法在運(yùn)行效率和預(yù)測(cè)精確上的優(yōu)劣。通過(guò)大量的實(shí)驗(yàn)可知MBR推薦算法在保證了精確度的前提下大大提高了推薦效率,特別是在大型數(shù)據(jù)集上表現(xiàn)更為突出。而最優(yōu)的門(mén)限值一般在3.4與3.5之間產(chǎn)生。
【學(xué)位授予單位】:西南石油大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TP391.3

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 李穎基,彭宏,鄭啟倫,曾煒;自動(dòng)分層推薦算法[J];計(jì)算機(jī)應(yīng)用;2002年11期

2 徐義峰;徐云青;劉曉平;;一種基于時(shí)間序列性的推薦算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2006年10期

3 余小鵬;;一種基于多層關(guān)聯(lián)規(guī)則的推薦算法研究[J];計(jì)算機(jī)應(yīng)用;2007年06期

4 張海玉;劉志都;楊彩;賈松浩;;基于頁(yè)面聚類(lèi)的推薦算法的改進(jìn)[J];計(jì)算機(jī)應(yīng)用與軟件;2008年09期

5 張立燕;;一種基于用戶(hù)事務(wù)模式的推薦算法[J];福建電腦;2009年03期

6 王晗;夏自謙;;基于蟻群算法和瀏覽路徑的推薦算法研究[J];中國(guó)科技信息;2009年07期

7 周珊丹;周興社;王海鵬;倪紅波;張桂英;苗強(qiáng);;智能博物館環(huán)境下的個(gè)性化推薦算法[J];計(jì)算機(jī)工程與應(yīng)用;2010年19期

8 王文;;個(gè)性化推薦算法研究[J];電腦知識(shí)與技術(shù);2010年16期

9 張愷;秦亮曦;寧朝波;李文閣;;改進(jìn)評(píng)價(jià)估計(jì)的混合推薦算法研究[J];微計(jì)算機(jī)信息;2010年36期

10 夏秀峰;代沁;叢麗暉;;用戶(hù)顯意識(shí)下的多重態(tài)度個(gè)性化推薦算法[J];計(jì)算機(jī)工程與應(yīng)用;2011年16期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 王韜丞;羅喜軍;杜小勇;;基于層次的推薦:一種新的個(gè)性化推薦算法[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2007年

2 唐燦;;基于模糊用戶(hù)心理模式的個(gè)性化推薦算法[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年

3 秦國(guó);杜小勇;;基于用戶(hù)層次信息的協(xié)同推薦算法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年

4 周玉妮;鄭會(huì)頌;;基于瀏覽路徑選擇的蟻群推薦算法:用于移動(dòng)商務(wù)個(gè)性化推薦系統(tǒng)[A];社會(huì)經(jīng)濟(jì)發(fā)展轉(zhuǎn)型與系統(tǒng)工程——中國(guó)系統(tǒng)工程學(xué)會(huì)第17屆學(xué)術(shù)年會(huì)論文集[C];2012年

5 蘇日啟;胡皓;汪秉宏;;基于網(wǎng)絡(luò)的含時(shí)推薦算法[A];第五屆全國(guó)復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文(摘要)匯集[C];2009年

6 梁莘q,

本文編號(hào):1286040


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1286040.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)4434b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com