天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于特征工程的協(xié)同過(guò)濾算法研究

發(fā)布時(shí)間:2024-04-25 23:07
  協(xié)同過(guò)濾算法是目前應(yīng)用最廣泛、最成功的推薦算法之一,通過(guò)分析用戶或項(xiàng)目特征計(jì)算相似度,生成最近鄰集合,最后預(yù)測(cè)對(duì)未知項(xiàng)目的評(píng)分生成推薦結(jié)果。用戶或項(xiàng)目特征在協(xié)同過(guò)濾算法中是至關(guān)重要的,其區(qū)分度和稀疏性會(huì)直接影響算法的預(yù)測(cè)準(zhǔn)確度。無(wú)論是傳統(tǒng)協(xié)同過(guò)濾算法還是改進(jìn)的協(xié)同過(guò)濾算法,二者都是將評(píng)分?jǐn)?shù)據(jù)作為用戶或項(xiàng)目的特征,因此就有兩個(gè)方面的問(wèn)題需要進(jìn)一步探索和優(yōu)化:(1)用戶或項(xiàng)目特征的區(qū)分度不高。評(píng)分?jǐn)?shù)據(jù)在很大程度上受到用戶個(gè)性化偏好、行為習(xí)慣等不可度量因素的影響,對(duì)于不同的用戶來(lái)說(shuō),相同評(píng)分會(huì)代表不同偏好,而不同評(píng)分卻可能代表相同的偏好。因此,將評(píng)分?jǐn)?shù)據(jù)作為用戶或項(xiàng)目特征就會(huì)存在特征區(qū)分度不高的問(wèn)題。為了得到區(qū)分度更高的特征,研究者們會(huì)使用不同的方法,例如:基于內(nèi)容的方法引入各種用戶或項(xiàng)目特征、引入人口統(tǒng)計(jì)特征或結(jié)合自然語(yǔ)言處理技術(shù)等。(2)用戶或項(xiàng)目特征具有高稀疏性。隨著互聯(lián)網(wǎng)用戶規(guī)模的急速擴(kuò)大和電子商務(wù)的普及,用戶評(píng)分的項(xiàng)目通常只占全部項(xiàng)目的很少一部分,評(píng)分?jǐn)?shù)據(jù)極度稀疏。此時(shí),將評(píng)分?jǐn)?shù)據(jù)作為用戶或項(xiàng)目特征就會(huì)存在特征稀疏度高的問(wèn)題。為了緩解稀疏性問(wèn)題帶來(lái)的影響,研究者們創(chuàng)新出了多種控制填...

【文章頁(yè)數(shù)】:59 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖1-1主流社交應(yīng)用使用率

圖1-1主流社交應(yīng)用使用率

第1章緒論第1章緒論.1研究背景及意義信息技術(shù)的高速發(fā)展,為人們?nèi)粘I钪行畔⒌墨@取提供了便捷途徑,但不僅僅滿足于獲取信息,與此同時(shí)也在制造信息,傳播信息。中國(guó)互聯(lián)網(wǎng)絡(luò)中心預(yù)2018年8月發(fā)布的第42中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[1]指出,截018年....


圖1-2網(wǎng)絡(luò)購(gòu)物用戶規(guī)模

圖1-2網(wǎng)絡(luò)購(gòu)物用戶規(guī)模

每日都會(huì)花費(fèi)數(shù)個(gè)小時(shí)進(jìn)行網(wǎng)絡(luò)即時(shí)通信、網(wǎng)絡(luò)購(gòu)物、APP應(yīng)用等統(tǒng)計(jì)共有544萬(wàn)個(gè)網(wǎng)站和415萬(wàn)款A(yù)PP,半年間制造、傳播266億GB的信如,觀察圖1-1中數(shù)據(jù),隨著微信朋友圈、QQ空間和微博等主流社交應(yīng)用的使用,網(wǎng)絡(luò)購(gòu)物和手機(jī)購(gòu)物的用戶規(guī)模與日俱增,如圖....


圖2-5基于矩陣分解模型的協(xié)同過(guò)濾算法

圖2-5基于矩陣分解模型的協(xié)同過(guò)濾算法

圖2-5基于矩陣分解模型的協(xié)同過(guò)濾算法為了訓(xùn)練矩陣分解模型,需要最小化損失函數(shù),如下公式,然后可以使降等優(yōu)化算對(duì)參數(shù)進(jìn)行學(xué)習(xí)。min,在模型訓(xùn)練結(jié)束之后,通過(guò)公式還原評(píng)分矩陣。從矩陣中便可以得到對(duì)目的預(yù)測(cè)評(píng)分值。??=?(歸因理論海德(FritzHeider)于1....


圖2-6GBDT+LR模型

圖2-6GBDT+LR模型

圖2-6GBDT+LR模型2.4常用數(shù)據(jù)集及評(píng)價(jià)指標(biāo)2.4.1常用數(shù)據(jù)集為評(píng)估文中提出的算法對(duì)準(zhǔn)確度的提升程度,在三個(gè)Movielens[46]、Yahoo!WebscopeR4[47]、Filmtrust[48]。這究領(lǐng)域通用的數(shù)據(jù)集,采集的都是用戶對(duì)項(xiàng)目的....



本文編號(hào):3964365

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3964365.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶709b2***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com