面向不平衡與稀疏數(shù)據(jù)的推薦算法研究
發(fā)布時(shí)間:2023-01-12 15:29
隨著信息產(chǎn)業(yè)飛速發(fā)展,人們網(wǎng)上購(gòu)物越來(lái)越多,信息過(guò)載問(wèn)題隨之產(chǎn)生,尤其是電商領(lǐng)域。推薦系統(tǒng)產(chǎn)生不僅可以提高用戶購(gòu)物體驗(yàn),同時(shí)能夠增加商家收益,達(dá)到雙贏目的。針對(duì)用戶基本數(shù)據(jù)中性別缺失嚴(yán)重并且?guī)в行詣e標(biāo)簽的樣本存在類別不平衡、評(píng)論等級(jí)數(shù)據(jù)稀疏以及相似性計(jì)算量過(guò)大等問(wèn)題,本文對(duì)電商購(gòu)物平臺(tái)的用戶行為數(shù)據(jù)進(jìn)行分析,提出一種面向不平衡與稀疏數(shù)據(jù)的商品推薦模型。本文主要工作內(nèi)容如下:1.針對(duì)電商平臺(tái)用戶基本數(shù)據(jù)中性別缺失嚴(yán)重、帶有性別標(biāo)簽的樣本存在類別不平衡等問(wèn)題,本文提出一種SMOTERF的性別預(yù)測(cè)方法。該方法首先利用SMOTE算法處理性別標(biāo)簽樣本不平衡的問(wèn)題,得到性別標(biāo)簽平衡的數(shù)據(jù);然后利用隨機(jī)森林模型進(jìn)行訓(xùn)練;最后利用訓(xùn)練好的模型對(duì)缺失性別標(biāo)簽的樣本進(jìn)行預(yù)測(cè)。通過(guò)采用不同的模型分別對(duì)原始數(shù)據(jù)、隨機(jī)過(guò)采樣均衡化處理的數(shù)據(jù)、SMOTE采樣均衡化處理的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)對(duì)比,結(jié)果分析表明經(jīng)過(guò)SMOTE采樣后利用隨機(jī)森林模型進(jìn)行性別預(yù)測(cè)的F1值最高,說(shuō)明本文提出方法的有效性。2.針對(duì)電商平臺(tái)中用戶-商品評(píng)論等級(jí)數(shù)據(jù)稀疏性的問(wèn)題,本文提出一種動(dòng)態(tài)交叉填充DCF方法。該方法首先將用戶基...
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
京東的排行榜模塊圖
今日頭條的推薦板塊圖
整體框架圖
【參考文獻(xiàn)】:
期刊論文
[1]基于中間商品興趣度加權(quán)的內(nèi)容推薦算法[J]. 楊志平,徐騫,馬銘. 北華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(06)
[2]基于深度學(xué)習(xí)加強(qiáng)的混合推薦方法[J]. 張敏,丁弼原,馬為之,譚云志,劉奕群,馬少平. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(10)
[3]基于K-medoids項(xiàng)目聚類的協(xié)同過(guò)濾推薦算法[J]. 王永,萬(wàn)瀟逸,陶婭芝,張璞. 重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(04)
[4]一種緩解互惠推薦系統(tǒng)中數(shù)據(jù)稀疏性的算法[J]. 殷方勇,王紅,王吉華. 濟(jì)南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(01)
[5]基于機(jī)器學(xué)習(xí)的推薦模型的設(shè)計(jì)與研究[J]. 顧方婷. 信息通信. 2016(09)
[6]基于稀疏數(shù)據(jù)預(yù)處理的協(xié)同過(guò)濾推薦算法[J]. 陳宗言,顏俊. 計(jì)算機(jī)技術(shù)與發(fā)展. 2016(07)
[7]一種改進(jìn)的K-means聚類的協(xié)同過(guò)濾算法[J]. 趙偉,林楠,韓英,張洪濤. 安徽大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(02)
[8]一種基于項(xiàng)目屬性評(píng)分的協(xié)同過(guò)濾推薦算法[J]. 龔安,高云,高洪福. 計(jì)算機(jī)工程與科學(xué). 2015(12)
[9]基于用戶聚類的推薦算法[J]. 劉璟,李鵬,劉欣,王婭丹. 計(jì)算機(jī)應(yīng)用與軟件. 2015(10)
[10]一種緩解協(xié)同過(guò)濾算法數(shù)據(jù)稀疏性的方法[J]. 蔡雄峰,艾麗華,丁丁. 軟件. 2015(03)
碩士論文
[1]基于降維技術(shù)和分布式計(jì)算的協(xié)同過(guò)濾可擴(kuò)展性問(wèn)題解決方案[D]. 王云凱.西南財(cái)經(jīng)大學(xué) 2014
[2]混合協(xié)同過(guò)濾算法研究[D]. 劉宇軒.北京郵電大學(xué) 2013
[3]基于內(nèi)容聚類的協(xié)同過(guò)濾推薦系統(tǒng)研究[D]. 葛潤(rùn)霞.山東師范大學(xué) 2008
本文編號(hào):3730076
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
京東的排行榜模塊圖
今日頭條的推薦板塊圖
整體框架圖
【參考文獻(xiàn)】:
期刊論文
[1]基于中間商品興趣度加權(quán)的內(nèi)容推薦算法[J]. 楊志平,徐騫,馬銘. 北華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(06)
[2]基于深度學(xué)習(xí)加強(qiáng)的混合推薦方法[J]. 張敏,丁弼原,馬為之,譚云志,劉奕群,馬少平. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(10)
[3]基于K-medoids項(xiàng)目聚類的協(xié)同過(guò)濾推薦算法[J]. 王永,萬(wàn)瀟逸,陶婭芝,張璞. 重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(04)
[4]一種緩解互惠推薦系統(tǒng)中數(shù)據(jù)稀疏性的算法[J]. 殷方勇,王紅,王吉華. 濟(jì)南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(01)
[5]基于機(jī)器學(xué)習(xí)的推薦模型的設(shè)計(jì)與研究[J]. 顧方婷. 信息通信. 2016(09)
[6]基于稀疏數(shù)據(jù)預(yù)處理的協(xié)同過(guò)濾推薦算法[J]. 陳宗言,顏俊. 計(jì)算機(jī)技術(shù)與發(fā)展. 2016(07)
[7]一種改進(jìn)的K-means聚類的協(xié)同過(guò)濾算法[J]. 趙偉,林楠,韓英,張洪濤. 安徽大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(02)
[8]一種基于項(xiàng)目屬性評(píng)分的協(xié)同過(guò)濾推薦算法[J]. 龔安,高云,高洪福. 計(jì)算機(jī)工程與科學(xué). 2015(12)
[9]基于用戶聚類的推薦算法[J]. 劉璟,李鵬,劉欣,王婭丹. 計(jì)算機(jī)應(yīng)用與軟件. 2015(10)
[10]一種緩解協(xié)同過(guò)濾算法數(shù)據(jù)稀疏性的方法[J]. 蔡雄峰,艾麗華,丁丁. 軟件. 2015(03)
碩士論文
[1]基于降維技術(shù)和分布式計(jì)算的協(xié)同過(guò)濾可擴(kuò)展性問(wèn)題解決方案[D]. 王云凱.西南財(cái)經(jīng)大學(xué) 2014
[2]混合協(xié)同過(guò)濾算法研究[D]. 劉宇軒.北京郵電大學(xué) 2013
[3]基于內(nèi)容聚類的協(xié)同過(guò)濾推薦系統(tǒng)研究[D]. 葛潤(rùn)霞.山東師范大學(xué) 2008
本文編號(hào):3730076
本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/3730076.html
最近更新
教材專著