基于項(xiàng)目特征和排序?qū)W習(xí)的新聞推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-06-13 00:51
隨著互聯(lián)網(wǎng)的逐漸普及,如今在線閱讀新聞已成為我們?nèi)粘I钪匾囊徊糠。然?在互聯(lián)網(wǎng)海量信息面前,人們卻往往變得無所適從。作為一種有效應(yīng)對(duì)“信息過載”問題的手段,推薦系統(tǒng)在工業(yè)界和學(xué)術(shù)界均得到了廣泛的研究。本文針對(duì)新聞?lì)I(lǐng)域的推薦方法進(jìn)行了研究。主要研究工作有:(1)分析現(xiàn)有流行度預(yù)測算法,并通過挖掘新聞的特征,提出一種改進(jìn)的新聞流行度預(yù)測方法,使用多種聚類算法將新聞進(jìn)行聚類后,基于相同類別新聞的時(shí)間序列進(jìn)行預(yù)測,并在此基礎(chǔ)上對(duì)非個(gè)性化推薦算法進(jìn)行改進(jìn);(2)根據(jù)用戶的訪問行為,使用循環(huán)神經(jīng)網(wǎng)絡(luò)獲取用戶的興趣特征,并考慮獲取用戶數(shù)據(jù)之后,在對(duì)用戶特征更新的同時(shí),針對(duì)特定的用戶更新文章的特征表示,最終通過用戶特征與文章特征生成推薦列表;(3)基于預(yù)測所得流行度提出一種改進(jìn)協(xié)同過濾的推薦方法,并結(jié)合(2)以及多種推薦算法,針對(duì)top-N推薦問題,使用排序?qū)W習(xí)方法融合推薦結(jié)果,提出一種基于排序?qū)W習(xí)的混合推薦算法,對(duì)推薦結(jié)果進(jìn)行改進(jìn)。在公開數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)測試,結(jié)果表明該算法有更好的推薦性能;(4)基于以上提出的算法設(shè)計(jì)并實(shí)現(xiàn)了基于項(xiàng)目特征和排序?qū)W習(xí)的新聞推薦系統(tǒng),考慮用戶習(xí)慣并有效應(yīng)對(duì)用戶的冷...
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:83 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1新聞生命周期及數(shù)據(jù)采集實(shí)例??
聞的流行度連續(xù)預(yù)測會(huì)有較大的隨機(jī)性。但是我們使用基于時(shí)間序行度預(yù)測方法可以對(duì)這兩類新聞均產(chǎn)生較好的預(yù)測結(jié)果。?????nes?data?-^?article?sertes?dato?一??(a)id:?186578067?(b)id:?186434651??圖2-3基于時(shí)間序列糢型的方法??比實(shí)驗(yàn)做比較,我們提取與ML模型預(yù)測方法中的測試集相同數(shù)分別計(jì)算基于時(shí)間序列預(yù)測的方法、使用新聞項(xiàng)目特征聚類的流行基于時(shí)間序列聚類的流行度預(yù)測方法計(jì)算并輸出最終評(píng)價(jià)指標(biāo),考行度預(yù)測的影響,我們將實(shí)驗(yàn)中新聞的聚類個(gè)數(shù)k選定為9。如
?tin?sm??圖2-5基于時(shí)序列聚類的流行度預(yù)測方法圖2-6基于新聞特征聚類的流行度預(yù)測方法??表2-2?實(shí)驗(yàn)結(jié)果??方灃名矜?均方根誤差?平均絕對(duì)誤差 ̄?????RMSE?MAE???Multivariable-linear?3.149?1.083??Time-series-forecasting-based?3.203?1.059??Article-features-cluster-?i?i\q?\?〇?7??forecasting-based??Time-Serial-cluster-?K979?1.027???iorecastmg-based???值得注意的是,在我們的數(shù)據(jù)集上使用RMSE與MAE評(píng)價(jià)指標(biāo),ML模型??預(yù)測方法相比于基于時(shí)間序列的預(yù)測方法有略好的效果。對(duì)于ML模型我們使用??不同時(shí)間序列的分段度量作為流行度特征,將數(shù)據(jù)集按8:2的比例隨機(jī)劃分為測??試集和訓(xùn)練集,訓(xùn)練所得參數(shù)在測試集上進(jìn)行測試可得時(shí)間結(jié)果如圖2-4所示,??可以較為準(zhǔn)確預(yù)測流行度的預(yù)測值。為便于展示實(shí)驗(yàn)結(jié)果,我們將基于時(shí)間序列??的新聞流行度預(yù)測方法和ML模型方法進(jìn)行放在一張圖之中(圖2-4),其中橙色??的線條表示ML模型的預(yù)測結(jié)果,青色的線條表示使用時(shí)間序列獲取的結(jié)果。直??觀上來看,使用ML模型方法在我們的數(shù)據(jù)集上可以取得相對(duì)較好的實(shí)驗(yàn)結(jié)果;??另外對(duì)于本文提出的兩種改進(jìn)的流行度預(yù)測方法由于實(shí)驗(yàn)結(jié)果比較接近
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計(jì)算機(jī)學(xué)報(bào). 2018(07)
[2]流行度演化分析與預(yù)測綜述[J]. 胡穎,胡長軍,傅樹深,黃建一. 電子與信息學(xué)報(bào). 2017(04)
[3]基于排序?qū)W習(xí)的推薦算法研究綜述[J]. 黃震華,張佳雯,田春岐,孫圣力,向陽. 軟件學(xué)報(bào). 2016(03)
[4]移動(dòng)新聞推薦技術(shù)及其應(yīng)用研究綜述[J]. 孟祥武,陳誠,張玉潔. 計(jì)算機(jī)學(xué)報(bào). 2016(04)
[5]一種融合項(xiàng)目特征和移動(dòng)用戶信任關(guān)系的推薦算法[J]. 胡勛,孟祥武,張玉潔,史艷翠. 軟件學(xué)報(bào). 2014(08)
本文編號(hào):3226650
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:83 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1新聞生命周期及數(shù)據(jù)采集實(shí)例??
聞的流行度連續(xù)預(yù)測會(huì)有較大的隨機(jī)性。但是我們使用基于時(shí)間序行度預(yù)測方法可以對(duì)這兩類新聞均產(chǎn)生較好的預(yù)測結(jié)果。?????nes?data?-^?article?sertes?dato?一??(a)id:?186578067?(b)id:?186434651??圖2-3基于時(shí)間序列糢型的方法??比實(shí)驗(yàn)做比較,我們提取與ML模型預(yù)測方法中的測試集相同數(shù)分別計(jì)算基于時(shí)間序列預(yù)測的方法、使用新聞項(xiàng)目特征聚類的流行基于時(shí)間序列聚類的流行度預(yù)測方法計(jì)算并輸出最終評(píng)價(jià)指標(biāo),考行度預(yù)測的影響,我們將實(shí)驗(yàn)中新聞的聚類個(gè)數(shù)k選定為9。如
?tin?sm??圖2-5基于時(shí)序列聚類的流行度預(yù)測方法圖2-6基于新聞特征聚類的流行度預(yù)測方法??表2-2?實(shí)驗(yàn)結(jié)果??方灃名矜?均方根誤差?平均絕對(duì)誤差 ̄?????RMSE?MAE???Multivariable-linear?3.149?1.083??Time-series-forecasting-based?3.203?1.059??Article-features-cluster-?i?i\q?\?〇?7??forecasting-based??Time-Serial-cluster-?K979?1.027???iorecastmg-based???值得注意的是,在我們的數(shù)據(jù)集上使用RMSE與MAE評(píng)價(jià)指標(biāo),ML模型??預(yù)測方法相比于基于時(shí)間序列的預(yù)測方法有略好的效果。對(duì)于ML模型我們使用??不同時(shí)間序列的分段度量作為流行度特征,將數(shù)據(jù)集按8:2的比例隨機(jī)劃分為測??試集和訓(xùn)練集,訓(xùn)練所得參數(shù)在測試集上進(jìn)行測試可得時(shí)間結(jié)果如圖2-4所示,??可以較為準(zhǔn)確預(yù)測流行度的預(yù)測值。為便于展示實(shí)驗(yàn)結(jié)果,我們將基于時(shí)間序列??的新聞流行度預(yù)測方法和ML模型方法進(jìn)行放在一張圖之中(圖2-4),其中橙色??的線條表示ML模型的預(yù)測結(jié)果,青色的線條表示使用時(shí)間序列獲取的結(jié)果。直??觀上來看,使用ML模型方法在我們的數(shù)據(jù)集上可以取得相對(duì)較好的實(shí)驗(yàn)結(jié)果;??另外對(duì)于本文提出的兩種改進(jìn)的流行度預(yù)測方法由于實(shí)驗(yàn)結(jié)果比較接近
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計(jì)算機(jī)學(xué)報(bào). 2018(07)
[2]流行度演化分析與預(yù)測綜述[J]. 胡穎,胡長軍,傅樹深,黃建一. 電子與信息學(xué)報(bào). 2017(04)
[3]基于排序?qū)W習(xí)的推薦算法研究綜述[J]. 黃震華,張佳雯,田春岐,孫圣力,向陽. 軟件學(xué)報(bào). 2016(03)
[4]移動(dòng)新聞推薦技術(shù)及其應(yīng)用研究綜述[J]. 孟祥武,陳誠,張玉潔. 計(jì)算機(jī)學(xué)報(bào). 2016(04)
[5]一種融合項(xiàng)目特征和移動(dòng)用戶信任關(guān)系的推薦算法[J]. 胡勛,孟祥武,張玉潔,史艷翠. 軟件學(xué)報(bào). 2014(08)
本文編號(hào):3226650
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3226650.html
最近更新
教材專著