基于項目特征和排序?qū)W習(xí)的新聞推薦系統(tǒng)設(shè)計與實(shí)現(xiàn)
發(fā)布時間:2021-06-13 00:51
隨著互聯(lián)網(wǎng)的逐漸普及,如今在線閱讀新聞已成為我們?nèi)粘I钪匾囊徊糠帧H欢?在互聯(lián)網(wǎng)海量信息面前,人們卻往往變得無所適從。作為一種有效應(yīng)對“信息過載”問題的手段,推薦系統(tǒng)在工業(yè)界和學(xué)術(shù)界均得到了廣泛的研究。本文針對新聞領(lǐng)域的推薦方法進(jìn)行了研究。主要研究工作有:(1)分析現(xiàn)有流行度預(yù)測算法,并通過挖掘新聞的特征,提出一種改進(jìn)的新聞流行度預(yù)測方法,使用多種聚類算法將新聞進(jìn)行聚類后,基于相同類別新聞的時間序列進(jìn)行預(yù)測,并在此基礎(chǔ)上對非個性化推薦算法進(jìn)行改進(jìn);(2)根據(jù)用戶的訪問行為,使用循環(huán)神經(jīng)網(wǎng)絡(luò)獲取用戶的興趣特征,并考慮獲取用戶數(shù)據(jù)之后,在對用戶特征更新的同時,針對特定的用戶更新文章的特征表示,最終通過用戶特征與文章特征生成推薦列表;(3)基于預(yù)測所得流行度提出一種改進(jìn)協(xié)同過濾的推薦方法,并結(jié)合(2)以及多種推薦算法,針對top-N推薦問題,使用排序?qū)W習(xí)方法融合推薦結(jié)果,提出一種基于排序?qū)W習(xí)的混合推薦算法,對推薦結(jié)果進(jìn)行改進(jìn)。在公開數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)測試,結(jié)果表明該算法有更好的推薦性能;(4)基于以上提出的算法設(shè)計并實(shí)現(xiàn)了基于項目特征和排序?qū)W習(xí)的新聞推薦系統(tǒng),考慮用戶習(xí)慣并有效應(yīng)對用戶的冷...
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1新聞生命周期及數(shù)據(jù)采集實(shí)例??
聞的流行度連續(xù)預(yù)測會有較大的隨機(jī)性。但是我們使用基于時間序行度預(yù)測方法可以對這兩類新聞均產(chǎn)生較好的預(yù)測結(jié)果。?????nes?data?-^?article?sertes?dato?一??(a)id:?186578067?(b)id:?186434651??圖2-3基于時間序列糢型的方法??比實(shí)驗(yàn)做比較,我們提取與ML模型預(yù)測方法中的測試集相同數(shù)分別計算基于時間序列預(yù)測的方法、使用新聞項目特征聚類的流行基于時間序列聚類的流行度預(yù)測方法計算并輸出最終評價指標(biāo),考行度預(yù)測的影響,我們將實(shí)驗(yàn)中新聞的聚類個數(shù)k選定為9。如
?tin?sm??圖2-5基于時序列聚類的流行度預(yù)測方法圖2-6基于新聞特征聚類的流行度預(yù)測方法??表2-2?實(shí)驗(yàn)結(jié)果??方灃名矜?均方根誤差?平均絕對誤差 ̄?????RMSE?MAE???Multivariable-linear?3.149?1.083??Time-series-forecasting-based?3.203?1.059??Article-features-cluster-?i?i\q?\?〇?7??forecasting-based??Time-Serial-cluster-?K979?1.027???iorecastmg-based???值得注意的是,在我們的數(shù)據(jù)集上使用RMSE與MAE評價指標(biāo),ML模型??預(yù)測方法相比于基于時間序列的預(yù)測方法有略好的效果。對于ML模型我們使用??不同時間序列的分段度量作為流行度特征,將數(shù)據(jù)集按8:2的比例隨機(jī)劃分為測??試集和訓(xùn)練集,訓(xùn)練所得參數(shù)在測試集上進(jìn)行測試可得時間結(jié)果如圖2-4所示,??可以較為準(zhǔn)確預(yù)測流行度的預(yù)測值。為便于展示實(shí)驗(yàn)結(jié)果,我們將基于時間序列??的新聞流行度預(yù)測方法和ML模型方法進(jìn)行放在一張圖之中(圖2-4),其中橙色??的線條表示ML模型的預(yù)測結(jié)果,青色的線條表示使用時間序列獲取的結(jié)果。直??觀上來看,使用ML模型方法在我們的數(shù)據(jù)集上可以取得相對較好的實(shí)驗(yàn)結(jié)果;??另外對于本文提出的兩種改進(jìn)的流行度預(yù)測方法由于實(shí)驗(yàn)結(jié)果比較接近
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機(jī)學(xué)報. 2018(07)
[2]流行度演化分析與預(yù)測綜述[J]. 胡穎,胡長軍,傅樹深,黃建一. 電子與信息學(xué)報. 2017(04)
[3]基于排序?qū)W習(xí)的推薦算法研究綜述[J]. 黃震華,張佳雯,田春岐,孫圣力,向陽. 軟件學(xué)報. 2016(03)
[4]移動新聞推薦技術(shù)及其應(yīng)用研究綜述[J]. 孟祥武,陳誠,張玉潔. 計算機(jī)學(xué)報. 2016(04)
[5]一種融合項目特征和移動用戶信任關(guān)系的推薦算法[J]. 胡勛,孟祥武,張玉潔,史艷翠. 軟件學(xué)報. 2014(08)
本文編號:3226650
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1新聞生命周期及數(shù)據(jù)采集實(shí)例??
聞的流行度連續(xù)預(yù)測會有較大的隨機(jī)性。但是我們使用基于時間序行度預(yù)測方法可以對這兩類新聞均產(chǎn)生較好的預(yù)測結(jié)果。?????nes?data?-^?article?sertes?dato?一??(a)id:?186578067?(b)id:?186434651??圖2-3基于時間序列糢型的方法??比實(shí)驗(yàn)做比較,我們提取與ML模型預(yù)測方法中的測試集相同數(shù)分別計算基于時間序列預(yù)測的方法、使用新聞項目特征聚類的流行基于時間序列聚類的流行度預(yù)測方法計算并輸出最終評價指標(biāo),考行度預(yù)測的影響,我們將實(shí)驗(yàn)中新聞的聚類個數(shù)k選定為9。如
?tin?sm??圖2-5基于時序列聚類的流行度預(yù)測方法圖2-6基于新聞特征聚類的流行度預(yù)測方法??表2-2?實(shí)驗(yàn)結(jié)果??方灃名矜?均方根誤差?平均絕對誤差 ̄?????RMSE?MAE???Multivariable-linear?3.149?1.083??Time-series-forecasting-based?3.203?1.059??Article-features-cluster-?i?i\q?\?〇?7??forecasting-based??Time-Serial-cluster-?K979?1.027???iorecastmg-based???值得注意的是,在我們的數(shù)據(jù)集上使用RMSE與MAE評價指標(biāo),ML模型??預(yù)測方法相比于基于時間序列的預(yù)測方法有略好的效果。對于ML模型我們使用??不同時間序列的分段度量作為流行度特征,將數(shù)據(jù)集按8:2的比例隨機(jī)劃分為測??試集和訓(xùn)練集,訓(xùn)練所得參數(shù)在測試集上進(jìn)行測試可得時間結(jié)果如圖2-4所示,??可以較為準(zhǔn)確預(yù)測流行度的預(yù)測值。為便于展示實(shí)驗(yàn)結(jié)果,我們將基于時間序列??的新聞流行度預(yù)測方法和ML模型方法進(jìn)行放在一張圖之中(圖2-4),其中橙色??的線條表示ML模型的預(yù)測結(jié)果,青色的線條表示使用時間序列獲取的結(jié)果。直??觀上來看,使用ML模型方法在我們的數(shù)據(jù)集上可以取得相對較好的實(shí)驗(yàn)結(jié)果;??另外對于本文提出的兩種改進(jìn)的流行度預(yù)測方法由于實(shí)驗(yàn)結(jié)果比較接近
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機(jī)學(xué)報. 2018(07)
[2]流行度演化分析與預(yù)測綜述[J]. 胡穎,胡長軍,傅樹深,黃建一. 電子與信息學(xué)報. 2017(04)
[3]基于排序?qū)W習(xí)的推薦算法研究綜述[J]. 黃震華,張佳雯,田春岐,孫圣力,向陽. 軟件學(xué)報. 2016(03)
[4]移動新聞推薦技術(shù)及其應(yīng)用研究綜述[J]. 孟祥武,陳誠,張玉潔. 計算機(jī)學(xué)報. 2016(04)
[5]一種融合項目特征和移動用戶信任關(guān)系的推薦算法[J]. 胡勛,孟祥武,張玉潔,史艷翠. 軟件學(xué)報. 2014(08)
本文編號:3226650
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3226650.html
最近更新
教材專著