基于超圖模型的新聞推薦研究
發(fā)布時(shí)間:2019-02-18 14:17
【摘要】:隨著經(jīng)濟(jì)和互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,新聞資訊得到了快速的增長(zhǎng)和傳播,越來(lái)越多的用戶使用計(jì)算機(jī)或智能手機(jī)閱讀新聞而不是觀看電視或購(gòu)買報(bào)紙。新聞資訊的海量生成和快速傳播給我們帶來(lái)了豐富的信息,但同時(shí)也帶來(lái)了信息過(guò)載的問(wèn)題。新聞推薦系統(tǒng)的研究和應(yīng)用可以為用戶推送合適的新聞,提升閱讀體驗(yàn),解決新聞信息過(guò)載問(wèn)題。傳統(tǒng)的推薦技術(shù)研究著重于用戶和物品之間的訪問(wèn)協(xié)同性,這在商品推薦、評(píng)分預(yù)測(cè)等應(yīng)用領(lǐng)域也取得了較好的效果。然而,待推薦的新聞往往是新出版的新聞,與用戶之間很難建立直接且穩(wěn)定的關(guān)聯(lián),這種場(chǎng)景下容易出現(xiàn)冷物品問(wèn)題。因此,新近的新聞推薦研究較常使用的方法是將基于內(nèi)容的推薦作為推薦框架的重要組成部分,將待推薦新聞和已經(jīng)訓(xùn)練好的用戶偏好度模型進(jìn)行對(duì)比。但基于內(nèi)容的方法一般需要將新聞看成基于詞袋的向量空間模型,不僅丟失了語(yǔ)義信息,也沒(méi)有充分考慮新聞內(nèi)容的一些基本特點(diǎn),如體裁、類別、地區(qū)、作者等因素在用戶閱讀行為預(yù)測(cè)中的重要作用。同時(shí),單純考慮基于內(nèi)容的推薦方法容易導(dǎo)致推薦多樣性不足。此外,也很難將系列新聞報(bào)道即用戶閱讀新聞的上下文環(huán)境作為推薦學(xué)習(xí)的背景因素,即沒(méi)有考慮新聞演化問(wèn)題對(duì)用戶閱讀行為預(yù)測(cè)的影響。由于冷物品問(wèn)題、多樣性問(wèn)題和新聞演化問(wèn)題沒(méi)有得到很好地解決,因此也影響了新聞推薦的準(zhǔn)確性。基于以上局限,本論文提出了基于超圖的新聞推薦模型,該模型有利于將新聞內(nèi)容的基本屬性融合在新聞推薦過(guò)程中,并容易整合基于內(nèi)容和基于協(xié)同過(guò)濾的方法,以獲得較好的推薦效果。本論文的主要研究工作和創(chuàng)新點(diǎn)如下:(1)提出將新聞推薦場(chǎng)景中的各種對(duì)象、新聞內(nèi)容屬性及其相互關(guān)系定義到超圖模型中。超圖模型擅長(zhǎng)描述多對(duì)多的對(duì)象關(guān)系,本文對(duì)新聞推薦場(chǎng)景中的各種對(duì)象進(jìn)行抽象,使基于超圖的新聞推薦模型具備可擴(kuò)展性,并定義具有普適性的超邊類別,使新聞推薦可以根據(jù)應(yīng)用和研究需求進(jìn)行拓展。(2)針對(duì)傳統(tǒng)新聞推薦方法所使用的聚類基于文本單一對(duì)象的局限性,本文研究適用于異構(gòu)對(duì)象關(guān)系挖掘的超圖聚類,提出了基于超圖聚類的新聞推薦算法(HCB,Hypergraph Clustering Based news recommendation)。在對(duì)傳統(tǒng)的新聞推薦研究中發(fā)現(xiàn),基于文本聚類方法僅能對(duì)新聞關(guān)系進(jìn)行挖掘,而沒(méi)有直接將用戶關(guān)系考慮在該過(guò)程中。本文提出了基于超圖聚類的推薦框架,將新聞和用戶的關(guān)系融合在超圖聚類中。啟發(fā)于普通圖的譜聚類方法,本文提出的超圖聚類方法可以挖掘用戶興趣簇,然后借助新聞選擇策略給用戶挑選最合適的新聞。傳統(tǒng)基于文本聚類的推薦方法只能分析同一類型的對(duì)象,新聞文章需要轉(zhuǎn)換為向量空間模型進(jìn)行聚類,而HCB方法根據(jù)異構(gòu)對(duì)象之間的關(guān)系進(jìn)行聚類,即在聚類階段就將用戶和可能感興趣的新聞鎖定在了聚類簇中。在真實(shí)語(yǔ)料的實(shí)驗(yàn)中,HCB方法在推薦準(zhǔn)確性、多樣性和穩(wěn)定性方面優(yōu)于基于內(nèi)容、基于協(xié)同過(guò)濾的基線方法,也略優(yōu)于使用文本聚類的基線方法。(3)為了更直觀地獲得新聞推薦結(jié)果,融合聚類和新聞選擇過(guò)程,本文研究超圖排序的理論方法,提出了基于超圖排序的新聞推薦算法(HRB,Hypergraph Ranking Based news recommendation)和基于二叉決策樹優(yōu)化的方法(HRBopt,Hypergraph Ranking Based optimized by binary decision tree)。使用超圖聚類方式需要通過(guò)聚類獲得聚類簇,再根據(jù)聚類簇獲得候選集,但候選集往往較大,需要進(jìn)一步選擇。因此本研究借助超圖排序模型,將新聞推薦中的各元素及其相互關(guān)系映射為矩陣元素,然后通過(guò)排序代價(jià)函數(shù)給出排序值計(jì)算方法。為了進(jìn)一步消除超圖排序在點(diǎn)和邊定義階段的主觀性,本文還提出使用二叉決策樹方法進(jìn)一步修正選擇結(jié)果。通過(guò)實(shí)驗(yàn)可知,使用了超圖排序方法及其二叉決策樹優(yōu)化的方法雖然在多樣化及其覆蓋率指標(biāo)上略差于通過(guò)超圖聚類和文本聚類的相關(guān)基線方法,但在推薦準(zhǔn)確性和排序性方面優(yōu)于基線方法。(4)為了解決新聞推薦中用戶閱讀興趣上下文相關(guān)的問(wèn)題,本文研究了超圖新聞鏈及其在新聞推薦中的應(yīng)用,提出了基于故事鏈的新聞推薦(HSB,Hypergraph news Story chain Based news recommendation)。用戶可能會(huì)對(duì)系列新聞報(bào)道中的缺失環(huán)節(jié)產(chǎn)生興趣。本研究定義了構(gòu)建新聞鏈的基本要素和原則,并使用超圖隨機(jī)游走方法構(gòu)建新聞鏈,以新聞鏈作為給用戶推薦新聞的候選集。實(shí)驗(yàn)結(jié)果表明,考慮了閱讀上下文信息的基于新聞鏈構(gòu)建的新聞推薦方法在推薦準(zhǔn)確度指標(biāo)上雖然不如融合的推薦方法,但該方法與同類基于內(nèi)容的推薦方法相比,各方面的評(píng)價(jià)指標(biāo)提高較大?傮w而言,超圖模型容易實(shí)現(xiàn)多異構(gòu)對(duì)象關(guān)系建模、聚類和排序,本文在新聞推薦研究中借助超圖模型進(jìn)行定義、學(xué)習(xí)和推薦,在推薦效果上取得了較好結(jié)果,在模型上也較簡(jiǎn)潔清晰、易于擴(kuò)展。
[Abstract]:......
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.3
本文編號(hào):2425923
[Abstract]:......
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 李磊;王丁丁;朱順痣;李濤;;Personalized News Recommendation:A Review and an Experimental Investigation[J];Journal of Computer Science & Technology;2011年05期
,本文編號(hào):2425923
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/2425923.html
最近更新
教材專著