基于在線快速學(xué)習(xí)隱語義模型的個性化新聞推薦
本文關(guān)鍵詞:基于在線快速學(xué)習(xí)隱語義模型的個性化新聞推薦,,由筆耕文化傳播整理發(fā)布。
【摘要】:互聯(lián)網(wǎng)中的個性化新聞,個性化在線廣告、網(wǎng)絡(luò)搜索等應(yīng)用擁有龐大、動態(tài)項(xiàng)目池,由此產(chǎn)生的推薦問題在Web應(yīng)用程序中無處不在,特別是在個性化新聞推薦領(lǐng)域,由于新聞獨(dú)有的實(shí)時動態(tài)特性,需要研究針對動態(tài)新聞的推薦系統(tǒng),F(xiàn)有的推薦盡管能獲得豐富的項(xiàng)目元數(shù)據(jù),包括項(xiàng)目主體內(nèi)容,分類目錄,摘要等內(nèi)容,但項(xiàng)目粒度過于不均勻,通常需要在模型中確定項(xiàng)目具體的因子(權(quán)重)。由于估計項(xiàng)目因子屬于密集型計算,所以實(shí)時推薦面臨的重要挑戰(zhàn)是如何快速在線為新項(xiàng)目(例如新聞、事件更新、推特)學(xué)習(xí)因子。我們提出了一個快速學(xué)習(xí)隱語義模型,通過在線回歸方法快速學(xué)習(xí)項(xiàng)目的具體因子?梢元(dú)立運(yùn)行針對每個項(xiàng)目的在線回歸,處理過程快速,可擴(kuò)展且容易并行開展。但這些獨(dú)立回歸的收斂會由于維度高而進(jìn)展緩慢。因此,我們使用大量的歷史數(shù)據(jù)提取用戶項(xiàng)目特征進(jìn)行線下學(xué)習(xí)并作為模型的初始化過程以及學(xué)習(xí)用戶與項(xiàng)目的基礎(chǔ)因子模型,然后降維并存檔。在線時段,提取高峰時段行為數(shù)據(jù)最優(yōu)化低維修正向量。借助基于優(yōu)化預(yù)測可能性的在線模型,估算線性預(yù)測目標(biāo)的評分。這樣既降低了模型學(xué)習(xí)的維度,又保證了隱含因子學(xué)習(xí)的準(zhǔn)確性,取得實(shí)時良好的推薦效果。并基于此方法給出了個性化新聞推薦的系統(tǒng)實(shí)現(xiàn)過程。大量的實(shí)驗(yàn)表明我們的方法顯著、一致優(yōu)于其它競爭方法(基于特征、離線、在線協(xié)同過濾,概率潛語義索引等)并且獲得了相對提升:在預(yù)測的對數(shù)似然性方面有10%~15%的提升;度量專有My Yahoo!數(shù)據(jù)集上相關(guān)性評分有200%~300%的提升;對比Movie Lens數(shù)據(jù)集上使用基于時間的訓(xùn)練數(shù)據(jù)劃分方法有了9%的均方根誤差的降低。本文主要工作包括:1、構(gòu)建線下模型:對海量新聞和用戶實(shí)現(xiàn)快速準(zhǔn)確的關(guān)鍵特征提取,滿足基于特征初始化的推薦要求,為實(shí)時推薦作準(zhǔn)備。2、構(gòu)建線上模型:基于用戶即時行為記錄,快速學(xué)習(xí)線上修正參數(shù)使線上模型快速收斂,為每個用戶構(gòu)建完整的個性化的偏好模型。3、設(shè)計并實(shí)現(xiàn)推薦系統(tǒng)并確保性能滿足要求,實(shí)現(xiàn)實(shí)時為不同的用戶推薦個性化新聞推薦的方案,使每個用戶便捷獲得自己感興趣的新聞資訊,方便快捷地發(fā)現(xiàn)高質(zhì)量且感興趣的新新聞。
【關(guān)鍵詞】:降秩回歸 推薦系統(tǒng) 隱含因子 矩陣分解 二元數(shù)據(jù)
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.3
【目錄】:
- 摘要4-5
- Abstract5-9
- 第一章 緒論9-12
- 1.1 研究背景及意義9-10
- 1.2 相關(guān)工作10-11
- 1.3 論文組織結(jié)構(gòu)11-12
- 第二章 個性化推薦技術(shù)相關(guān)工作12-20
- 2.1 個性化推薦系統(tǒng)概述12-13
- 2.2 個性化推薦方法13-16
- 2.2.1 協(xié)同過濾推薦13-15
- 2.2.2 基于內(nèi)容的推薦15
- 2.2.3 混合推薦系統(tǒng)15-16
- 2.3 個性化推薦在新聞領(lǐng)域的應(yīng)用16-18
- 2.3.1 面向新聞的個性化推薦16-17
- 2.3.2 個性化新聞推薦現(xiàn)狀17-18
- 2.3.3 個性化新聞推薦面臨的挑戰(zhàn)18
- 2.4 本章小結(jié)18-20
- 第三章 基于隱語義模型的個性化新聞推薦技術(shù)研究20-34
- 3.1 隱語義模型20-25
- 3.1.1 概述20-22
- 3.1.2 基本算法與弊端22-25
- 3.2 基于在線快速學(xué)習(xí)的隱語義模型25-28
- 3.2.1 建模思路25-26
- 3.2.2 模型總體設(shè)計26-28
- 3.3 模型詳解28-31
- 3.3.1 在線回歸及基于特征的偏移28-29
- 3.3.2 降秩回歸29-30
- 3.3.3 同步學(xué)習(xí)用戶和項(xiàng)目因子30-31
- 3.4 模型擬合31-33
- 3.4.1 線下模型擬合31-32
- 3.4.2 快速在線回歸32-33
- 3.4.3 在線模型選擇33
- 3.5 本章小結(jié)33-34
- 第四章 在線快速學(xué)習(xí)隱語義模型的新聞推薦系統(tǒng)實(shí)現(xiàn)34-44
- 4.1 推薦系統(tǒng)外圍框架34
- 4.2 推薦系統(tǒng)模型構(gòu)建34-36
- 4.2.1 用戶偏好模型35
- 4.2.2 新聞隱類模型35-36
- 4.2.3 隱類偏好模型計算36
- 4.3 推薦系統(tǒng)處理流程36-42
- 4.3.1 樣本采集模塊36-37
- 4.3.2 模型訓(xùn)練模塊37-41
- 4.3.3 推薦計算模塊41
- 4.3.4 新聞推薦列表生成更新41-42
- 4.4 新聞推薦生成42
- 4.4.1 匹配度計算42
- 4.4.2 時效權(quán)值排序42
- 4.5 本章小結(jié)42-44
- 第五章 新聞推薦系統(tǒng)實(shí)驗(yàn)評估44-51
- 5.1 My Yahoo!數(shù)據(jù)集44-47
- 5.1.1 數(shù)據(jù)44
- 5.1.2 模型44-45
- 5.1.3 性能指標(biāo)45-46
- 5.1.4 實(shí)驗(yàn)結(jié)果46-47
- 5.1.5 在線模型選擇的有效性47
- 5.2 MoiveLens數(shù)據(jù)集47-50
- 5.2.1 數(shù)據(jù)48
- 5.2.2 模型48
- 5.2.3 數(shù)據(jù)集分割48-49
- 5.2.4 實(shí)驗(yàn)結(jié)果49-50
- 5.3 本章小結(jié)50-51
- 第六章 總結(jié)與展望51-53
- 參考文獻(xiàn)53-56
- 附錄1 攻讀碩士學(xué)位期間申請的專利56-57
- 致謝57
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張大鵬,周軍鋒,陳寶峰;一種結(jié)合外部環(huán)境狀態(tài)的主體語義模型[J];燕山大學(xué)學(xué)報;2005年04期
2 王煜;周立柱;邢春曉;;視頻語義模型及評價準(zhǔn)則[J];計算機(jī)學(xué)報;2007年03期
3 趙正利;王國宇;籍芳;;一種基于相關(guān)反饋的圖像內(nèi)在語義模型[J];微計算機(jī)信息;2007年24期
4 黃睿航;張園園;黃思沛;;基于語義模型的網(wǎng)絡(luò)社群學(xué)習(xí)指導(dǎo)策略初探[J];無線互聯(lián)科技;2013年06期
5 曹化工,秦友淑;工程信息結(jié)構(gòu)的語義模型[J];計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報;1996年01期
6 呂琳,孟祥旭,徐延寧;復(fù)雜產(chǎn)品的層次語義模型研究[J];中國機(jī)械工程;2004年15期
7 李曉建,陳磊,陳世鴻;教育資源語義模型研究[J];武漢大學(xué)學(xué)報(理學(xué)版);2005年03期
8 楊俊柯;楊貫中;楊建學(xué);;基于語義模型的信息檢索機(jī)制研究[J];計算機(jī)工程;2006年12期
9 董小峰;張樹生;趙寒;周競濤;馮峗;田占強(qiáng);;基于語義模型的企業(yè)數(shù)據(jù)檢索[J];制造技術(shù)與機(jī)床;2006年09期
10 王克飛;張樹生;周競濤;趙寒;;語義模型驅(qū)動的數(shù)據(jù)屬性匹配技術(shù)研究[J];計算機(jī)應(yīng)用研究;2006年10期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 宋春陽;;從字到字組的語義解釋模型[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
2 張輝;宋曉;張霖;;面向數(shù)字化設(shè)計的產(chǎn)品共享信息語義模型研究[A];全國先進(jìn)制造技術(shù)高層論壇暨第八屆制造業(yè)自動化與信息化技術(shù)研討會論文集[C];2009年
3 王煜;周立柱;邢春曉;;SemTTe:針對具有結(jié)構(gòu)化時態(tài)與類型化事件的視頻的語義模型[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2005年
4 魏勇;歐陽峰;陳剛;;基于語義的虛擬場景編輯系統(tǒng)設(shè)計[A];Proceedings of 14th Chinese Conference on System Simulation Technology & Application(CCSSTA’2012)[C];2012年
5 王煜;周立柱;邢春曉;;視頻語義模型SemTTE及其查詢語言VSQL[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2006年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 李學(xué)寧;現(xiàn)代漢語形容詞概念語義模型研究[D];上海交通大學(xué);2008年
2 石躍祥;計算機(jī)視覺圖像語義模型的描述方法研究[D];中南大學(xué);2005年
3 馬暉男;信息檢索中淺層語義模型的研究[D];大連理工大學(xué);2007年
4 余衛(wèi)宇;幾種圖像結(jié)構(gòu)語義模型和圖像[D];華南理工大學(xué);2005年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 胡海彪;魚類目標(biāo)三維空間行為語義模型研究[D];浙江工業(yè)大學(xué);2015年
2 周磊;基于在線快速學(xué)習(xí)隱語義模型的個性化新聞推薦[D];南京郵電大學(xué);2015年
3 杜百玲;服務(wù)組裝的可信語義模型的研究[D];哈爾濱工程大學(xué);2009年
4 孫聰凱;語義模型、近似推理算法及其在網(wǎng)頁分類的應(yīng)用[D];上海交通大學(xué);2009年
5 張巧霞;基于產(chǎn)品符號語義模型的設(shè)計定制信息處理方法及應(yīng)用研究[D];河北工業(yè)大學(xué);2011年
6 魯權(quán);基于協(xié)同過濾模型與隱語義模型的推薦系統(tǒng)研究與實(shí)現(xiàn)[D];湖南大學(xué);2013年
7 王克飛;面向企業(yè)異構(gòu)數(shù)據(jù)源集成的語義模型及進(jìn)化技術(shù)研究[D];西北工業(yè)大學(xué);2006年
8 肖雅夫;基于語義模型的高校輿情監(jiān)測技術(shù)的研究[D];湖北工業(yè)大學(xué);2014年
9 馮彩寧;Haskell語言類型推理的語義模型研究[D];寧夏大學(xué);2013年
10 楊佳;專家信息語義模型異構(gòu)數(shù)據(jù)轉(zhuǎn)換技術(shù)研究[D];中南大學(xué);2010年
本文關(guān)鍵詞:基于在線快速學(xué)習(xí)隱語義模型的個性化新聞推薦,由筆耕文化傳播整理發(fā)布。
本文編號:468105
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/468105.html