文學(xué)作品的個(gè)性化推薦算法研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-04-29 18:01
文學(xué)作品隨著時(shí)間推移無論數(shù)量還是種類都日益豐厚,得到了讀者的喜愛。載有文學(xué)作品的網(wǎng)站不斷涌現(xiàn),相比傳統(tǒng)書店方便了人們的閱讀,比如說豆瓣圖書,比如說各種各樣的電商網(wǎng)站。為了解決文學(xué)作品數(shù)量以及品類不斷增多的問題,推薦算法應(yīng)運(yùn)而生。這些算法被各種各樣的網(wǎng)站引進(jìn)使用,根據(jù)讀者的特性以及書籍的特性進(jìn)行針對(duì)性推薦,這樣的效果遠(yuǎn)遠(yuǎn)好于以往的純粹搜索算法。但是,隨著人口的急劇增加以及讀者的要求越來越多樣化以及書籍種類數(shù)量急劇增長,以往的陳舊的推薦算法并不能實(shí)時(shí)的有效的精準(zhǔn)推薦,使得推薦效果不理想,讀者不能確切的得到自己真正想要的符合細(xì)微要求的文學(xué)作品,這就使得讀者體驗(yàn)不佳,有提升的需要。本文研究內(nèi)容:1.對(duì)讀者評(píng)論文本進(jìn)行了定性分析,傳統(tǒng)信息增益算法(IG,Information Gain)并沒有密切注意到特征項(xiàng)在類內(nèi)和類間的分布狀況,此文對(duì)此進(jìn)行了改進(jìn),然后將讀者的評(píng)論文本分析后化作等級(jí)評(píng)定分值,融入到原始純粹評(píng)分中,兩種分值分配權(quán)重后形成新的分值。提出基于類間集中度和類內(nèi)分散度權(quán)重信息增益算法(DWIG,Distribution Weighted Information Gain),能夠根據(jù)特征...
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于內(nèi)容的推薦算法
1.2.2 協(xié)同過濾推薦算法
1.2.3 關(guān)聯(lián)規(guī)則推薦算法
1.2.4 混合推薦算法
1.3 推薦算法面臨的挑戰(zhàn)
1.3.1 冷啟動(dòng)問題
1.3.2 數(shù)據(jù)稀疏性問題
1.3.3 實(shí)時(shí)性與準(zhǔn)確性問題
1.4 論文組織和結(jié)構(gòu)
第二章 推薦算法和文本處理算法
2.1 協(xié)同過濾推薦算法
2.1.1 基于內(nèi)存的協(xié)同過濾推薦算法
2.1.2 基于模型的協(xié)同過濾推薦算法
2.2 基于內(nèi)容的推薦算法
2.3 基于關(guān)聯(lián)規(guī)則的推薦算法
2.4 基于效用推薦
2.5 基于知識(shí)推薦
2.6 混合推薦算法
2.7 推薦算法評(píng)價(jià)指標(biāo)
2.7.1 準(zhǔn)確性
2.7.2 覆蓋率
2.8 常用的特征選擇算法
2.8.1 文檔頻率
2.8.2 X2統(tǒng)計(jì)量
2.8.3 互信息
2.8.4 信息增益
2.8.5 期望交叉熵
2.9 本章小結(jié)
第三章 信息增益算法與TF-IDF算法的改進(jìn)
3.1 信息增益算法的剖析與優(yōu)化
3.1.1 信息增益算法的原理
3.1.2 信息增益算法的分析與改進(jìn)
3.2 TF-IDF算法的分析與研究
3.2.1 TF-IDF算法的原理
3.2.2 TF-IDF算法的分析與改進(jìn)
3.3 讀者文本等級(jí)評(píng)分原理與實(shí)現(xiàn)
3.4 實(shí)驗(yàn)分析
3.4.1 特征選擇算法實(shí)驗(yàn)
3.4.2 特征權(quán)重實(shí)驗(yàn)
3.4.3 兩者結(jié)合對(duì)比實(shí)驗(yàn)
3.5 本章小結(jié)
第四章 基于社區(qū)劃分與讀者評(píng)分準(zhǔn)則的個(gè)性化推薦算法
4.1 基于社區(qū)劃分的個(gè)性化推薦算法
4.1.1 問題的提出
4.1.2 基于社區(qū)劃分的個(gè)性化推薦算法
4.2 基于讀者評(píng)分準(zhǔn)則與文本等級(jí)評(píng)分的推薦算法
4.2.1 問題描述及挑戰(zhàn)
4.2.2 算法實(shí)現(xiàn)
4.3 基于讀者社區(qū)劃分與準(zhǔn)則因子的推薦算法實(shí)驗(yàn)
4.4 本章小結(jié)
第五章 總結(jié)與展望
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于LDA的中文詞語相似度計(jì)算[J]. 呂亞偉,李芳,戴龍龍. 北京化工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(05)
[2]基于內(nèi)容的推薦與協(xié)同過濾融合的新聞推薦方法[J]. 楊武,唐瑞,盧玲. 計(jì)算機(jī)應(yīng)用. 2016(02)
[3]基于LDA的互聯(lián)網(wǎng)廣告點(diǎn)擊率預(yù)測(cè)研究[J]. 朱志北,李斌,劉學(xué)軍,胡平. 計(jì)算機(jī)應(yīng)用研究. 2016(04)
[4]大數(shù)據(jù)時(shí)代自媒體定制新聞推薦研究——以《今日頭條》APP為例[J]. 薛瑞環(huán). 商. 2015(29)
[5]社會(huì)化標(biāo)注環(huán)境下的標(biāo)簽共現(xiàn)譜聚類方法[J]. 李慧宗,胡學(xué)鋼,何偉,潘劍寒. 圖書情報(bào)工作. 2014(23)
[6]全民閱讀活動(dòng)的背景、特色與推動(dòng)[J]. 湯更生,朱鶯. 國家圖書館學(xué)刊. 2013(03)
[7]日本閱讀推廣體制研究[J]. 曹磊. 國家圖書館學(xué)刊. 2013(02)
[8]基于K-means聚類與張量分解的社會(huì)化標(biāo)簽推薦系統(tǒng)研究[J]. 孫玲芳,李爍朋. 江蘇科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(06)
[9]Tag-Aware Recommender Systems:A State-of-the-Art Survey[J]. 張子柯,周濤,張翼成. Journal of Computer Science & Technology. 2011(05)
[10]一種社會(huì)化標(biāo)注系統(tǒng)資源個(gè)性化推薦方法[J]. 郭偉光,李道芳,章蕾. 計(jì)算機(jī)工程與應(yīng)用. 2011(10)
碩士論文
[1]基于Spark平臺(tái)推薦系統(tǒng)研究[D]. 楊志偉.中國科學(xué)技術(shù)大學(xué) 2015
本文編號(hào):3167920
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于內(nèi)容的推薦算法
1.2.2 協(xié)同過濾推薦算法
1.2.3 關(guān)聯(lián)規(guī)則推薦算法
1.2.4 混合推薦算法
1.3 推薦算法面臨的挑戰(zhàn)
1.3.1 冷啟動(dòng)問題
1.3.2 數(shù)據(jù)稀疏性問題
1.3.3 實(shí)時(shí)性與準(zhǔn)確性問題
1.4 論文組織和結(jié)構(gòu)
第二章 推薦算法和文本處理算法
2.1 協(xié)同過濾推薦算法
2.1.1 基于內(nèi)存的協(xié)同過濾推薦算法
2.1.2 基于模型的協(xié)同過濾推薦算法
2.2 基于內(nèi)容的推薦算法
2.3 基于關(guān)聯(lián)規(guī)則的推薦算法
2.4 基于效用推薦
2.5 基于知識(shí)推薦
2.6 混合推薦算法
2.7 推薦算法評(píng)價(jià)指標(biāo)
2.7.1 準(zhǔn)確性
2.7.2 覆蓋率
2.8 常用的特征選擇算法
2.8.1 文檔頻率
2.8.2 X2統(tǒng)計(jì)量
2.8.3 互信息
2.8.4 信息增益
2.8.5 期望交叉熵
2.9 本章小結(jié)
第三章 信息增益算法與TF-IDF算法的改進(jìn)
3.1 信息增益算法的剖析與優(yōu)化
3.1.1 信息增益算法的原理
3.1.2 信息增益算法的分析與改進(jìn)
3.2 TF-IDF算法的分析與研究
3.2.1 TF-IDF算法的原理
3.2.2 TF-IDF算法的分析與改進(jìn)
3.3 讀者文本等級(jí)評(píng)分原理與實(shí)現(xiàn)
3.4 實(shí)驗(yàn)分析
3.4.1 特征選擇算法實(shí)驗(yàn)
3.4.2 特征權(quán)重實(shí)驗(yàn)
3.4.3 兩者結(jié)合對(duì)比實(shí)驗(yàn)
3.5 本章小結(jié)
第四章 基于社區(qū)劃分與讀者評(píng)分準(zhǔn)則的個(gè)性化推薦算法
4.1 基于社區(qū)劃分的個(gè)性化推薦算法
4.1.1 問題的提出
4.1.2 基于社區(qū)劃分的個(gè)性化推薦算法
4.2 基于讀者評(píng)分準(zhǔn)則與文本等級(jí)評(píng)分的推薦算法
4.2.1 問題描述及挑戰(zhàn)
4.2.2 算法實(shí)現(xiàn)
4.3 基于讀者社區(qū)劃分與準(zhǔn)則因子的推薦算法實(shí)驗(yàn)
4.4 本章小結(jié)
第五章 總結(jié)與展望
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于LDA的中文詞語相似度計(jì)算[J]. 呂亞偉,李芳,戴龍龍. 北京化工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(05)
[2]基于內(nèi)容的推薦與協(xié)同過濾融合的新聞推薦方法[J]. 楊武,唐瑞,盧玲. 計(jì)算機(jī)應(yīng)用. 2016(02)
[3]基于LDA的互聯(lián)網(wǎng)廣告點(diǎn)擊率預(yù)測(cè)研究[J]. 朱志北,李斌,劉學(xué)軍,胡平. 計(jì)算機(jī)應(yīng)用研究. 2016(04)
[4]大數(shù)據(jù)時(shí)代自媒體定制新聞推薦研究——以《今日頭條》APP為例[J]. 薛瑞環(huán). 商. 2015(29)
[5]社會(huì)化標(biāo)注環(huán)境下的標(biāo)簽共現(xiàn)譜聚類方法[J]. 李慧宗,胡學(xué)鋼,何偉,潘劍寒. 圖書情報(bào)工作. 2014(23)
[6]全民閱讀活動(dòng)的背景、特色與推動(dòng)[J]. 湯更生,朱鶯. 國家圖書館學(xué)刊. 2013(03)
[7]日本閱讀推廣體制研究[J]. 曹磊. 國家圖書館學(xué)刊. 2013(02)
[8]基于K-means聚類與張量分解的社會(huì)化標(biāo)簽推薦系統(tǒng)研究[J]. 孫玲芳,李爍朋. 江蘇科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(06)
[9]Tag-Aware Recommender Systems:A State-of-the-Art Survey[J]. 張子柯,周濤,張翼成. Journal of Computer Science & Technology. 2011(05)
[10]一種社會(huì)化標(biāo)注系統(tǒng)資源個(gè)性化推薦方法[J]. 郭偉光,李道芳,章蕾. 計(jì)算機(jī)工程與應(yīng)用. 2011(10)
碩士論文
[1]基于Spark平臺(tái)推薦系統(tǒng)研究[D]. 楊志偉.中國科學(xué)技術(shù)大學(xué) 2015
本文編號(hào):3167920
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3167920.html
最近更新
教材專著