基于Web瀏覽行為的用戶興趣模型研究
發(fā)布時(shí)間:2017-10-02 07:00
本文關(guān)鍵詞:基于Web瀏覽行為的用戶興趣模型研究
更多相關(guān)文章: 興趣模型 興趣度 興趣漂移 新聞推薦系統(tǒng)
【摘要】:近年來,隨著因特網(wǎng)的迅猛發(fā)展,web信息呈幾何級數(shù)增長,人們需要花費(fèi)大量時(shí)間才能找到自己需要的信息,個(gè)性化推薦作為信息過濾的重要手段,是解決當(dāng)前信息過載問題的一種很有效的方法。而用戶興趣模型是個(gè)性化推薦系統(tǒng)的核心,一個(gè)良好的興趣模型能夠更好的改善用戶的上網(wǎng)體驗(yàn)和信息利用效率,因此興趣模型的研究成為了學(xué)術(shù)界和IT界的熱門課題。論文以文本信息處理技術(shù)為基點(diǎn),以建立有效的興趣模型為目標(biāo)。主要圍繞著用戶興趣度度量和興趣模型的表示更新兩方面展開研究工作,并建立有實(shí)際應(yīng)用意義的新聞推薦系統(tǒng)。論文的主要內(nèi)容如下:(1)針對現(xiàn)有用戶興趣模型在模型建立階段用戶興趣評價(jià)的不足,提出了一種基于混合行為評價(jià)興趣度值的方法,突出了用戶閱讀時(shí)間的特殊性,在用戶閱讀時(shí)間異常的情況下利用其它瀏覽行為來量化用戶興趣度,并將此得到的興趣度應(yīng)用到傳統(tǒng)VSM模型中,使拓展后的興趣模型同時(shí)攜帶了內(nèi)容和行為信息。(2)針對用戶興趣模型建立后,隨之而來的系統(tǒng)存儲量、計(jì)算量劇增問題,提出了時(shí)間分段機(jī)制對興趣模型進(jìn)行優(yōu)化,達(dá)到了降低興趣模型計(jì)算量和存儲量的目的。另外,由于人的興趣隨著時(shí)間不斷進(jìn)行變化,在時(shí)間分段機(jī)制的基礎(chǔ)上,提出了用戶興趣漂移機(jī)制,用以反映人的興趣變化規(guī)律,使得到的興趣模型更加準(zhǔn)確。(3)基于興趣模型理論基礎(chǔ)構(gòu)建了新聞推薦系統(tǒng),采集了2000篇新聞網(wǎng)頁作為數(shù)據(jù)集,系統(tǒng)持續(xù)采集用戶瀏覽行為,分析用戶興趣,建立并更新用戶興趣模型,最終根據(jù)興趣模型向用戶提供網(wǎng)頁推薦。經(jīng)過實(shí)驗(yàn)和觀察,驗(yàn)證了本文提出的基于混合行為興趣度的用戶興趣模型的合理性和有效性。
【關(guān)鍵詞】:興趣模型 興趣度 興趣漂移 新聞推薦系統(tǒng)
【學(xué)位授予單位】:西南科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP393.092
【目錄】:
- 摘要4-5
- Abstract5-10
- 1 緒論10-15
- 1.1 課題的研究背景10-11
- 1.2 研究現(xiàn)狀11-13
- 1.2.1 個(gè)性化推薦服務(wù)的研究現(xiàn)狀11-12
- 1.2.2 用戶興趣模型的研究現(xiàn)狀12-13
- 1.3 課題來源13
- 1.4 論文的研究內(nèi)容和組織結(jié)構(gòu)13-15
- 2 文本信息處理技術(shù)15-27
- 2.1 文本信息處理概述15
- 2.2 中文分詞技術(shù)15-17
- 2.2.1 中文分詞算法思想16
- 2.2.2 中文分詞算法應(yīng)用16
- 2.2.3 詞性標(biāo)注16-17
- 2.3 文本內(nèi)容表征17-22
- 2.3.1 VSM模型基本思想18
- 2.3.2 文本特征選擇算法18-19
- 2.3.3 改進(jìn)的TF-IDF算法19-21
- 2.3.4 VSM模型的應(yīng)用21-22
- 2.4 文本相似度度量算法22-23
- 2.5 文本聚類算法23-25
- 2.5.1 K-Means聚類算法24
- 2.5.2 凝聚聚類算法24-25
- 2.6 本章小結(jié)25-27
- 3 基于用戶瀏覽行為的用戶興趣度度量方法27-37
- 3.1 用戶興趣獲取方式27-28
- 3.2 用戶瀏覽行為分析28-29
- 3.3 基于用戶混合行為的興趣度度量方法29-35
- 3.3.1 用戶混合行為組合29-30
- 3.3.2 基于重要行為的興趣度計(jì)算30-31
- 3.3.3 基于用戶閱讀時(shí)間的興趣度計(jì)算31-33
- 3.3.4 基于其他行為的興趣度計(jì)算33-35
- 3.4 本章小結(jié)35-37
- 4 用戶興趣模型研究37-46
- 4.1 用戶興趣模型建立37-41
- 4.1.1 用戶興趣模型表示37-38
- 4.1.2 用戶興趣模型相關(guān)運(yùn)算38-41
- 4.1.3 用戶興趣模型初始化41
- 4.2 用戶興趣模型更新41-44
- 4.2.1 時(shí)間分段機(jī)制42
- 4.2.2 用戶興趣漂移機(jī)制42-44
- 4.3 用戶興趣模型應(yīng)用44-45
- 4.4 本章小結(jié)45-46
- 5 基于用戶興趣模型的個(gè)性化推薦系統(tǒng)46-68
- 5.1 個(gè)性化推薦系統(tǒng)概述46
- 5.2 系統(tǒng)實(shí)現(xiàn)46-56
- 5.2.1 系統(tǒng)環(huán)境46-47
- 5.2.2 系統(tǒng)實(shí)現(xiàn)技術(shù)47-50
- 5.2.3 數(shù)據(jù)采集部分50-51
- 5.2.4 數(shù)據(jù)庫建模51-53
- 5.2.5 部分前端頁面展示53-56
- 5.3 系統(tǒng)結(jié)構(gòu)56-58
- 5.3.1 文本表征模塊57
- 5.3.2 興趣分析模塊57-58
- 5.3.3 內(nèi)容推薦模塊58
- 5.3.4 外部接.模塊58
- 5.4 用戶興趣模型算法驗(yàn)證58-67
- 5.4.1 用戶興趣度度量方法驗(yàn)證58-60
- 5.4.2 改進(jìn)的TF-IDF算法驗(yàn)證60-61
- 5.4.3 用戶興趣矩陣聚合運(yùn)算算法驗(yàn)證61-64
- 5.4.4 用戶興趣模型漂移機(jī)制驗(yàn)證64-67
- 5.5 本章小結(jié)67-68
- 結(jié)論68-70
- 致謝70-71
- 參考文獻(xiàn)71-76
- 攻讀學(xué)位期間發(fā)表的相關(guān)學(xué)術(shù)論文及研究成果76
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前3條
1 陳一峰;趙恒凱;余小清;萬旺根;;基于本體的用戶興趣模型構(gòu)建研究[J];計(jì)算機(jī)工程;2010年21期
2 曹永春;蔡正琦;邵亞斌;;基于K-means的改進(jìn)人工蜂群聚類算法[J];計(jì)算機(jī)應(yīng)用;2014年01期
3 史寶明;賀元香;張永;;個(gè)性化信息檢索中用戶興趣建模與更新研究[J];計(jì)算機(jī)應(yīng)用與軟件;2014年03期
,本文編號:958158
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/958158.html
最近更新
教材專著