區(qū)分用戶長短期興趣的個性化動態(tài)推薦模型
本文關鍵詞:區(qū)分用戶長短期興趣的個性化動態(tài)推薦模型,,由筆耕文化傳播整理發(fā)布。
【摘要】:面對互聯(lián)網所引發(fā)的信息爆炸,個性化推薦相比于搜索引擎能夠更好幫助用戶發(fā)現(xiàn)興趣,而用戶興趣建模作為個性化推薦的基礎逐漸成為研究熱點。同時,心理學家已經證明用戶的興趣往往會受環(huán)境的影響而變化。至此,用戶興趣的動態(tài)變化過程成為一個研究重點,而以往考慮時間因素的興趣模型主要圍繞時間窗與遺忘規(guī)律,且通常將用戶興趣當作一個整體進行處理,對長期與短期興趣的區(qū)分性不強。因此,本文主要研究用戶長短期興趣建模、短期興趣的模式識別以及基于長短期興趣的推薦,具體內容如下:(1)一般認為,用戶的長期興趣是用戶比較關注的、穩(wěn)定的、不易改變的;用戶的短期興趣是用戶不經常關注的、不穩(wěn)定的、易改變的。為了能夠構建一個自主區(qū)分用戶長短期興趣的興趣模型,本文首先通過對天貓網上用戶查詢記錄的收集與商品分類信息的爬蟲、統(tǒng)計,獲得用戶的查詢記錄(用戶ID、查詢詞、時間戳、訪問鏈接)以及商品類別數據;然后對用戶的查詢詞與商品類別數據進行分詞并轉換成TF-IDF值,計算兩者的相似度,建立查詢詞與商品類別在最大相似度下的映射關系;再根據商品類別映射關系下查詢詞數量與該用戶所有查詢詞數量的比值設定閾值,以此區(qū)分用戶在商品類別下的長期興趣與待定興趣;最后對待定興趣下查詢詞數量進行判斷得到短期興趣,按照加速度理論提出興趣加速度的概念,用以表征用戶短期興趣的變化過程,生成興趣加速度的圖像。(2)為了能夠實現(xiàn)用戶短期興趣模式的自動識別,本文首先根據興趣加速度圖像的變化規(guī)律,給出短期興趣的六種不同模式(每一種模式都反映一種用戶短期興趣):正常模式、逐漸上升模式、逐漸下降模式、跳躍上升模式、跳躍下降模式、周期模式;然后根據興趣加速度的最大向量維度進行線性擬合,自動補值,設計函數生成六種不同模式的訓練數據;最后設計三層節(jié)點的BP神經網絡以實現(xiàn)自動識別用戶短期興趣的模式。(3)為了實現(xiàn)區(qū)分用戶長短期興趣的商品推薦,本文暫將用戶查詢后訪問的鏈接當作具體商品,構建一個用戶-訪問鏈接的矩陣表。若用戶長期興趣下的訪問鏈接在此表中有出現(xiàn),在對應位置標記為1,反之為0;對相同模式下的用戶短期興趣進行同樣操作;然后基于用戶協(xié)同過濾算法為用戶分別實現(xiàn)區(qū)分長期與短期興趣的鏈接推薦;再進行關鍵字符串匹配,得到具體商品鏈接,利用Web頁面分析算法爬取,最終將具體商品推薦給用戶。本文選用數據堂提供的天貓網用戶的查詢行為數據集,構建的模型能夠較好區(qū)分用戶長短期興趣,得到較好推薦結果,在電商網站中具有一定應用價值。
【關鍵詞】:個性化 動態(tài)化 長期興趣 短期興趣 興趣加速度 模式識別 協(xié)同過濾
【學位授予單位】:安徽工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.3
【目錄】:
- 摘要4-5
- Abstract5-9
- 1 緒論9-15
- 1.1 研究背景9
- 1.2 研究目的及意義9-10
- 1.2.1 研究目的9-10
- 1.2.2 研究意義10
- 1.3 國內外研究現(xiàn)狀10-12
- 1.3.1 國外研究現(xiàn)狀10-12
- 1.3.2 國內研究現(xiàn)狀12
- 1.4 問題提出12-13
- 1.5 研究內容及論文框架13-14
- 1.5.1 研究內容13
- 1.5.2 論文框架13-14
- 1.6 本章小結14-15
- 2 相關理論與技術15-22
- 2.1 用戶興趣建模過程15-17
- 2.1.1 數據收集15-16
- 2.1.2 用戶興趣模型的表示16-17
- 2.2 用戶興趣建模方法17-18
- 2.3 正向最大匹配分詞算法18
- 2.4 TF-IDF算法18-19
- 2.5 相似性公式19
- 2.6 最小二乘法19
- 2.7 BP神經網絡算法19-20
- 2.8 基于用戶協(xié)同過濾算法20-21
- 2.9 本章小結21-22
- 3 區(qū)分用戶長短期興趣的自動化建模方法22-36
- 3.1 數據收集22-24
- 3.1.1 基于隱性收集方式的查詢記錄收集22-23
- 3.1.2 基于爬蟲的商品分類數據收集23-24
- 3.2 基于正向最大匹配算法的查詢詞與商品類別分詞24-26
- 3.2.1 Python的jieba分詞24
- 3.2.2 查詢詞與商品分類數據的分詞24-25
- 3.2.3 基于TF-IDF算法的查詢詞與商品類別的表征25-26
- 3.4 基于向量空間模型的長短期興趣模型化表示26-29
- 3.4.1 相似性計算26
- 3.4.2 長期興趣的模型化表示26-27
- 3.4.3 短期興趣模型化表示27-29
- 3.5 實驗結果與分析29-35
- 3.5.1 實驗軟硬件環(huán)境29
- 3.5.2 實驗數據集29
- 3.5.3 實驗結果29-34
- 3.5.4 結果分析34-35
- 3.6 本章小結35-36
- 4 基于BP神經網絡的短期興趣模式識別36-45
- 4.1 短期興趣的基本模式36-37
- 4.2 基于最小二乘法的興趣加速度線性擬合37-39
- 4.3 短期興趣模式下產生訓練數據函數的設計39
- 4.4 BP網絡結構的確定39-40
- 4.5 實驗結果與分析40-44
- 4.5.1 實驗軟硬件環(huán)境40
- 4.5.2 實驗數據集40-41
- 4.5.3 實驗結果41-44
- 4.5.4 結果分析44
- 4.6 本章小結44-45
- 5 區(qū)分用戶長短期興趣的商品推薦45-53
- 5.1 基于用戶協(xié)同過濾算法的長短期興趣的鏈接推薦45-46
- 5.2 具體商品的推薦46-48
- 5.3 實驗結果與分析48-52
- 5.3.1 實驗軟硬件環(huán)境48
- 5.3.2 實驗數據集48
- 5.3.3 實驗結果48-51
- 5.3.4 結果分析51-52
- 5.5 本章小結52-53
- 6 總結與展望53-55
- 6.1 總結53-54
- 6.2 創(chuàng)新性54
- 6.3 展望54-55
- 參考文獻55-59
- 圖目錄59-60
- 表目錄60
【相似文獻】
中國期刊全文數據庫 前10條
1 楊風召;;一種基于特征表的協(xié)同過濾算法[J];計算機工程與應用;2007年06期
2 王嵐;翟正軍;;基于時間加權的協(xié)同過濾算法[J];計算機應用;2007年09期
3 曾子明;張李義;;基于多屬性決策和協(xié)同過濾的智能導購系統(tǒng)[J];武漢大學學報(工學版);2008年02期
4 張富國;;用戶多興趣下基于信任的協(xié)同過濾算法研究[J];小型微型計算機系統(tǒng);2008年08期
5 侯翠琴;焦李成;張文革;;一種壓縮稀疏用戶評分矩陣的協(xié)同過濾算法[J];西安電子科技大學學報;2009年04期
6 廖新考;;基于用戶特征和項目屬性的混合協(xié)同過濾推薦[J];福建電腦;2010年07期
7 沈磊;周一民;李舟軍;;基于心理學模型的協(xié)同過濾推薦方法[J];計算機工程;2010年20期
8 徐紅;彭黎;郭艾寅;徐云劍;;基于用戶多興趣的協(xié)同過濾策略改進研究[J];計算機技術與發(fā)展;2011年04期
9 焦晨斌;王世卿;;基于模型填充的混合協(xié)同過濾算法[J];微計算機信息;2011年11期
10 鄭婕;鮑海琴;;基于協(xié)同過濾推薦技術的個性化網絡教學平臺研究[J];科技風;2012年06期
中國重要會議論文全文數據庫 前10條
1 沈杰峰;杜亞軍;唐俊;;一種基于項目分類的協(xié)同過濾算法[A];第二十二屆中國數據庫學術會議論文集(技術報告篇)[C];2005年
2 周軍鋒;湯顯;郭景峰;;一種優(yōu)化的協(xié)同過濾推薦算法[A];第二十一屆中國數據庫學術會議論文集(研究報告篇)[C];2004年
3 董全德;;基于雙信息源的協(xié)同過濾算法研究[A];全國第20屆計算機技術與應用學術會議(CACIS·2009)暨全國第1屆安全關鍵技術與應用學術會議論文集(上冊)[C];2009年
4 張光衛(wèi);康建初;李鶴松;劉常昱;李德毅;;面向場景的協(xié)同過濾推薦算法[A];中國系統(tǒng)仿真學會第五次全國會員代表大會暨2006年全國學術年會論文集[C];2006年
5 李建國;姚良超;湯庸;郭歡;;基于認知度的協(xié)同過濾推薦算法[A];第26屆中國數據庫學術會議論文集(B輯)[C];2009年
6 王明文;陶紅亮;熊小勇;;雙向聚類迭代的協(xié)同過濾推薦算法[A];第三屆全國信息檢索與內容安全學術會議論文集[C];2007年
7 胡必云;李舟軍;王君;;基于心理測量學的協(xié)同過濾相似度方法(英文)[A];NDBC2010第27屆中國數據庫學術會議論文集(B輯)[C];2010年
8 林麗冰;師瑞峰;周一民;李月雷;;基于雙聚類的協(xié)同過濾推薦算法[A];2008'中國信息技術與應用學術論壇論文集(一)[C];2008年
9 羅喜軍;王韜丞;杜小勇;劉紅巖;何軍;;基于類別的推薦——一種解決協(xié)同推薦中冷啟動問題的方法[A];第二十四屆中國數據庫學術會議論文集(研究報告篇)[C];2007年
10 黃創(chuàng)光;印鑒;汪靜;劉玉葆;王甲海;;不確定近鄰的協(xié)同過濾推薦算法[A];NDBC2010第27屆中國數據庫學術會議論文集A輯一[C];2010年
中國博士學位論文全文數據庫 前10條
1 紀科;融合上下文信息的混合協(xié)同過濾推薦算法研究[D];北京交通大學;2016年
2 程殿虎;基于協(xié)同過濾的社會網絡推薦系統(tǒng)關鍵技術研究[D];中國海洋大學;2015年
3 于程遠;基于QoS的Web服務推薦技術研究[D];上海交通大學;2015年
4 李聰;電子商務推薦系統(tǒng)中協(xié)同過濾瓶頸問題研究[D];合肥工業(yè)大學;2009年
5 郭艷紅;推薦系統(tǒng)的協(xié)同過濾算法與應用研究[D];大連理工大學;2008年
6 羅恒;基于協(xié)同過濾視角的受限玻爾茲曼機研究[D];上海交通大學;2011年
7 薛福亮;電子商務協(xié)同過濾推薦質量影響因素及其改進機制研究[D];天津大學;2012年
8 高e
本文編號:489084
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/489084.html