基于隱性反饋和時序信息的矩陣分解推薦算法研究
發(fā)布時間:2021-06-10 18:51
隨著互聯(lián)網(wǎng)的發(fā)展,電子商務(wù)網(wǎng)站為用戶提供便捷服務(wù)的同時,也帶來了數(shù)據(jù)海量、種類繁多、同質(zhì)化等問題,阻礙用戶找到自己需要的商品,這種現(xiàn)象被稱為信息過載。推薦系統(tǒng)應(yīng)運而生,它通過分析歷史數(shù)據(jù)獲取用戶尚未購買但是感興趣的商品,實現(xiàn)“主動”推薦。用戶的歷史數(shù)據(jù)可以分為兩類:顯性反饋和隱性反饋。顯性反饋是一類能夠直觀體現(xiàn)用戶興趣程度的各個指標,例如評分;隱性反饋是隱藏在用戶行為背后的規(guī)律性信息,例如用戶的支付記錄、用戶的觀看記錄、商品的流行度等,雖然不能直觀地體現(xiàn)用戶的喜好,但是可以反映用戶的關(guān)注點,尤其以用戶行為產(chǎn)生的時序信息在時間軸上的變化更能反映用戶關(guān)注點的波動。傳統(tǒng)的推薦系統(tǒng)技術(shù)主要通過分析顯性反饋生成符合用戶需求的商品,但由于顯性反饋的稀疏性和不易獲取性,不能全面地展現(xiàn)用戶的興趣喜好,而隱性反饋由于數(shù)據(jù)量豐富逐步成為研究的熱點。但基于隱性反饋的推薦系統(tǒng)仍面臨三個方面的問題:第一,負樣本的匱乏使得隱性反饋難以利用;第二,由于用戶興趣波動,導(dǎo)致隱性反饋具有時間上的動態(tài)性,靜態(tài)分析隱性反饋不利于發(fā)掘數(shù)據(jù)的變化規(guī)律,影響推薦的準確度;第三,隱性反饋數(shù)據(jù)稠密,應(yīng)用于顯性反饋的優(yōu)化方法并不適用于隱...
【文章來源】:山東師范大學(xué)山東省
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【部分圖文】:
文章結(jié)構(gòu)圖
山東師范大學(xué)碩士學(xué)位論文11行度和時間之間具有強相關(guān)關(guān)系。其中,X軸表示時間的跨度,Y軸表示商品的平均流行度。商品的平均流行度在前900天隨時間的增加而快速升高,并且在第一千天達到峰值。這種現(xiàn)象表明,商品在前一千天處于熱門階段,并且受關(guān)注程度的增長速率較快,產(chǎn)生這種現(xiàn)象的原因是多樣的。例如,隨著受眾的增加,商品的熱度隨即呈指數(shù)增長。但是,在一千天之后,商品的平均流行度大幅降低,并且隨時間的增加而緩慢的遞減。這種現(xiàn)象表明,商品的熱度開始消退,逐步淡出用戶的視野。整體而言,商品的平均流行度在商品的發(fā)行早期呈熱門狀態(tài),而在今后較長的時間段內(nèi)處于冷門階段,且熱度持續(xù)降低。圖3-1平均流行度隨時間的變化規(guī)律3.1.2單個商品的流行度隨時間的變化規(guī)律下一步,本文分析單個商品的流行度隨時間的變化規(guī)律。在本章實驗中隨機的選取商品作為分析對象。如圖3-2所示,其中X軸表示時間跨度,Y軸表示單個商品的流行度。流行度分布以第一千天作為分界點。第一階段為前一千天,第二階段為第一千天之后。在第一階段中,商品的流行度在前五百天緩慢增長;但是在五百天之后,商品的流行度開始大幅度增加,增長速率大,并且在第一千天時,流行度達到峰值。引起這種現(xiàn)象的原因是多樣的,例如,由于受眾的增加導(dǎo)致交互用戶變多,進而反作用于流行度,促進流行度的增加,最終形成一個循環(huán)。由此可見,商品在前一千天處于熱門階段。然而,商品的流行度達到峰值之后,在短暫的時間內(nèi)大幅度下降。在一千天之后,剩余的時間跨度被分為兩個時間片段。第一個時間片段的跨度大約為1700天,范圍為第1000天到第2700天;第二個時間片段的跨度大約為3300天,范圍為第2700天到第6000天。在第一個時間片段內(nèi),
山東師范大學(xué)碩士學(xué)位論文12商品的流行度波動頻繁,但始終保持在數(shù)值500以下,并在第一時間片段和第二時間片段的交界處發(fā)生陡降;在第二個時間片段,商品的流行度在第2700天至第3000天之間雖然存在一個輕微的增長,但是在第3000天之后,流行度緩慢下降。盡管在兩個時間片段內(nèi)流行度呈波動狀態(tài),但是總體而言,在由第一時間片段和第二時間片段構(gòu)成的第二階段內(nèi),商品的流行度呈下降趨勢。圖3-2單個商品的流行度隨時間的變化規(guī)律3.2流行度與時間的關(guān)系基于上述分析,本文可以得到如下結(jié)論:1.商品的流行度與時間之間存在強相關(guān)關(guān)系。通過分析可以發(fā)現(xiàn),商品的流行度是動態(tài)的,并且隨時間的變化而變化。通常,商品的流行度可以根據(jù)時間劃分為兩個階段,即熱門階段和冷門階段。在熱門階段,商品的流行度整體呈上升趨勢,隨時間的延長而增加。但在不同的時間點,其增加速率是不同的;在冷門階段,商品的流行度整體呈下降趨勢,隨時間的增加而減少,并且減少速率較為平緩。2.負樣本的分布隨著時間的變化而轉(zhuǎn)變。如果一個商品是熱門商品,那么該商品就可以出現(xiàn)在網(wǎng)站首頁被推薦給用戶。如果一個出現(xiàn)在網(wǎng)站首頁的熱門商品沒有用戶與其產(chǎn)生交互動作,例如,收藏、點擊、購買、分享給好友等,這類缺少交互行為的熱門商品可以被視作負樣本[53]。同時,由于流行度與商品的交互行為密切相關(guān),并且流行度的分布與時間變化有關(guān),因此,負樣本的分布受時間的影響,即負樣本的分布與商品的流行度隨時間的變化規(guī)律有關(guān)聯(lián)。根據(jù)商品流行度的數(shù)值從大量的缺失數(shù)據(jù)中區(qū)分負樣本和未知數(shù)據(jù)時,
【參考文獻】:
期刊論文
[1]面向隱式反饋的推薦系統(tǒng)研究現(xiàn)狀與趨勢[J]. 陸藝,曹健. 計算機科學(xué). 2016(04)
[2]基于時序行為的協(xié)同過濾推薦算法[J]. 孫光福,吳樂,劉淇,朱琛,陳恩紅. 軟件學(xué)報. 2013(11)
本文編號:3222932
【文章來源】:山東師范大學(xué)山東省
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【部分圖文】:
文章結(jié)構(gòu)圖
山東師范大學(xué)碩士學(xué)位論文11行度和時間之間具有強相關(guān)關(guān)系。其中,X軸表示時間的跨度,Y軸表示商品的平均流行度。商品的平均流行度在前900天隨時間的增加而快速升高,并且在第一千天達到峰值。這種現(xiàn)象表明,商品在前一千天處于熱門階段,并且受關(guān)注程度的增長速率較快,產(chǎn)生這種現(xiàn)象的原因是多樣的。例如,隨著受眾的增加,商品的熱度隨即呈指數(shù)增長。但是,在一千天之后,商品的平均流行度大幅降低,并且隨時間的增加而緩慢的遞減。這種現(xiàn)象表明,商品的熱度開始消退,逐步淡出用戶的視野。整體而言,商品的平均流行度在商品的發(fā)行早期呈熱門狀態(tài),而在今后較長的時間段內(nèi)處于冷門階段,且熱度持續(xù)降低。圖3-1平均流行度隨時間的變化規(guī)律3.1.2單個商品的流行度隨時間的變化規(guī)律下一步,本文分析單個商品的流行度隨時間的變化規(guī)律。在本章實驗中隨機的選取商品作為分析對象。如圖3-2所示,其中X軸表示時間跨度,Y軸表示單個商品的流行度。流行度分布以第一千天作為分界點。第一階段為前一千天,第二階段為第一千天之后。在第一階段中,商品的流行度在前五百天緩慢增長;但是在五百天之后,商品的流行度開始大幅度增加,增長速率大,并且在第一千天時,流行度達到峰值。引起這種現(xiàn)象的原因是多樣的,例如,由于受眾的增加導(dǎo)致交互用戶變多,進而反作用于流行度,促進流行度的增加,最終形成一個循環(huán)。由此可見,商品在前一千天處于熱門階段。然而,商品的流行度達到峰值之后,在短暫的時間內(nèi)大幅度下降。在一千天之后,剩余的時間跨度被分為兩個時間片段。第一個時間片段的跨度大約為1700天,范圍為第1000天到第2700天;第二個時間片段的跨度大約為3300天,范圍為第2700天到第6000天。在第一個時間片段內(nèi),
山東師范大學(xué)碩士學(xué)位論文12商品的流行度波動頻繁,但始終保持在數(shù)值500以下,并在第一時間片段和第二時間片段的交界處發(fā)生陡降;在第二個時間片段,商品的流行度在第2700天至第3000天之間雖然存在一個輕微的增長,但是在第3000天之后,流行度緩慢下降。盡管在兩個時間片段內(nèi)流行度呈波動狀態(tài),但是總體而言,在由第一時間片段和第二時間片段構(gòu)成的第二階段內(nèi),商品的流行度呈下降趨勢。圖3-2單個商品的流行度隨時間的變化規(guī)律3.2流行度與時間的關(guān)系基于上述分析,本文可以得到如下結(jié)論:1.商品的流行度與時間之間存在強相關(guān)關(guān)系。通過分析可以發(fā)現(xiàn),商品的流行度是動態(tài)的,并且隨時間的變化而變化。通常,商品的流行度可以根據(jù)時間劃分為兩個階段,即熱門階段和冷門階段。在熱門階段,商品的流行度整體呈上升趨勢,隨時間的延長而增加。但在不同的時間點,其增加速率是不同的;在冷門階段,商品的流行度整體呈下降趨勢,隨時間的增加而減少,并且減少速率較為平緩。2.負樣本的分布隨著時間的變化而轉(zhuǎn)變。如果一個商品是熱門商品,那么該商品就可以出現(xiàn)在網(wǎng)站首頁被推薦給用戶。如果一個出現(xiàn)在網(wǎng)站首頁的熱門商品沒有用戶與其產(chǎn)生交互動作,例如,收藏、點擊、購買、分享給好友等,這類缺少交互行為的熱門商品可以被視作負樣本[53]。同時,由于流行度與商品的交互行為密切相關(guān),并且流行度的分布與時間變化有關(guān),因此,負樣本的分布受時間的影響,即負樣本的分布與商品的流行度隨時間的變化規(guī)律有關(guān)聯(lián)。根據(jù)商品流行度的數(shù)值從大量的缺失數(shù)據(jù)中區(qū)分負樣本和未知數(shù)據(jù)時,
【參考文獻】:
期刊論文
[1]面向隱式反饋的推薦系統(tǒng)研究現(xiàn)狀與趨勢[J]. 陸藝,曹健. 計算機科學(xué). 2016(04)
[2]基于時序行為的協(xié)同過濾推薦算法[J]. 孫光福,吳樂,劉淇,朱琛,陳恩紅. 軟件學(xué)報. 2013(11)
本文編號:3222932
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3222932.html
最近更新
教材專著