網(wǎng)絡(luò)用戶偏好預(yù)測(cè)關(guān)鍵技術(shù)研究
發(fā)布時(shí)間:2021-10-14 08:25
隨著互聯(lián)網(wǎng)和移動(dòng)計(jì)算技術(shù)的不斷發(fā)展,以社交網(wǎng)絡(luò)、電子商務(wù)為代表的網(wǎng)絡(luò)應(yīng)用迅速普及,致使網(wǎng)絡(luò)中數(shù)據(jù)產(chǎn)生的速度和規(guī)模都空前高漲,人們進(jìn)入了大數(shù)據(jù)時(shí)代。這些數(shù)據(jù)中蘊(yùn)含著大量與人們的偏好相關(guān)的信息,如何從大量紛繁復(fù)雜的數(shù)據(jù)信息中準(zhǔn)確、快速地找出人們關(guān)心的內(nèi)容,如何有效地挖掘、理解和預(yù)測(cè)用戶偏好進(jìn)而提供個(gè)性化推薦服務(wù),是目前互聯(lián)網(wǎng)數(shù)據(jù)科學(xué)領(lǐng)域?qū)W術(shù)界和工業(yè)界共同關(guān)注的熱點(diǎn)問(wèn)題。傳統(tǒng)的基于人工、基于統(tǒng)計(jì)和經(jīng)驗(yàn)公式、基于單一協(xié)同過(guò)濾的方法已經(jīng)不能適應(yīng)現(xiàn)實(shí)互聯(lián)網(wǎng)環(huán)境中數(shù)據(jù)龐大、主體多、無(wú)中心等特點(diǎn)。同時(shí),網(wǎng)絡(luò)用戶行為呈現(xiàn)出高度復(fù)雜化和多樣化的特征,傳統(tǒng)用戶分析模型難以準(zhǔn)確挖掘數(shù)據(jù)的本質(zhì)規(guī)律,定位用戶偏好。此外,機(jī)器學(xué)習(xí)、人工智能技術(shù)的發(fā)展為用戶偏好預(yù)測(cè)研究提供了新的思路,但仍處于探索發(fā)展階段。鑒于此,本文以個(gè)性化推薦為目標(biāo),對(duì)用戶偏好預(yù)測(cè)研究過(guò)程中偏好表達(dá)不完整、模型不合理、特殊因素影響未考慮等問(wèn)題進(jìn)行深入討論,嘗試運(yùn)用機(jī)器學(xué)習(xí)的思想方法,從完善模型、提高推薦效率等角度出發(fā),對(duì)網(wǎng)絡(luò)用戶偏好預(yù)測(cè)關(guān)鍵技術(shù)進(jìn)行研究。依照研究對(duì)象(偏好獲取方式)從直接到間接,研究場(chǎng)景從通用到特殊的順序,將重點(diǎn)放在評(píng)分預(yù)測(cè)、基于...
【文章來(lái)源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:131 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖2.1矩陣分解過(guò)程??
真實(shí)矩陣與預(yù)測(cè)矩陣之間的歐氏距,二三,其由用戶潛在特征矩陣戶及物品潛在特征矩陣2通過(guò)計(jì)算F范數(shù)得出。??和;le為正則化參數(shù),用來(lái)控制兩個(gè)潛在特征矩陣的正則化矩陣。??統(tǒng)的參數(shù)靜態(tài)化矩陣分解模型中,無(wú)論是RMF還是NMF,PMF,其正則為一個(gè)基于實(shí)驗(yàn)的固定值。預(yù)測(cè)矩陣會(huì)最終收斂,并且預(yù)測(cè)值會(huì)越。因此,在每一次的更新迭代中,及矩陣并不是固定不變的,而是隨著不迭代過(guò)程而不停變化的,但是指導(dǎo)矩陣分解過(guò)程的正則化參數(shù)在傳統(tǒng)模是固定不變的。通過(guò)上述分析,可以假設(shè)控制迭代更新的正則化參數(shù)4和乂個(gè)固定的值,因?yàn)椴煌瑴?zhǔn)確率的2矩陣對(duì)于每一次優(yōu)化迭代時(shí)目標(biāo)函程度是不相同的。??了更直觀的驗(yàn)證上述假設(shè),本節(jié)以RMF模型為基礎(chǔ),以20次迭代為一周期,。祩(gè)不同的正則化參數(shù)值(5,4,3,2,1),共。玻埃按蔚鷣(lái)進(jìn)行實(shí)驗(yàn)統(tǒng)計(jì)并觀察變化規(guī)律。實(shí)驗(yàn)中,以每20次的迭代后所得的數(shù)據(jù)作為初始測(cè)此可得11個(gè)不同預(yù)測(cè)精度的初始測(cè)試集,然后以每個(gè)測(cè)試集為基準(zhǔn),驗(yàn)礎(chǔ)上的最佳正則化參數(shù)取值,實(shí)驗(yàn)以RMSE作為驗(yàn)證指標(biāo)。(詳見(jiàn)3.5.2)??-
圖2.3初始評(píng)分與預(yù)測(cè)評(píng)分分布規(guī)律圖??Figure?2.3?distribution?of?initial?ratings?and?predicted?ratings??觀察圖2.3可得,無(wú)論是在Movilens還是Epinions數(shù)據(jù)集中,初始評(píng)分的分??布比較相較預(yù)測(cè)評(píng)分來(lái)說(shuō),分布比較分散,而預(yù)測(cè)評(píng)分多集中在2到4之間,評(píng)分??1和5數(shù)量很少。例如在Epinions數(shù)據(jù)集中,初始評(píng)分分布中,評(píng)分2-4分占到了??總評(píng)分?jǐn)?shù)的57%,預(yù)測(cè)評(píng)分中,2-4評(píng)分區(qū)間的評(píng)分?jǐn)?shù)占總評(píng)分?jǐn)?shù)的比例為72.6%,??兩者相差15.6%。盡管利用RMSE等指標(biāo)驗(yàn)證后的整體更新性能優(yōu)秀,但是和測(cè)??試集顯示的真實(shí)評(píng)分分布情況仍有差距,因此需要一個(gè)微調(diào)機(jī)制來(lái)調(diào)整上述問(wèn)題。??2.3.4?評(píng)分微調(diào)算法??針對(duì)實(shí)際評(píng)分分布與預(yù)測(cè)評(píng)分分布之間的差距問(wèn)題,本節(jié)提出矩陣分解的微??調(diào)算法,算法的基本原理是,使預(yù)測(cè)評(píng)分在不失準(zhǔn)確率的前提下向接近實(shí)際評(píng)分分??布的方向上去更新。如公式2.29所示
【參考文獻(xiàn)】:
期刊論文
[1]基于迭代加權(quán)回歸的推薦算法[J]. 譚姍姍,張培倩,李再興. 數(shù)學(xué)理論與應(yīng)用. 2014(03)
[2]基于受限信任關(guān)系和概率分解矩陣的推薦[J]. 印桂生,張亞楠,董宇欣,韓啟龍. 電子學(xué)報(bào). 2014(05)
[3]考慮長(zhǎng)期與短期興趣因素的用戶偏好建模[J]. 王洪偉,鄒莉. 同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(06)
[4]微博中基于用戶偏好的信息傳播研究[J]. 王金輝,賀利堅(jiān),張偉,童向榮. 計(jì)算機(jī)工程與科學(xué). 2013(03)
[5]基于用戶聚類的異構(gòu)社交網(wǎng)絡(luò)推薦算法[J]. 陳克寒,韓盼盼,吳健. 計(jì)算機(jī)學(xué)報(bào). 2013(02)
[6]在線社會(huì)網(wǎng)絡(luò)用戶的信息分享行為預(yù)測(cè)研究[J]. 劉臣,田占偉,于晶,單偉. 計(jì)算機(jī)應(yīng)用研究. 2013(04)
[7]一種上下文移動(dòng)用戶偏好自適應(yīng)學(xué)習(xí)方法[J]. 史艷翠,孟祥武,張玉潔,王立才. 軟件學(xué)報(bào). 2012(10)
[8]適應(yīng)用戶需求進(jìn)化的個(gè)性化信息服務(wù)模型[J]. 謝海濤,孟祥武. 電子學(xué)報(bào). 2011(03)
[9]非負(fù)矩陣分解算法綜述[J]. 李樂(lè),章毓晉. 電子學(xué)報(bào). 2008(04)
[10]基于用戶行為分析的自適應(yīng)新聞推薦模型[J]. 高琳琦. 圖書(shū)情報(bào)工作. 2007(06)
博士論文
[1]基于位置社交網(wǎng)絡(luò)的數(shù)據(jù)挖掘[D]. 連德富.中國(guó)科學(xué)技術(shù)大學(xué) 2014
碩士論文
[1]網(wǎng)絡(luò)用戶偏好分析方法的研究[D]. 張歡.北京交通大學(xué) 2014
[2]基于社交網(wǎng)絡(luò)和地理位置信息的好友推薦方法研究[D]. 劉乾.浙江大學(xué) 2013
[3]基于本體的個(gè)性化用戶模型研究[D]. 陳琳娜.燕山大學(xué) 2006
本文編號(hào):3435801
【文章來(lái)源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:131 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖2.1矩陣分解過(guò)程??
真實(shí)矩陣與預(yù)測(cè)矩陣之間的歐氏距,二三,其由用戶潛在特征矩陣戶及物品潛在特征矩陣2通過(guò)計(jì)算F范數(shù)得出。??和;le為正則化參數(shù),用來(lái)控制兩個(gè)潛在特征矩陣的正則化矩陣。??統(tǒng)的參數(shù)靜態(tài)化矩陣分解模型中,無(wú)論是RMF還是NMF,PMF,其正則為一個(gè)基于實(shí)驗(yàn)的固定值。預(yù)測(cè)矩陣會(huì)最終收斂,并且預(yù)測(cè)值會(huì)越。因此,在每一次的更新迭代中,及矩陣并不是固定不變的,而是隨著不迭代過(guò)程而不停變化的,但是指導(dǎo)矩陣分解過(guò)程的正則化參數(shù)在傳統(tǒng)模是固定不變的。通過(guò)上述分析,可以假設(shè)控制迭代更新的正則化參數(shù)4和乂個(gè)固定的值,因?yàn)椴煌瑴?zhǔn)確率的2矩陣對(duì)于每一次優(yōu)化迭代時(shí)目標(biāo)函程度是不相同的。??了更直觀的驗(yàn)證上述假設(shè),本節(jié)以RMF模型為基礎(chǔ),以20次迭代為一周期,。祩(gè)不同的正則化參數(shù)值(5,4,3,2,1),共。玻埃按蔚鷣(lái)進(jìn)行實(shí)驗(yàn)統(tǒng)計(jì)并觀察變化規(guī)律。實(shí)驗(yàn)中,以每20次的迭代后所得的數(shù)據(jù)作為初始測(cè)此可得11個(gè)不同預(yù)測(cè)精度的初始測(cè)試集,然后以每個(gè)測(cè)試集為基準(zhǔn),驗(yàn)礎(chǔ)上的最佳正則化參數(shù)取值,實(shí)驗(yàn)以RMSE作為驗(yàn)證指標(biāo)。(詳見(jiàn)3.5.2)??-
圖2.3初始評(píng)分與預(yù)測(cè)評(píng)分分布規(guī)律圖??Figure?2.3?distribution?of?initial?ratings?and?predicted?ratings??觀察圖2.3可得,無(wú)論是在Movilens還是Epinions數(shù)據(jù)集中,初始評(píng)分的分??布比較相較預(yù)測(cè)評(píng)分來(lái)說(shuō),分布比較分散,而預(yù)測(cè)評(píng)分多集中在2到4之間,評(píng)分??1和5數(shù)量很少。例如在Epinions數(shù)據(jù)集中,初始評(píng)分分布中,評(píng)分2-4分占到了??總評(píng)分?jǐn)?shù)的57%,預(yù)測(cè)評(píng)分中,2-4評(píng)分區(qū)間的評(píng)分?jǐn)?shù)占總評(píng)分?jǐn)?shù)的比例為72.6%,??兩者相差15.6%。盡管利用RMSE等指標(biāo)驗(yàn)證后的整體更新性能優(yōu)秀,但是和測(cè)??試集顯示的真實(shí)評(píng)分分布情況仍有差距,因此需要一個(gè)微調(diào)機(jī)制來(lái)調(diào)整上述問(wèn)題。??2.3.4?評(píng)分微調(diào)算法??針對(duì)實(shí)際評(píng)分分布與預(yù)測(cè)評(píng)分分布之間的差距問(wèn)題,本節(jié)提出矩陣分解的微??調(diào)算法,算法的基本原理是,使預(yù)測(cè)評(píng)分在不失準(zhǔn)確率的前提下向接近實(shí)際評(píng)分分??布的方向上去更新。如公式2.29所示
【參考文獻(xiàn)】:
期刊論文
[1]基于迭代加權(quán)回歸的推薦算法[J]. 譚姍姍,張培倩,李再興. 數(shù)學(xué)理論與應(yīng)用. 2014(03)
[2]基于受限信任關(guān)系和概率分解矩陣的推薦[J]. 印桂生,張亞楠,董宇欣,韓啟龍. 電子學(xué)報(bào). 2014(05)
[3]考慮長(zhǎng)期與短期興趣因素的用戶偏好建模[J]. 王洪偉,鄒莉. 同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(06)
[4]微博中基于用戶偏好的信息傳播研究[J]. 王金輝,賀利堅(jiān),張偉,童向榮. 計(jì)算機(jī)工程與科學(xué). 2013(03)
[5]基于用戶聚類的異構(gòu)社交網(wǎng)絡(luò)推薦算法[J]. 陳克寒,韓盼盼,吳健. 計(jì)算機(jī)學(xué)報(bào). 2013(02)
[6]在線社會(huì)網(wǎng)絡(luò)用戶的信息分享行為預(yù)測(cè)研究[J]. 劉臣,田占偉,于晶,單偉. 計(jì)算機(jī)應(yīng)用研究. 2013(04)
[7]一種上下文移動(dòng)用戶偏好自適應(yīng)學(xué)習(xí)方法[J]. 史艷翠,孟祥武,張玉潔,王立才. 軟件學(xué)報(bào). 2012(10)
[8]適應(yīng)用戶需求進(jìn)化的個(gè)性化信息服務(wù)模型[J]. 謝海濤,孟祥武. 電子學(xué)報(bào). 2011(03)
[9]非負(fù)矩陣分解算法綜述[J]. 李樂(lè),章毓晉. 電子學(xué)報(bào). 2008(04)
[10]基于用戶行為分析的自適應(yīng)新聞推薦模型[J]. 高琳琦. 圖書(shū)情報(bào)工作. 2007(06)
博士論文
[1]基于位置社交網(wǎng)絡(luò)的數(shù)據(jù)挖掘[D]. 連德富.中國(guó)科學(xué)技術(shù)大學(xué) 2014
碩士論文
[1]網(wǎng)絡(luò)用戶偏好分析方法的研究[D]. 張歡.北京交通大學(xué) 2014
[2]基于社交網(wǎng)絡(luò)和地理位置信息的好友推薦方法研究[D]. 劉乾.浙江大學(xué) 2013
[3]基于本體的個(gè)性化用戶模型研究[D]. 陳琳娜.燕山大學(xué) 2006
本文編號(hào):3435801
本文鏈接:http://sikaile.net/guanlilunwen/shequguanli/3435801.html
最近更新
教材專著