基于用戶簽到行為的自適應(yīng)興趣點(diǎn)推薦方法研究
發(fā)布時(shí)間:2021-10-15 17:50
基于位置社交網(wǎng)絡(luò)中的興趣點(diǎn)推薦能夠根據(jù)用戶的簽到偏好有效地幫助用戶探索未訪問(wèn)過(guò)的地點(diǎn),通過(guò)提供個(gè)性化的興趣點(diǎn)推薦服務(wù)來(lái)解決地點(diǎn)信息過(guò)載的問(wèn)題,具有重要的研究意義和應(yīng)用價(jià)值。但是,現(xiàn)有興趣點(diǎn)推薦方法在如何深入進(jìn)行用戶自身簽到行為多樣性的研究、如何實(shí)現(xiàn)融合時(shí)間特征和空間特征的自適應(yīng)興趣點(diǎn)推薦算法、如何利用循環(huán)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)自適應(yīng)連續(xù)興趣點(diǎn)推薦算法、以及如何提高興趣點(diǎn)推薦算法的性能等方面還存在不足之處。針對(duì)這些問(wèn)題,本文圍繞用戶簽到行為和自適應(yīng)興趣點(diǎn)推薦算法展開(kāi)研究,主要工作如下。首先,針對(duì)現(xiàn)有興趣點(diǎn)推薦對(duì)用戶的簽到行為考慮不足,缺乏對(duì)用戶分類的問(wèn)題,提出用戶簽到行為的特征提取方法及用戶聚類算法。采用概率統(tǒng)計(jì)分析方法,從LBSNs歷史簽到數(shù)據(jù)集中提取和分析用戶簽到次數(shù)、簽到興趣點(diǎn)數(shù)量和簽到時(shí)間槽分布數(shù)量三維特征。在此基礎(chǔ)上,提出基于模糊C均值的用戶聚類算法,采用三種指標(biāo)綜合分析聚類的性能,確定最佳聚類數(shù)目并給出用戶聚類的結(jié)果及現(xiàn)實(shí)涵義。實(shí)現(xiàn)對(duì)用戶自身簽到行為特征和用戶聚類的深入全面研究,為下一步設(shè)計(jì)自適應(yīng)興趣點(diǎn)推薦算法奠定堅(jiān)實(shí)基礎(chǔ)。其次,針對(duì)基于用戶協(xié)同過(guò)濾的方法無(wú)法準(zhǔn)確獲取用戶簽到偏好的時(shí)間...
【文章來(lái)源】:燕山大學(xué)河北省
【文章頁(yè)數(shù)】:141 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
基于LBSNs的興趣點(diǎn)推薦示意圖
第2章用戶簽到行為特征提取及用戶聚類算法-31-其中,c是用戶聚類的數(shù)目,Wi表示Ci類中的所有用戶樣本到其聚類中心的平均距離,Wj表示Ci類中的所有用戶樣本到Cj類的聚類中心的平均距離,Cij表示Ci類和Cj類的中心之間的距離。DB的值越小,表示類與類之間的相似度越低,因此最小的DB值代表最佳的聚類結(jié)果。(3)SilhouetteCoefficient(SC)指標(biāo):也稱輪廓系數(shù),用于衡量用戶與其自己所在集群(內(nèi)聚)相比與其他集群(分離)之間的相似性,定義為所有用戶樣本的輪廓系數(shù)平均值,如公式(2-15)所示。在c個(gè)用戶集群中,對(duì)于每一個(gè)用戶i,a(i)是用戶i與自己所在集群中的其他用戶的平均距離,b(i)是用戶i與任何其他集群中的所有用戶的最短平均距離。輪廓系數(shù)的取值范圍是[-1,1],同一類別用戶樣本距離越相近(即與自身集群匹配良好),并且不同類別用戶樣本距離越遠(yuǎn)(即與相鄰集群匹配不良),輪廓系數(shù)的值越高,因此最大的SC值代表最佳聚類結(jié)果。11()()()()max{(),()}nibiaiSCcnaibi(2-15)2.5.2用戶聚類評(píng)估圖2-6Foursquare數(shù)據(jù)集的聚類評(píng)價(jià)結(jié)果Fig.2-6ResultsofclusteringevaluationonFoursquare
燕山大學(xué)工學(xué)博士學(xué)位論文-32-為了確定最佳聚類數(shù)目,對(duì)LBSNs用戶進(jìn)行聚類和性能評(píng)估。給定聚類數(shù)目c[1,10],在Foursquare和Gowalla兩個(gè)數(shù)據(jù)集上使用不同的聚類數(shù)目c分別運(yùn)行UCB-FCM算法,對(duì)得出的每個(gè)用戶聚類結(jié)果分別計(jì)算CH指標(biāo)、DB指標(biāo)和SC系數(shù)值。然后,對(duì)同一類的有效性指標(biāo)值進(jìn)行比較,對(duì)應(yīng)最佳指標(biāo)值的聚類數(shù)目即為最佳的用戶聚類數(shù)。通過(guò)實(shí)驗(yàn),對(duì)Foursquare數(shù)據(jù)集上的2,321個(gè)用戶進(jìn)行1到10類劃分后的聚類效果評(píng)估結(jié)果如圖2-6所示,對(duì)Gowalla數(shù)據(jù)集上的10,162個(gè)用戶進(jìn)行1到10類劃分后的聚類效果評(píng)估結(jié)果如圖2-7所示。圖2-7Gowalla數(shù)據(jù)集的聚類評(píng)價(jià)結(jié)果Fig.2-7ResultsofclusteringevaluationonGowalla與此同時(shí),表2-2給出Foursquare和Gowalla兩個(gè)數(shù)據(jù)集上不同聚類數(shù)目對(duì)應(yīng)的CH、DB和SC指標(biāo)結(jié)果。從表2-2可以看出,當(dāng)聚類數(shù)目為1時(shí),即把所有LBSN用戶劃分為一個(gè)集群類別,F(xiàn)oursquare和Gowalla數(shù)據(jù)集對(duì)應(yīng)的各個(gè)指標(biāo)值都是NaN,這個(gè)結(jié)果說(shuō)明不適用于聚類數(shù)為1的情況。在聚類數(shù)目是從2類到10類的變化過(guò)程中,根據(jù)DB和SC指標(biāo)的實(shí)驗(yàn)結(jié)果顯示,聚類數(shù)目c=2時(shí),兩個(gè)數(shù)據(jù)集上的DB指標(biāo)值都是最小值,SC指標(biāo)值都是最大值,說(shuō)明在Foursquare和Gowalla數(shù)據(jù)集中的最佳聚類數(shù)都是2類。對(duì)于Foursquare的CH指數(shù)結(jié)果顯示,最佳聚類數(shù)目是c=4,
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的混合興趣點(diǎn)推薦算法[J]. 馮浩,黃坤,李晶,高榕,劉東華,宋成芳. 電子與信息學(xué)報(bào). 2019(04)
[2]LBSN中融合信任與不信任關(guān)系的興趣點(diǎn)推薦[J]. 朱敬華,明騫. 通信學(xué)報(bào). 2018(07)
[3]Exploiting Geo-Social Correlations to Improve Pairwise Ranking for Point-of-Interest Recommendation[J]. Rong Gao,Jing Li,Bo Du,Xuefei Li,Jun Chang,Chengfang Song,Donghua Liu. 中國(guó)通信. 2018(07)
[4]融合時(shí)空上下文信息的興趣點(diǎn)推薦[J]. 徐前方,王嘉春,肖波. 北京郵電大學(xué)學(xué)報(bào). 2018(01)
[5]基于位置社會(huì)網(wǎng)絡(luò)的雙重細(xì)粒度興趣點(diǎn)推薦[J]. 廖國(guó)瓊,姜珊,周志恒,萬(wàn)常選. 計(jì)算機(jī)研究與發(fā)展. 2017(11)
[6]LBSN上基于興趣圈中社會(huì)關(guān)系挖掘的推薦算法[J]. 李鑫,劉貴全,李琳,吳宗大,丁君美. 計(jì)算機(jī)研究與發(fā)展. 2017(02)
[7]基于位置社交網(wǎng)絡(luò)的上下文感知的興趣點(diǎn)推薦[J]. 任星怡,宋美娜,宋俊德. 計(jì)算機(jī)學(xué)報(bào). 2017(04)
[8]基于用戶簽到行為的興趣點(diǎn)推薦[J]. 任星怡,宋美娜,宋俊德. 計(jì)算機(jī)學(xué)報(bào). 2017(01)
[9]基于Ranking的泊松矩陣分解興趣點(diǎn)推薦算法[J]. 余永紅,高陽(yáng),王皓. 計(jì)算機(jī)研究與發(fā)展. 2016(08)
[10]一種融合情景和評(píng)論信息的位置社交網(wǎng)絡(luò)興趣點(diǎn)推薦模型[J]. 高榕,李晶,杜博,余永紅,宋成芳,丁永剛. 計(jì)算機(jī)研究與發(fā)展. 2016(04)
本文編號(hào):3438373
【文章來(lái)源】:燕山大學(xué)河北省
【文章頁(yè)數(shù)】:141 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
基于LBSNs的興趣點(diǎn)推薦示意圖
第2章用戶簽到行為特征提取及用戶聚類算法-31-其中,c是用戶聚類的數(shù)目,Wi表示Ci類中的所有用戶樣本到其聚類中心的平均距離,Wj表示Ci類中的所有用戶樣本到Cj類的聚類中心的平均距離,Cij表示Ci類和Cj類的中心之間的距離。DB的值越小,表示類與類之間的相似度越低,因此最小的DB值代表最佳的聚類結(jié)果。(3)SilhouetteCoefficient(SC)指標(biāo):也稱輪廓系數(shù),用于衡量用戶與其自己所在集群(內(nèi)聚)相比與其他集群(分離)之間的相似性,定義為所有用戶樣本的輪廓系數(shù)平均值,如公式(2-15)所示。在c個(gè)用戶集群中,對(duì)于每一個(gè)用戶i,a(i)是用戶i與自己所在集群中的其他用戶的平均距離,b(i)是用戶i與任何其他集群中的所有用戶的最短平均距離。輪廓系數(shù)的取值范圍是[-1,1],同一類別用戶樣本距離越相近(即與自身集群匹配良好),并且不同類別用戶樣本距離越遠(yuǎn)(即與相鄰集群匹配不良),輪廓系數(shù)的值越高,因此最大的SC值代表最佳聚類結(jié)果。11()()()()max{(),()}nibiaiSCcnaibi(2-15)2.5.2用戶聚類評(píng)估圖2-6Foursquare數(shù)據(jù)集的聚類評(píng)價(jià)結(jié)果Fig.2-6ResultsofclusteringevaluationonFoursquare
燕山大學(xué)工學(xué)博士學(xué)位論文-32-為了確定最佳聚類數(shù)目,對(duì)LBSNs用戶進(jìn)行聚類和性能評(píng)估。給定聚類數(shù)目c[1,10],在Foursquare和Gowalla兩個(gè)數(shù)據(jù)集上使用不同的聚類數(shù)目c分別運(yùn)行UCB-FCM算法,對(duì)得出的每個(gè)用戶聚類結(jié)果分別計(jì)算CH指標(biāo)、DB指標(biāo)和SC系數(shù)值。然后,對(duì)同一類的有效性指標(biāo)值進(jìn)行比較,對(duì)應(yīng)最佳指標(biāo)值的聚類數(shù)目即為最佳的用戶聚類數(shù)。通過(guò)實(shí)驗(yàn),對(duì)Foursquare數(shù)據(jù)集上的2,321個(gè)用戶進(jìn)行1到10類劃分后的聚類效果評(píng)估結(jié)果如圖2-6所示,對(duì)Gowalla數(shù)據(jù)集上的10,162個(gè)用戶進(jìn)行1到10類劃分后的聚類效果評(píng)估結(jié)果如圖2-7所示。圖2-7Gowalla數(shù)據(jù)集的聚類評(píng)價(jià)結(jié)果Fig.2-7ResultsofclusteringevaluationonGowalla與此同時(shí),表2-2給出Foursquare和Gowalla兩個(gè)數(shù)據(jù)集上不同聚類數(shù)目對(duì)應(yīng)的CH、DB和SC指標(biāo)結(jié)果。從表2-2可以看出,當(dāng)聚類數(shù)目為1時(shí),即把所有LBSN用戶劃分為一個(gè)集群類別,F(xiàn)oursquare和Gowalla數(shù)據(jù)集對(duì)應(yīng)的各個(gè)指標(biāo)值都是NaN,這個(gè)結(jié)果說(shuō)明不適用于聚類數(shù)為1的情況。在聚類數(shù)目是從2類到10類的變化過(guò)程中,根據(jù)DB和SC指標(biāo)的實(shí)驗(yàn)結(jié)果顯示,聚類數(shù)目c=2時(shí),兩個(gè)數(shù)據(jù)集上的DB指標(biāo)值都是最小值,SC指標(biāo)值都是最大值,說(shuō)明在Foursquare和Gowalla數(shù)據(jù)集中的最佳聚類數(shù)都是2類。對(duì)于Foursquare的CH指數(shù)結(jié)果顯示,最佳聚類數(shù)目是c=4,
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的混合興趣點(diǎn)推薦算法[J]. 馮浩,黃坤,李晶,高榕,劉東華,宋成芳. 電子與信息學(xué)報(bào). 2019(04)
[2]LBSN中融合信任與不信任關(guān)系的興趣點(diǎn)推薦[J]. 朱敬華,明騫. 通信學(xué)報(bào). 2018(07)
[3]Exploiting Geo-Social Correlations to Improve Pairwise Ranking for Point-of-Interest Recommendation[J]. Rong Gao,Jing Li,Bo Du,Xuefei Li,Jun Chang,Chengfang Song,Donghua Liu. 中國(guó)通信. 2018(07)
[4]融合時(shí)空上下文信息的興趣點(diǎn)推薦[J]. 徐前方,王嘉春,肖波. 北京郵電大學(xué)學(xué)報(bào). 2018(01)
[5]基于位置社會(huì)網(wǎng)絡(luò)的雙重細(xì)粒度興趣點(diǎn)推薦[J]. 廖國(guó)瓊,姜珊,周志恒,萬(wàn)常選. 計(jì)算機(jī)研究與發(fā)展. 2017(11)
[6]LBSN上基于興趣圈中社會(huì)關(guān)系挖掘的推薦算法[J]. 李鑫,劉貴全,李琳,吳宗大,丁君美. 計(jì)算機(jī)研究與發(fā)展. 2017(02)
[7]基于位置社交網(wǎng)絡(luò)的上下文感知的興趣點(diǎn)推薦[J]. 任星怡,宋美娜,宋俊德. 計(jì)算機(jī)學(xué)報(bào). 2017(04)
[8]基于用戶簽到行為的興趣點(diǎn)推薦[J]. 任星怡,宋美娜,宋俊德. 計(jì)算機(jī)學(xué)報(bào). 2017(01)
[9]基于Ranking的泊松矩陣分解興趣點(diǎn)推薦算法[J]. 余永紅,高陽(yáng),王皓. 計(jì)算機(jī)研究與發(fā)展. 2016(08)
[10]一種融合情景和評(píng)論信息的位置社交網(wǎng)絡(luò)興趣點(diǎn)推薦模型[J]. 高榕,李晶,杜博,余永紅,宋成芳,丁永剛. 計(jì)算機(jī)研究與發(fā)展. 2016(04)
本文編號(hào):3438373
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3438373.html
最近更新
教材專著