基于地理-社會(huì)-評(píng)論關(guān)系的典型化興趣點(diǎn)推薦方法
發(fā)布時(shí)間:2021-07-03 16:05
當(dāng)前興趣點(diǎn)推薦大多利用興趣點(diǎn)的位置信息和用戶的社交關(guān)系提升推薦質(zhì)量,忽略了興趣點(diǎn)評(píng)論信息的重要性;此外,推薦的興趣點(diǎn)之間通常比較相似,不具有代表性和差異性.針對(duì)上述問(wèn)題,提出了一種新的興趣點(diǎn)相關(guān)度評(píng)估模型,稱為地理-社會(huì)-評(píng)論關(guān)系模型,并給出了一種新的評(píng)論文本相似度度量方法.根據(jù)興趣點(diǎn)間的地理-社會(huì)-評(píng)論關(guān)系相關(guān)度,提出了基于譜聚類的興趣點(diǎn)聚類方法和基于概率密度估計(jì)的興趣點(diǎn)典型化選取方法,以便從每個(gè)聚類中選取一個(gè)具有代表性的興趣點(diǎn).對(duì)于選取的典型化興趣點(diǎn),提出了利用概率因子模型擬合用戶訪問(wèn)興趣點(diǎn)次數(shù)矩陣的方法對(duì)推薦結(jié)果進(jìn)行個(gè)性化排序.實(shí)驗(yàn)結(jié)果表明,本文提出的相關(guān)度評(píng)估模型對(duì)興趣點(diǎn)的相關(guān)度評(píng)估更合理,推薦結(jié)果在多樣性和準(zhǔn)確率方面都取得了更好的效果.
【文章來(lái)源】:小型微型計(jì)算機(jī)系統(tǒng). 2019,40(11)北大核心CSCD
【文章頁(yè)數(shù)】:8 頁(yè)
【部分圖文】:
總體框架圖Fig.1Generalframeworkdiagram
?2、θ3為可調(diào)參數(shù),用于調(diào)整地理相關(guān)度、社會(huì)相關(guān)度、評(píng)論文本相關(guān)度在興趣點(diǎn)相關(guān)度中的比重,其中θ1+θ2+θ3=1.5興趣點(diǎn)的典型化選取5.1基于興趣點(diǎn)相關(guān)度矩陣的聚類為了得到具有多樣性的興趣點(diǎn)推薦列表,需將第4節(jié)得到的興趣點(diǎn)相關(guān)度矩陣進(jìn)行聚類,進(jìn)而從不同類別中選取典型性的興趣點(diǎn).譜聚類是一種基于圖論的聚類方法,該算法只需要數(shù)據(jù)之間的相似度矩陣即可,并更適合在高維度的數(shù)據(jù)上運(yùn)行,因此本文采用譜聚類中規(guī)范割集準(zhǔn)則[22]進(jìn)行興趣點(diǎn)的聚類.圖2是一個(gè)帶權(quán)無(wú)向圖,頂點(diǎn)之間的連線表示兩個(gè)頂點(diǎn)之間的聯(lián)系,邊的權(quán)重代表頂點(diǎn)的相關(guān)度,本文用wij代表頂點(diǎn)i與j之間的相關(guān)度.假設(shè)圖2的無(wú)向圖被分為兩類G1和G2,以n維向量(這里n=7)q=[q1,q2,…,qn]記錄該無(wú)向圖的劃分方法(若頂點(diǎn)i屬于G1,則qi=c1;若頂點(diǎn)i屬于G2,則qi=c2),劃分方案可表示為q=[c1,c1,c1,c1,c2,c2,c2].按此劃分方案,劃分最優(yōu)子圖時(shí)所截?cái)嗟呐d趣點(diǎn)關(guān)系圖中邊的權(quán)重之和的函數(shù),即損失函數(shù)可表示為:Cut(G1,G2)=∑i∈G1,j∈G2wij=∑ni=1∑nj=1wij(qi-qj)22(c1-c2)2(17)圖2譜聚類示意圖Fig.2Spectralclusteringdiagram又因?yàn)?∑ni=1∑nj=1wij(qi-qj)2=∑ni=1∑nj=1wij(q2i-2qiqj+q2j)=-∑ni=1∑nj=12wijqiqj+∑ni=1∑n
疚奶?出的方法和ST-CW算法[26]分別將該基準(zhǔn)文本與其余30組評(píng)論文本做相似度計(jì)算,并整理出與該基準(zhǔn)評(píng)論文本相似度最高的10組評(píng)論.然后邀請(qǐng)了10個(gè)用戶(碩士生),讓他們從30組評(píng)論中選出與基準(zhǔn)文本最相似的10組評(píng)論文本.則算法的準(zhǔn)確率為:Accuracy=|AR∩UR|10(28)其中,分子代表由不同方法得到的10組評(píng)論文本和由用戶選出的10組評(píng)論文本的交集,即兩種方法得到的結(jié)果與用戶標(biāo)注結(jié)果之間的重疊程度,重疊程度越高,說(shuō)明用戶滿意度(算法準(zhǔn)確率)越高.圖310名用戶的滿意程度Fig.3Satisfactionof10users從圖3可以看出,本文提出的算法的重疊率為82%,而ST-CW算法的重疊率為69%(重疊率取10個(gè)用戶的平均值).由此可見(jiàn),本文提出的算法具有較高的重疊率,即具有較高的準(zhǔn)確率.6.4推薦結(jié)果分析實(shí)驗(yàn)中,以0.1為步長(zhǎng),采用枚舉法討論興趣點(diǎn)相關(guān)度的權(quán)重系數(shù).首先令θ1=0.1,分別令θ2=0.1、0.2、…、0.8,θ3=0.8、0.7、…、0.1,然后令θ1=0.2,分別令θ2=0.1、0.2、…、0.7,θ3=0.7、0.6、…、0.1,再令θ1=0.3,分別令θ2=0.1、0.2、…、0.6,θ3=0.6、0.5、…、0.1,以此類推.經(jīng)測(cè)得,當(dāng)θ1=0.8、θ2=0.1、θ3=0.1時(shí)在準(zhǔn)確率召回率指標(biāo)上取得較好的結(jié)果,因此選取0.8、0.1、0.1作為地理相關(guān)度、社會(huì)相關(guān)度以及評(píng)論相關(guān)度的權(quán)重系數(shù);而PFM中的參數(shù)根據(jù)文獻(xiàn)[23]中的最優(yōu)參數(shù)設(shè)定,αk=20、βk=0.2,該參數(shù)經(jīng)過(guò)測(cè)試,同樣適用于本文所用數(shù)據(jù)集;在k-means聚類中,本
【參考文獻(xiàn)】:
期刊論文
[1]融合地理-社會(huì)關(guān)系的空間聚類方法[J]. 唐延歡,孟祥福,張霄雁,畢崇春,唐曉亮. 小型微型計(jì)算機(jī)系統(tǒng). 2017(11)
[2]基于用戶的協(xié)同過(guò)濾算法的推薦效率和個(gè)性化改進(jìn)[J]. 王成,朱志剛,張玉俠,蘇芳芳. 小型微型計(jì)算機(jī)系統(tǒng). 2016(03)
[3]面向微博系統(tǒng)的實(shí)時(shí)個(gè)性化推薦[J]. 高明,金澈清,錢衛(wèi)寧,王曉玲,周傲英. 計(jì)算機(jī)學(xué)報(bào). 2014(04)
[4]一種基于LDA的社區(qū)問(wèn)答問(wèn)句相似度計(jì)算方法[J]. 熊大平,王健,林鴻飛. 中文信息學(xué)報(bào). 2012(05)
[5]結(jié)合詞義的文本特征詞權(quán)重計(jì)算方法[J]. 李明濤,羅軍勇,尹美娟,路林. 計(jì)算機(jī)應(yīng)用. 2012(05)
[6]一種基于WordNet的短文本語(yǔ)義相似性算法[J]. 翟延冬,王康平,張東娜,黃嵐,周春光. 電子學(xué)報(bào). 2012(03)
[7]一種結(jié)合詞項(xiàng)語(yǔ)義信息和TF-IDF方法的文本相似度量方法[J]. 黃承慧,印鑒,侯昉. 計(jì)算機(jī)學(xué)報(bào). 2011(05)
[8]基于常問(wèn)問(wèn)題集的中文問(wèn)答系統(tǒng)研究[J]. 秦兵,劉挺,王洋,鄭實(shí)福,李生. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2003(10)
本文編號(hào):3262905
【文章來(lái)源】:小型微型計(jì)算機(jī)系統(tǒng). 2019,40(11)北大核心CSCD
【文章頁(yè)數(shù)】:8 頁(yè)
【部分圖文】:
總體框架圖Fig.1Generalframeworkdiagram
?2、θ3為可調(diào)參數(shù),用于調(diào)整地理相關(guān)度、社會(huì)相關(guān)度、評(píng)論文本相關(guān)度在興趣點(diǎn)相關(guān)度中的比重,其中θ1+θ2+θ3=1.5興趣點(diǎn)的典型化選取5.1基于興趣點(diǎn)相關(guān)度矩陣的聚類為了得到具有多樣性的興趣點(diǎn)推薦列表,需將第4節(jié)得到的興趣點(diǎn)相關(guān)度矩陣進(jìn)行聚類,進(jìn)而從不同類別中選取典型性的興趣點(diǎn).譜聚類是一種基于圖論的聚類方法,該算法只需要數(shù)據(jù)之間的相似度矩陣即可,并更適合在高維度的數(shù)據(jù)上運(yùn)行,因此本文采用譜聚類中規(guī)范割集準(zhǔn)則[22]進(jìn)行興趣點(diǎn)的聚類.圖2是一個(gè)帶權(quán)無(wú)向圖,頂點(diǎn)之間的連線表示兩個(gè)頂點(diǎn)之間的聯(lián)系,邊的權(quán)重代表頂點(diǎn)的相關(guān)度,本文用wij代表頂點(diǎn)i與j之間的相關(guān)度.假設(shè)圖2的無(wú)向圖被分為兩類G1和G2,以n維向量(這里n=7)q=[q1,q2,…,qn]記錄該無(wú)向圖的劃分方法(若頂點(diǎn)i屬于G1,則qi=c1;若頂點(diǎn)i屬于G2,則qi=c2),劃分方案可表示為q=[c1,c1,c1,c1,c2,c2,c2].按此劃分方案,劃分最優(yōu)子圖時(shí)所截?cái)嗟呐d趣點(diǎn)關(guān)系圖中邊的權(quán)重之和的函數(shù),即損失函數(shù)可表示為:Cut(G1,G2)=∑i∈G1,j∈G2wij=∑ni=1∑nj=1wij(qi-qj)22(c1-c2)2(17)圖2譜聚類示意圖Fig.2Spectralclusteringdiagram又因?yàn)?∑ni=1∑nj=1wij(qi-qj)2=∑ni=1∑nj=1wij(q2i-2qiqj+q2j)=-∑ni=1∑nj=12wijqiqj+∑ni=1∑n
疚奶?出的方法和ST-CW算法[26]分別將該基準(zhǔn)文本與其余30組評(píng)論文本做相似度計(jì)算,并整理出與該基準(zhǔn)評(píng)論文本相似度最高的10組評(píng)論.然后邀請(qǐng)了10個(gè)用戶(碩士生),讓他們從30組評(píng)論中選出與基準(zhǔn)文本最相似的10組評(píng)論文本.則算法的準(zhǔn)確率為:Accuracy=|AR∩UR|10(28)其中,分子代表由不同方法得到的10組評(píng)論文本和由用戶選出的10組評(píng)論文本的交集,即兩種方法得到的結(jié)果與用戶標(biāo)注結(jié)果之間的重疊程度,重疊程度越高,說(shuō)明用戶滿意度(算法準(zhǔn)確率)越高.圖310名用戶的滿意程度Fig.3Satisfactionof10users從圖3可以看出,本文提出的算法的重疊率為82%,而ST-CW算法的重疊率為69%(重疊率取10個(gè)用戶的平均值).由此可見(jiàn),本文提出的算法具有較高的重疊率,即具有較高的準(zhǔn)確率.6.4推薦結(jié)果分析實(shí)驗(yàn)中,以0.1為步長(zhǎng),采用枚舉法討論興趣點(diǎn)相關(guān)度的權(quán)重系數(shù).首先令θ1=0.1,分別令θ2=0.1、0.2、…、0.8,θ3=0.8、0.7、…、0.1,然后令θ1=0.2,分別令θ2=0.1、0.2、…、0.7,θ3=0.7、0.6、…、0.1,再令θ1=0.3,分別令θ2=0.1、0.2、…、0.6,θ3=0.6、0.5、…、0.1,以此類推.經(jīng)測(cè)得,當(dāng)θ1=0.8、θ2=0.1、θ3=0.1時(shí)在準(zhǔn)確率召回率指標(biāo)上取得較好的結(jié)果,因此選取0.8、0.1、0.1作為地理相關(guān)度、社會(huì)相關(guān)度以及評(píng)論相關(guān)度的權(quán)重系數(shù);而PFM中的參數(shù)根據(jù)文獻(xiàn)[23]中的最優(yōu)參數(shù)設(shè)定,αk=20、βk=0.2,該參數(shù)經(jīng)過(guò)測(cè)試,同樣適用于本文所用數(shù)據(jù)集;在k-means聚類中,本
【參考文獻(xiàn)】:
期刊論文
[1]融合地理-社會(huì)關(guān)系的空間聚類方法[J]. 唐延歡,孟祥福,張霄雁,畢崇春,唐曉亮. 小型微型計(jì)算機(jī)系統(tǒng). 2017(11)
[2]基于用戶的協(xié)同過(guò)濾算法的推薦效率和個(gè)性化改進(jìn)[J]. 王成,朱志剛,張玉俠,蘇芳芳. 小型微型計(jì)算機(jī)系統(tǒng). 2016(03)
[3]面向微博系統(tǒng)的實(shí)時(shí)個(gè)性化推薦[J]. 高明,金澈清,錢衛(wèi)寧,王曉玲,周傲英. 計(jì)算機(jī)學(xué)報(bào). 2014(04)
[4]一種基于LDA的社區(qū)問(wèn)答問(wèn)句相似度計(jì)算方法[J]. 熊大平,王健,林鴻飛. 中文信息學(xué)報(bào). 2012(05)
[5]結(jié)合詞義的文本特征詞權(quán)重計(jì)算方法[J]. 李明濤,羅軍勇,尹美娟,路林. 計(jì)算機(jī)應(yīng)用. 2012(05)
[6]一種基于WordNet的短文本語(yǔ)義相似性算法[J]. 翟延冬,王康平,張東娜,黃嵐,周春光. 電子學(xué)報(bào). 2012(03)
[7]一種結(jié)合詞項(xiàng)語(yǔ)義信息和TF-IDF方法的文本相似度量方法[J]. 黃承慧,印鑒,侯昉. 計(jì)算機(jī)學(xué)報(bào). 2011(05)
[8]基于常問(wèn)問(wèn)題集的中文問(wèn)答系統(tǒng)研究[J]. 秦兵,劉挺,王洋,鄭實(shí)福,李生. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2003(10)
本文編號(hào):3262905
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3262905.html
最近更新
教材專著