天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于地理-社會-評論關(guān)系的典型化興趣點推薦方法

發(fā)布時間:2021-07-03 16:05
  當前興趣點推薦大多利用興趣點的位置信息和用戶的社交關(guān)系提升推薦質(zhì)量,忽略了興趣點評論信息的重要性;此外,推薦的興趣點之間通常比較相似,不具有代表性和差異性.針對上述問題,提出了一種新的興趣點相關(guān)度評估模型,稱為地理-社會-評論關(guān)系模型,并給出了一種新的評論文本相似度度量方法.根據(jù)興趣點間的地理-社會-評論關(guān)系相關(guān)度,提出了基于譜聚類的興趣點聚類方法和基于概率密度估計的興趣點典型化選取方法,以便從每個聚類中選取一個具有代表性的興趣點.對于選取的典型化興趣點,提出了利用概率因子模型擬合用戶訪問興趣點次數(shù)矩陣的方法對推薦結(jié)果進行個性化排序.實驗結(jié)果表明,本文提出的相關(guān)度評估模型對興趣點的相關(guān)度評估更合理,推薦結(jié)果在多樣性和準確率方面都取得了更好的效果. 

【文章來源】:小型微型計算機系統(tǒng). 2019,40(11)北大核心CSCD

【文章頁數(shù)】:8 頁

【部分圖文】:

基于地理-社會-評論關(guān)系的典型化興趣點推薦方法


總體框架圖Fig.1Generalframeworkdiagram

示意圖,聚類,示意圖,興趣點


?2、θ3為可調(diào)參數(shù),用于調(diào)整地理相關(guān)度、社會相關(guān)度、評論文本相關(guān)度在興趣點相關(guān)度中的比重,其中θ1+θ2+θ3=1.5興趣點的典型化選取5.1基于興趣點相關(guān)度矩陣的聚類為了得到具有多樣性的興趣點推薦列表,需將第4節(jié)得到的興趣點相關(guān)度矩陣進行聚類,進而從不同類別中選取典型性的興趣點.譜聚類是一種基于圖論的聚類方法,該算法只需要數(shù)據(jù)之間的相似度矩陣即可,并更適合在高維度的數(shù)據(jù)上運行,因此本文采用譜聚類中規(guī)范割集準則[22]進行興趣點的聚類.圖2是一個帶權(quán)無向圖,頂點之間的連線表示兩個頂點之間的聯(lián)系,邊的權(quán)重代表頂點的相關(guān)度,本文用wij代表頂點i與j之間的相關(guān)度.假設圖2的無向圖被分為兩類G1和G2,以n維向量(這里n=7)q=[q1,q2,…,qn]記錄該無向圖的劃分方法(若頂點i屬于G1,則qi=c1;若頂點i屬于G2,則qi=c2),劃分方案可表示為q=[c1,c1,c1,c1,c2,c2,c2].按此劃分方案,劃分最優(yōu)子圖時所截斷的興趣點關(guān)系圖中邊的權(quán)重之和的函數(shù),即損失函數(shù)可表示為:Cut(G1,G2)=∑i∈G1,j∈G2wij=∑ni=1∑nj=1wij(qi-qj)22(c1-c2)2(17)圖2譜聚類示意圖Fig.2Spectralclusteringdiagram又因為:∑ni=1∑nj=1wij(qi-qj)2=∑ni=1∑nj=1wij(q2i-2qiqj+q2j)=-∑ni=1∑nj=12wijqiqj+∑ni=1∑n

評論文,重疊率,準確率,相關(guān)度


疚奶?出的方法和ST-CW算法[26]分別將該基準文本與其余30組評論文本做相似度計算,并整理出與該基準評論文本相似度最高的10組評論.然后邀請了10個用戶(碩士生),讓他們從30組評論中選出與基準文本最相似的10組評論文本.則算法的準確率為:Accuracy=|AR∩UR|10(28)其中,分子代表由不同方法得到的10組評論文本和由用戶選出的10組評論文本的交集,即兩種方法得到的結(jié)果與用戶標注結(jié)果之間的重疊程度,重疊程度越高,說明用戶滿意度(算法準確率)越高.圖310名用戶的滿意程度Fig.3Satisfactionof10users從圖3可以看出,本文提出的算法的重疊率為82%,而ST-CW算法的重疊率為69%(重疊率取10個用戶的平均值).由此可見,本文提出的算法具有較高的重疊率,即具有較高的準確率.6.4推薦結(jié)果分析實驗中,以0.1為步長,采用枚舉法討論興趣點相關(guān)度的權(quán)重系數(shù).首先令θ1=0.1,分別令θ2=0.1、0.2、…、0.8,θ3=0.8、0.7、…、0.1,然后令θ1=0.2,分別令θ2=0.1、0.2、…、0.7,θ3=0.7、0.6、…、0.1,再令θ1=0.3,分別令θ2=0.1、0.2、…、0.6,θ3=0.6、0.5、…、0.1,以此類推.經(jīng)測得,當θ1=0.8、θ2=0.1、θ3=0.1時在準確率召回率指標上取得較好的結(jié)果,因此選取0.8、0.1、0.1作為地理相關(guān)度、社會相關(guān)度以及評論相關(guān)度的權(quán)重系數(shù);而PFM中的參數(shù)根據(jù)文獻[23]中的最優(yōu)參數(shù)設定,αk=20、βk=0.2,該參數(shù)經(jīng)過測試,同樣適用于本文所用數(shù)據(jù)集;在k-means聚類中,本

【參考文獻】:
期刊論文
[1]融合地理-社會關(guān)系的空間聚類方法[J]. 唐延歡,孟祥福,張霄雁,畢崇春,唐曉亮.  小型微型計算機系統(tǒng). 2017(11)
[2]基于用戶的協(xié)同過濾算法的推薦效率和個性化改進[J]. 王成,朱志剛,張玉俠,蘇芳芳.  小型微型計算機系統(tǒng). 2016(03)
[3]面向微博系統(tǒng)的實時個性化推薦[J]. 高明,金澈清,錢衛(wèi)寧,王曉玲,周傲英.  計算機學報. 2014(04)
[4]一種基于LDA的社區(qū)問答問句相似度計算方法[J]. 熊大平,王健,林鴻飛.  中文信息學報. 2012(05)
[5]結(jié)合詞義的文本特征詞權(quán)重計算方法[J]. 李明濤,羅軍勇,尹美娟,路林.  計算機應用. 2012(05)
[6]一種基于WordNet的短文本語義相似性算法[J]. 翟延冬,王康平,張東娜,黃嵐,周春光.  電子學報. 2012(03)
[7]一種結(jié)合詞項語義信息和TF-IDF方法的文本相似度量方法[J]. 黃承慧,印鑒,侯昉.  計算機學報. 2011(05)
[8]基于常問問題集的中文問答系統(tǒng)研究[J]. 秦兵,劉挺,王洋,鄭實福,李生.  哈爾濱工業(yè)大學學報. 2003(10)



本文編號:3262905

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3262905.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b8292***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com