天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于活動(dòng)軌跡嵌入的用戶行為分析

發(fā)布時(shí)間:2021-11-16 11:00
  由于智能設(shè)備和無(wú)線通信技術(shù)的普及,產(chǎn)生了大量描述物體運(yùn)動(dòng)歷史的時(shí)空軌跡。其中,活動(dòng)軌跡通過關(guān)聯(lián)活動(dòng)信息與時(shí)空軌跡來(lái)豐富傳統(tǒng)的軌跡數(shù)據(jù)。這些軌跡數(shù)據(jù)包含有大量的用戶活動(dòng)信息,能夠加深我們對(duì)人類行為的理解。然而現(xiàn)有的時(shí)空軌跡研究,忽略了豐富的用戶活動(dòng)信息,缺少對(duì)用戶行為的個(gè)性化分析。因此,在本文中,我們利用活動(dòng)軌跡的時(shí)間和活動(dòng)屬性來(lái)建模用戶活動(dòng),分析用戶行為相似性以及預(yù)測(cè)用戶行為狀態(tài)?傮w來(lái)講,本文的主要貢獻(xiàn)如下:(1)在用戶行為相似度任務(wù)中,以往工作主要采用活動(dòng)地點(diǎn)的時(shí)間和空間信息,忽略了和用戶行為關(guān)聯(lián)最緊密的活動(dòng)信息。因此,本文提出了基于活動(dòng)軌跡嵌入的用戶行為相似度算法,該算法首先利用高斯混合模型擬合活動(dòng)時(shí)間分布并將時(shí)間進(jìn)行分段,然后根據(jù)滑動(dòng)窗口掃描用戶活動(dòng)軌跡獲取用戶和軌跡特征,最終基于散列的相似度計(jì)算方法來(lái)比較用戶之間的行為相似度。大量的實(shí)驗(yàn)驗(yàn)證了我們提出方法的性能和效率。(2)在用戶行為預(yù)測(cè)任務(wù)中,已有工作主要通過用戶歷史活動(dòng)記錄以及社交關(guān)系來(lái)進(jìn)行預(yù)測(cè),缺乏對(duì)用戶行為偏好的挖掘。因此,本文提出了基于活動(dòng)軌跡嵌入的用戶行為預(yù)測(cè)算法,該算法首先通過段向量模型提取用戶行為偏好特征,然后... 

【文章來(lái)源】:蘇州大學(xué)江蘇省 211工程院校

【文章頁(yè)數(shù)】:68 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于活動(dòng)軌跡嵌入的用戶行為分析


圖1-1用戶行為研究整體框架??

身高,學(xué)生,高斯混合模型,高斯分布


基于活動(dòng)軌跡嵌入的用戶行為分析?第二章相關(guān)概念及方法??高斯混合模型由多個(gè)高斯分布組合而成,理論上它可以模擬任意類型的分布。高斯??分布也被叫做正態(tài)分布,是一種最常見的分布形式。通常一個(gè)班級(jí)學(xué)生的身高,考??試成績(jī)大多符合高斯分布。高斯混合模型是對(duì)高斯分布進(jìn)行簡(jiǎn)單的拓展,通過多個(gè)??高斯分布的線性組合來(lái)表達(dá)更復(fù)雜的數(shù)據(jù)分布特征。??高斯混合模型的概率分布形式可以表示為如下公式,??K??P(y\e)?=?Yj?aM〇k)?(2.D??k=\??其中,叫是混合系數(shù),并且需要滿足叫>〇和的=丨。0(J防)是混合模型的第々??個(gè)分模型,代表一個(gè)正態(tài)分布。它是高斯分布密度函數(shù),民=(凡,d),公式如下表??示。??參士於聲>?(2.2)??舉一個(gè)簡(jiǎn)單的例子,如圖2-1所示,藍(lán)色線段表示女生身高分布,綠色線段表示男生??身高分布,由于男生和女生之間身高分布存在一定差異,所以當(dāng)表示整個(gè)班級(jí)學(xué)生??身高分布時(shí)無(wú)法使用-個(gè)單一的高斯分布來(lái)擬合,因此可以使用男生和女生身高分??布的線性組合表示。??1.3?1.4?1.5?1.6?1.7?1.8?1.9?2.0??圖2-1學(xué)生身高分布??高斯混合模型常被用于聚類應(yīng)用,GMM中的K個(gè)分模型相當(dāng)于K個(gè)類別,因此??可以使用數(shù)據(jù)來(lái)估算概率密度。當(dāng)在GMM中隨機(jī)選取一個(gè)點(diǎn),這個(gè)點(diǎn)屬于每個(gè)子模??11??

框架圖,模型結(jié)構(gòu),向量,框架


絡(luò)結(jié)構(gòu),包括輸入層、隱藏層和輸出層。它根據(jù)單詞詞頻使用Huffman來(lái)編碼,??使得所有詞頻相似的詞語(yǔ)隱藏層激活的內(nèi)容相似,出現(xiàn)頻率越高的詞語(yǔ),它們激??活的隱藏層數(shù)目越少,這樣可以有效降低模型復(fù)雜度。Word2VeC模型的高效性深??受大眾喜愛。Word2vec模型使用了兩種建模方法,ContinousBagofWords?(CBOW)??和Skip-gram。CBOW的目標(biāo)是根據(jù)上下文來(lái)預(yù)測(cè)當(dāng)前詞語(yǔ)的概率,而Skip-gram則剛??好相反,它根據(jù)當(dāng)前詞語(yǔ)來(lái)預(yù)測(cè)上下文的概率(模型如圖2-2所示)。兩種方法的預(yù)??測(cè)任務(wù)通常使用一個(gè)多分類器,例如Softmax函數(shù)。Word2vec模型訓(xùn)練出的單詞表征??可以一定程度上發(fā)現(xiàn)詞之間的語(yǔ)義關(guān)系(比如,“國(guó)王”“男人”?+?“女人”王??后”)。W〇rd2vec模型對(duì)詞向量進(jìn)行了平均化處理,它忽略了單詞間排序的影響,也??就是說(shuō)它只是基于詞的維度進(jìn)行語(yǔ)義分析,而不具有上下文的語(yǔ)義分析能力。??Input?Projection?Output?Input?Projection?Output??W(t-2)?W(t-2)??w(t-i)?_1}?????W(t)?W(t)?????W(t+1)?,?y/?SUM?W(t+1)??W(t+2)?<?"?W(t+2)??CBOW?Skip-gram??圖2-2詞向量模型結(jié)構(gòu)框架??13??

【參考文獻(xiàn)】:
期刊論文
[1]基于位置軌跡數(shù)據(jù)的用戶相似性分析[J]. 賈若然,劉曙光,孫啟龍.  計(jì)算機(jī)與數(shù)字工程. 2016(08)
[2]基于LCS的用戶時(shí)空行為興趣相似性計(jì)算方法[J]. 李曉靜,張曉濱.  計(jì)算機(jī)工程與應(yīng)用. 2013(20)
[3]基于位置的社交網(wǎng)絡(luò)用戶軌跡相似性算法[J]. 張瑩,李智,張省.  四川大學(xué)學(xué)報(bào)(工程科學(xué)版). 2013(S2)
[4]基于路網(wǎng)的LBSN用戶移動(dòng)軌跡聚類挖掘方法[J]. 鄒永貴,萬(wàn)建斌,夏英.  計(jì)算機(jī)應(yīng)用研究. 2013(08)



本文編號(hào):3498755

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3498755.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶678e5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com