天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

社交網(wǎng)絡(luò)中的用戶地址預(yù)測(cè)

發(fā)布時(shí)間:2021-01-19 18:49
  在社交網(wǎng)絡(luò)中,用戶的實(shí)際地理位置往往出現(xiàn)在各種應(yīng)用場(chǎng)景中,例如,基于地址的時(shí)事、以及名勝古跡的推薦。然而,出于對(duì)個(gè)人隱私的保護(hù),只有少量的用戶才回在社交平臺(tái)上發(fā)布自己的實(shí)時(shí)位置。因此,為了得到用戶較為精確的位置以便于向基于地址應(yīng)用提供服務(wù),本文提出了一個(gè)通過(guò)挖掘用戶發(fā)布在社交平臺(tái)上的信息對(duì)其所處地理位置進(jìn)行預(yù)測(cè)的框架。該框架從三個(gè)不同的角度出發(fā)來(lái)構(gòu)建相應(yīng)的模型,分別是:基于內(nèi)容的模型,基于時(shí)間序列的模型以及基于內(nèi)容和時(shí)間的聯(lián)合模型。在基于內(nèi)容的模型中,我們用文本相關(guān)的算法衡量語(yǔ)義與地址之間的關(guān)系,并過(guò)濾掉與地址無(wú)關(guān)的內(nèi)容以進(jìn)一步加強(qiáng)文本與地址之間的關(guān)聯(lián)。在基于時(shí)序的模型中利用用戶歷史數(shù)據(jù)來(lái)挖掘其日常行為習(xí)慣,通過(guò)分析用戶行為規(guī)律來(lái)預(yù)測(cè)當(dāng)前時(shí)刻所處位置;跁r(shí)序與文本特征融合了前兩個(gè)模型,同時(shí)從這兩種特征中獲取地址信息。在本論文用戶地址預(yù)測(cè)任務(wù)中,主要的研究工作分為以下四個(gè)部分。(一)對(duì)爬取到的原始數(shù)據(jù)進(jìn)行過(guò)濾,過(guò)濾出不包含任何地址相關(guān)詞的微博。并定義地址相關(guān)詞概念,即通過(guò)關(guān)鍵詞提取算法找出和地址關(guān)聯(lián)性較強(qiáng)的單詞。(二)對(duì)用戶微博文本內(nèi)容進(jìn)行數(shù)據(jù)處理,如分詞、去停止詞。改進(jìn)已有的word... 

【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:81 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

社交網(wǎng)絡(luò)中的用戶地址預(yù)測(cè)


word2vec采用的兩種詞向量生成模型

訓(xùn)練模型,權(quán)重矩陣


圖 2-2 CBOW 訓(xùn)練模型單詞的 one-hot 向量,這些向量通過(guò)一個(gè)相同的輸入權(quán)重矩陣 × ,陣乘積加權(quán)平均后作為隱層向量;再由輸出權(quán)重矩陣 × ′和激活函率分布,最終以最大概率的 index 所指向的單詞作為預(yù)測(cè)的中心詞,詞詞向量則是由該單詞 one-hot 與權(quán)重矩陣乘積而來(lái)。Skip-gramip-gram 模型只是逆轉(zhuǎn)了 CBOW 模型的因果關(guān)系,即已知當(dāng)前詞語(yǔ)單詞,因此模型的輸入是當(dāng)前值,而輸出是該詞的上下文。訓(xùn)練樣本t 向量作為模型的輸入,同 CBOW 模型一樣,在該模型中也假設(shè)給定到的詞表大小為 10000,預(yù)期得到的詞向量維數(shù)是 300,那么隱層參 × 。由于 one-hot 向量的表達(dá)形式,隱層的權(quán)重矩陣也可以有詞的詞向量矩陣。于是該模型的具體訓(xùn)練模型可以由圖 2-3 表示

訓(xùn)練模型


圖 2-3 Skip-gram 訓(xùn)練模型以上兩個(gè)小節(jié)分別介紹了 word2vec 中兩種常用模型在基于神經(jīng)網(wǎng)絡(luò)的思得詞向量矩陣。但這樣的模型需要在輸出層進(jìn)行 計(jì)算輸出概率的詞,計(jì)算量很大,處理過(guò)程耗時(shí)。因此訓(xùn)練過(guò)程中使用經(jīng)過(guò)優(yōu)化的數(shù)據(jù)結(jié)構(gòu)和的方式來(lái)進(jìn)行優(yōu)化改進(jìn)。.3 卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)是一種包含卷積計(jì)有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一[24,25]。現(xiàn)在 CNN 為眾多科學(xué)領(lǐng)域、特別是模式分類領(lǐng)域的研究熱點(diǎn)之一,例如圖像分類、目和檢測(cè)等。并且網(wǎng)絡(luò)越來(lái)越廣泛的應(yīng)用也是由于其避免了對(duì)數(shù)據(jù)加載的復(fù)處理。目前,CNN 在計(jì)算機(jī)視覺領(lǐng)域已經(jīng)取得了很大的進(jìn)展,同時(shí)也逐漸語(yǔ)言處理(NLP)中得到不錯(cuò)的成績(jī)。本論文將依據(jù)用戶微博文本特征來(lái)預(yù)測(cè)的任務(wù),通過(guò)卷積神經(jīng)網(wǎng)絡(luò)框架轉(zhuǎn)換成了文本分類任務(wù)。

【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)激活函數(shù)的卷積神經(jīng)網(wǎng)絡(luò)研究[J]. 曲之琳,胡曉飛.  計(jì)算機(jī)技術(shù)與發(fā)展. 2017(12)
[2]基于Word2Vec的一種文檔向量表示[J]. 唐明,朱磊,鄒顯春.  計(jì)算機(jī)科學(xué). 2016(06)



本文編號(hào):2987527

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/2987527.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3f75b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com