天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

社交媒體用戶識(shí)別方法研究

發(fā)布時(shí)間:2021-01-02 20:00
  伴隨著移動(dòng)網(wǎng)絡(luò)技術(shù)的發(fā)展,社交媒體用戶數(shù)量迎來了爆炸式增長(zhǎng),社交媒體已然成為存儲(chǔ)用戶信息的龐大數(shù)據(jù)庫。社交媒體用戶識(shí)別是指對(duì)用戶的賬號(hào)信息、屬性信息、心理狀況和行為習(xí)慣等相關(guān)內(nèi)容進(jìn)行識(shí)別。出于不同的社交目的,同一用戶通常會(huì)在不同的社交應(yīng)用中注冊(cè)多個(gè)賬號(hào),并且有可能提供不同的身份信息。通過社交媒體用戶識(shí)別技術(shù)匹配不同平臺(tái)的用戶賬號(hào),構(gòu)建全面的用戶信息庫,從而為商品推薦、信息檢索和網(wǎng)絡(luò)空間監(jiān)管等下游應(yīng)用提供有效支撐。同時(shí)出于保護(hù)個(gè)人隱私的考慮,用戶往往會(huì)選擇隱藏個(gè)人信息,這導(dǎo)致用戶某些有價(jià)值的屬性信息難以直接獲取。通過社交媒體用戶識(shí)別技術(shù)對(duì)用戶缺失的屬性信息進(jìn)行推測(cè),能夠進(jìn)一步完善用戶信息庫,從而更加全面地了解用戶。本文針對(duì)社交媒體用戶識(shí)別問題,從跨社交媒體的用戶賬號(hào)匹配和社交媒體用戶屬性識(shí)別兩方面開展研究,主要貢獻(xiàn)包括如下兩方面內(nèi)容:(1)提出了一種基于維特比算法的社交媒體賬號(hào)匹配方法。傳統(tǒng)的賬號(hào)匹配方法存在著匹配效率低下和多平臺(tái)賬號(hào)匹配準(zhǔn)確率低的問題。本論文通過以下三個(gè)步驟解決了傳統(tǒng)方法存在的問題。首先,該方法基于賬號(hào)用戶名相似性構(gòu)建候選匹配賬號(hào)集合,通過縮小候選匹配賬號(hào)集合的大小解決... 

【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:73 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

社交媒體用戶識(shí)別方法研究


圖卷積網(wǎng)絡(luò)算法框架圖

示意圖,地理位置,示意圖,邊界框


電子科技大學(xué)碩士學(xué)位論文24上述三種情況的公式化定義如(3-11)所示。1212212112122Bbox()/Bbox()ifBbox()Bbox()Bbox()/Bbox()ifBbox()Bbox()score1/(1)if,0.0locllllllllllll=+在一個(gè)國家其它(3-11)根據(jù)上述公式,假如,1l=“NewYork”,2l=“Manhattan”,由于Manhattan是NewYork的一個(gè)行政區(qū),NewYork的邊界框覆蓋了Manhattan區(qū)域,則這兩個(gè)地理位置的相似度值為兩個(gè)區(qū)域的面積的比值。假如,1l=“Athens”,2l=“Logan”,如圖3-5所示,兩個(gè)地理位置屬于同一個(gè)國家,但兩個(gè)地理位置的邊界框不重合則使用邊界框中心的歐幾里得距離進(jìn)行計(jì)算,其中122ll表示兩個(gè)邊界框中心的的歐幾里得距離。圖3-5地理位置示意圖(3)教育工作信息教育工作信息由用戶就職的公司和受教育的學(xué)校組成。Linkedin是一個(gè)專業(yè)的職場(chǎng)社交網(wǎng)站,用戶通常會(huì)選擇公開其教育和工作經(jīng)歷,F(xiàn)acebook網(wǎng)站的個(gè)人信息頁也要求用戶填寫教育和工作經(jīng)歷,雖然Twitter的個(gè)人信息頁面不包含教育和工作經(jīng)歷,但用戶經(jīng)常會(huì)在其推文中提及(@)其公司和學(xué)校,我們可以從推文中提取@信息作為工作和教育信息的來源。因此可以通過上述方式獲得用戶在不同社交平臺(tái)上的教育工作信息集合,例如,用戶PeterMullen對(duì)應(yīng)的三個(gè)集合為SetL={CNNInternational,CNN,BBC,NewYorkTimes,UniversityofColumbia},SetF

用戶信息,網(wǎng)站,頁面,賬號(hào)


第三章基于維特比算法的社交媒體賬號(hào)匹配29維特比算法是一種動(dòng)態(tài)規(guī)劃算法,通過記錄中間狀態(tài)的最短路經(jīng)對(duì)匹配路徑不斷進(jìn)行剪枝大大降低了在匹配網(wǎng)絡(luò)中尋找最短路的時(shí)間復(fù)雜度,使用維特比算法進(jìn)行求解的時(shí)間復(fù)雜度為()2KN,其時(shí)間復(fù)雜度與K呈線性關(guān)系。綜上所述,基于維特比算法的社交媒體賬號(hào)匹配方法的整體時(shí)間復(fù)雜度為()2KN。在實(shí)際應(yīng)用中,本論文方法通過使用維特比算法極大地降低了多平臺(tái)賬號(hào)匹配的時(shí)間復(fù)雜度,同時(shí)可以通過設(shè)定D和p的大小來控制N值的大小將本論文算法的時(shí)間消耗控制在可以接受的范圍。3.6實(shí)驗(yàn)評(píng)估3.6.1實(shí)驗(yàn)數(shù)據(jù)和評(píng)估指標(biāo)為了驗(yàn)證基于維特比算法的社交媒體賬號(hào)匹配方法的有效性,需要對(duì)一批具有真實(shí)匹配關(guān)系的賬號(hào)進(jìn)行測(cè)試。目前通常使用眾包平臺(tái)和問卷調(diào)查的方式獲得具有真實(shí)匹配關(guān)系的社交賬號(hào),但是使用這兩種方式獲得可靠匹配賬號(hào)的難度較大。經(jīng)過調(diào)研發(fā)現(xiàn)很多網(wǎng)站提供個(gè)人聯(lián)系信息匯總服務(wù),如圖3-8所示,Rocketreach是一個(gè)聯(lián)系信息匯總網(wǎng)站,用戶在該網(wǎng)站上注冊(cè)賬號(hào)時(shí)需要提供指向其他社交平臺(tái)的個(gè)人主頁鏈接,從該網(wǎng)站的用戶信息頁面能夠獲得該用戶在不同平臺(tái)的社交賬號(hào)。因此本論文從Rocketreach網(wǎng)站上收集匹配賬號(hào)構(gòu)建測(cè)試數(shù)據(jù)集。圖3-8RocketSearch網(wǎng)站用戶信息頁面本論文一共在RocketSearch網(wǎng)站收集了6427個(gè)社交賬號(hào),這些社交賬號(hào)來自于Facebook,Twitter,Linkedin,Github,Quora和Instagram等社交平臺(tái),不同社交平臺(tái)賬號(hào)占比統(tǒng)計(jì)數(shù)據(jù)如表3-8所示。

【參考文獻(xiàn)】:
期刊論文
[1]基于信息熵的跨社交網(wǎng)絡(luò)用戶身份識(shí)別方法[J]. 吳錚,于洪濤,劉樹新,朱宇航.  計(jì)算機(jī)應(yīng)用. 2017(08)
[2]基于用戶名特征的用戶身份同一性判定方法[J]. 劉東,吳泉源,韓偉紅,周斌.  計(jì)算機(jī)學(xué)報(bào). 2015(10)
[3]基于多屬性決策的社交網(wǎng)絡(luò)用戶識(shí)別(英文)[J]. 葉娜,張銀亮,董麗麗,邊根慶,Enjie LIU,Gordon J.Clapworthy.  中國通信. 2013(12)



本文編號(hào):2953544

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2953544.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4cd16***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com