基于興趣標(biāo)簽的緘默用戶性別預(yù)測研究
發(fā)布時間:2018-01-07 13:10
本文關(guān)鍵詞:基于興趣標(biāo)簽的緘默用戶性別預(yù)測研究 出處:《華中科技大學(xué)學(xué)報(自然科學(xué)版)》2015年12期 論文類型:期刊論文
更多相關(guān)文章: 數(shù)據(jù)挖掘 性別預(yù)測 緘默用戶 興趣標(biāo)簽 概念類
【摘要】:為解決社交媒體中緘默用戶的性別預(yù)測問題,提出利用用戶文件夾中的興趣標(biāo)簽進(jìn)行區(qū)分的方法.針對標(biāo)簽存在稀疏和歧義性的特點,設(shè)計了一種基于概念類推斷用戶性別的框架.首先依據(jù)社交心理特征將標(biāo)簽劃分為若干概念類;其次通過關(guān)聯(lián)挖掘方法擴(kuò)充概念類;最后通過概念類壓縮用戶特征空間.在新浪微博真實數(shù)據(jù)集上進(jìn)行驗證,實驗結(jié)果表明:所提方法對于緘默用戶性別有顯著的區(qū)分效果,在不使用任何微博信息的條件下,區(qū)分準(zhǔn)確率達(dá)到71%.
[Abstract]:In order to solve the tacit social media users in the gender prediction problem, put forward to distinguish the method using user folder in tag. According to the characteristics of the label has been sparse and ambiguous, is designed based on the concept of a class inference framework. Firstly based on the gender feature label heart agency is divided into several concepts; the second method expand the concept class through association mining; finally, the concept of compressed feature space. To verify the user in Sina micro-blog real datasets. The experimental results show that the proposed method has a significant effect on gender distinction in silence, do not use any micro-blog information, distinguish the accuracy rate of 71%.
【作者單位】: 武漢大學(xué)軟件工程國家重點實驗室;
【基金】:國家自然科學(xué)基金資助項目(61272275,61232002,61202036,61272110)
【分類號】:TP311.13;TP393.092
【正文快照】: 隨著社交媒體的普及,用戶肖像在近幾年引起了大量研究者的研究興趣[1-3].用戶肖像用于預(yù)測一個用戶的人口特征,例如年齡、性別、職業(yè)、教育和政治傾向等.其中性別作為最重要的特征,引發(fā)了大量的研究關(guān)注[4-7].現(xiàn)有方法主要依賴文本內(nèi)容來建立特征向量,然而許多社交媒體中,用戶,
本文編號:1392678
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1392678.html
最近更新
教材專著