社會化媒體用戶隱含屬性識別技術(shù)研究
發(fā)布時(shí)間:2020-12-14 21:35
現(xiàn)今,社會化媒體的普及,積累了規(guī)模龐大且具有價(jià)值的用戶數(shù)據(jù)資源。海量的異構(gòu)數(shù)據(jù)給學(xué)術(shù)界在大數(shù)據(jù)挖掘領(lǐng)域帶來了新的突破點(diǎn),社會化媒體用戶隱含屬性識別任務(wù)也應(yīng)運(yùn)而生。社會化媒體用戶隱含屬性識別是指運(yùn)用現(xiàn)有的規(guī)模數(shù)據(jù)自動推斷出社會化媒體用戶群體的未知屬性與潛在特質(zhì);谖⒉⒅醪煌挠脩魯(shù)據(jù),本文有針對性地提出了以下兩種方法:1.基于Labeled LDA模型的社會化媒體用戶隱含屬性識別方法本文運(yùn)用Labeled LDA模型識別知乎社區(qū)這一社會化媒體的用戶的隱含屬性——職業(yè)傾向。與微博用戶文本數(shù)據(jù)相比較,知乎社區(qū)用戶文本多為成千上萬的長文本數(shù)據(jù)且規(guī)模龐大,需進(jìn)行復(fù)雜的數(shù)據(jù)清洗才能投入實(shí)驗(yàn)。本文嘗試?yán)糜脩舻男袨樘卣鳌劢z用戶對“意見領(lǐng)袖”用戶的關(guān)注行為進(jìn)行隱含屬性——職業(yè)傾向的識別。因用戶的各個行業(yè)存在規(guī)范文本,本文可直接利用現(xiàn)有的規(guī)范文本作為標(biāo)簽,運(yùn)用Labeled LDA模型進(jìn)行識別任務(wù)。利用用戶的行為特征進(jìn)行隱含屬性職業(yè)傾向識別。該識別系統(tǒng)的準(zhǔn)確度比利用文本統(tǒng)計(jì)特征的方法高5個百分點(diǎn)。2.基于遞歸神經(jīng)網(wǎng)絡(luò)的社會化媒體用戶隱含屬性識別方法該方法基于遞歸神經(jīng)網(wǎng)絡(luò),融合多種特征進(jìn)行社會化...
【文章來源】:西北師范大學(xué)甘肅省
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【部分圖文】:
演員劉昊然微博部分信息圖2-1展示出微博用戶劉昊然的昵稱、圖像與個人簡介等信息
已經(jīng)成為新媒體的發(fā)展方式,F(xiàn)有的微博、百度問答等內(nèi)個開放性且具有問答屬性的網(wǎng)絡(luò)社區(qū),知乎用戶們圍繞著關(guān)的探討與交流,知乎用戶具有專業(yè)性、精英化的屬性。一個能獲取真實(shí)有效的專業(yè)性知識的平臺,在這內(nèi)容為王了用戶的專業(yè)性需求。用戶使用知乎的“贊同”“反對”高低,篩選出高質(zhì)量內(nèi)容。在知乎成立之前,國外的 Quo推薦機(jī)制。分三類,一類熱衷于生產(chǎn)內(nèi)容,一類喜歡閱讀高質(zhì)量內(nèi)容的結(jié)合體。乎用戶所在行業(yè)戶為了讓自己的答案和文章能獲得認(rèn)可與推薦,多數(shù)會填括但不限于所在行業(yè)、職業(yè)經(jīng)歷、教育經(jīng)歷、個人簡介等
本文編號:2917050
【文章來源】:西北師范大學(xué)甘肅省
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【部分圖文】:
演員劉昊然微博部分信息圖2-1展示出微博用戶劉昊然的昵稱、圖像與個人簡介等信息
已經(jīng)成為新媒體的發(fā)展方式,F(xiàn)有的微博、百度問答等內(nèi)個開放性且具有問答屬性的網(wǎng)絡(luò)社區(qū),知乎用戶們圍繞著關(guān)的探討與交流,知乎用戶具有專業(yè)性、精英化的屬性。一個能獲取真實(shí)有效的專業(yè)性知識的平臺,在這內(nèi)容為王了用戶的專業(yè)性需求。用戶使用知乎的“贊同”“反對”高低,篩選出高質(zhì)量內(nèi)容。在知乎成立之前,國外的 Quo推薦機(jī)制。分三類,一類熱衷于生產(chǎn)內(nèi)容,一類喜歡閱讀高質(zhì)量內(nèi)容的結(jié)合體。乎用戶所在行業(yè)戶為了讓自己的答案和文章能獲得認(rèn)可與推薦,多數(shù)會填括但不限于所在行業(yè)、職業(yè)經(jīng)歷、教育經(jīng)歷、個人簡介等
本文編號:2917050
本文鏈接:http://sikaile.net/xinwenchuanbolunwen/2917050.html
最近更新
教材專著