社會化標(biāo)注中用戶動態(tài)興趣主題挖掘
本文關(guān)鍵詞:社會化標(biāo)注中用戶動態(tài)興趣主題挖掘 出處:《浙江理工大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 社會化標(biāo)注 社會化標(biāo)簽 用戶興趣 主題模型 興趣漂移
【摘要】:在社會化標(biāo)注中,用戶采用標(biāo)簽的方式對自己感興趣的資源基于自身理解進(jìn)行無約束標(biāo)注,標(biāo)簽作為用戶所選擇的關(guān)鍵詞,反映了用戶對信息資源的看法及其興趣所在。用戶興趣的發(fā)現(xiàn)獲取是個(gè)性化推薦的基礎(chǔ)和核心,現(xiàn)有研究主要聚焦于從數(shù)量和結(jié)構(gòu)上考慮用戶與標(biāo)簽的關(guān)系,而實(shí)際情況往往是,標(biāo)簽只是反映用戶興趣的一個(gè)單一詞匯,用戶的興趣往往是由多個(gè)標(biāo)簽形成的集合所刻畫的主題,而且標(biāo)簽隨用戶標(biāo)注時(shí)序動態(tài)變化的特點(diǎn)也會影響用戶興趣的刻畫。因此本文結(jié)合國家自然科學(xué)基金項(xiàng)目“泛在計(jì)算環(huán)境中社會化驅(qū)動的情境感知個(gè)性化信息服務(wù)研究”(項(xiàng)目編號:71471165),研究了社會化標(biāo)注中用戶動態(tài)興趣主題的挖掘,系統(tǒng)地闡述了用戶興趣主題模型的構(gòu)建方法,提出了基于動態(tài)標(biāo)簽關(guān)聯(lián)指標(biāo)來挖掘有效的用戶興趣主題并展開實(shí)驗(yàn)研究。本文的主要工作和貢獻(xiàn)如下:(1)構(gòu)建了主題模型獲取標(biāo)簽主題。以“用戶-標(biāo)簽”二元關(guān)系為基礎(chǔ),把用戶標(biāo)注信息作為語料庫,標(biāo)簽被看作是這個(gè)語料庫中的詞,從而構(gòu)建LDA模型挖掘潛在的標(biāo)簽主題。將原本雜亂無章、動態(tài)變化的標(biāo)簽劃分成具有主題的簇,從而克服標(biāo)簽本身的不確定性和不一致性。(2)提出了動態(tài)關(guān)聯(lián)指標(biāo)獲取用戶標(biāo)簽興趣。建立關(guān)聯(lián)空間模型來描述用戶與標(biāo)簽集的聯(lián)系,通過分析社會化標(biāo)簽系統(tǒng)的具有時(shí)序特征的標(biāo)注過程,考慮標(biāo)簽的時(shí)序特征,定義了反映數(shù)量特征的強(qiáng)度指標(biāo)和反映時(shí)間變化的穩(wěn)定性指標(biāo),通過動態(tài)關(guān)聯(lián)指標(biāo)獲取用戶動態(tài)標(biāo)簽興趣。(3)用戶動態(tài)興趣主題挖掘。結(jié)合標(biāo)簽主題模型和用戶動態(tài)標(biāo)簽興趣,將兩者進(jìn)行相似性計(jì)算,得到用戶動態(tài)興趣主題,從而有效地實(shí)現(xiàn)了用戶標(biāo)簽集到用戶興趣主題的動態(tài)對應(yīng)。(4)選取來自Last.fm社會化標(biāo)注平臺中真實(shí)的用戶標(biāo)注數(shù)據(jù),開展用戶興趣主題挖掘的實(shí)驗(yàn)研究,利用覆蓋度Acc和準(zhǔn)確率Rec對本文提出的基于動態(tài)關(guān)聯(lián)指標(biāo)挖掘的用戶興趣主題模型的有效性進(jìn)行驗(yàn)證。研究表明,本文提出的基于動態(tài)關(guān)聯(lián)指標(biāo)挖掘的用戶興趣主題在有效性方面有較好表現(xiàn),且明顯優(yōu)于基于TF方法和基于TF-IDF方法挖掘的用戶興趣主題,研究結(jié)果對于個(gè)性化推薦具有較高的實(shí)踐應(yīng)用價(jià)值。
[Abstract]:In social tagging, users use tags to label the resources they are interested in based on their own understanding. Tags are the keywords chosen by users. The discovery of user's interest is the basis and core of personalized recommendation. The existing research mainly focuses on the relationship between user and label in terms of quantity and structure. However, the actual situation is that tags are only a single word that reflects the interests of the user, and the interest of the user is often described by a collection of multiple tags. Moreover, the characteristics of label dynamic change with user tagging time series will also affect the description of user interest. Therefore, this paper combines with the National Natural Science Foundation of China. " Research on social-driven context-aware personalized information service in pervasive computing environment "(. Item No.: 71471165). This paper studies the mining of user's dynamic topic of interest in social tagging, and systematically expounds the method of constructing user's topic of interest model. In this paper, we propose a dynamic tag association index to mine effective user interest topics and carry out experimental research. The main work and contributions of this paper are as follows: 1). The topic model is constructed to get the label theme, which is based on the "user-tag" binary relationship. The user tagged information is regarded as the corpus, and the tag is regarded as the word in the corpus, thus the LDA model is constructed to mine the potential tag topics. Dynamically changing labels are divided into clusters with themes. In order to overcome the uncertainty and inconsistency of label itself, the dynamic association index is proposed to get user tag interest. The association space model is established to describe the relationship between user and tag set. By analyzing the tagging process of the social label system with time series characteristics and considering the time sequence characteristics of the label, the strength index reflecting the quantitative feature and the stability index reflecting the change of time are defined. Through dynamic association index to obtain user dynamic tag interest. 3) user dynamic interest topic mining. Combining tag topic model and user dynamic label interest, the similarity between them is calculated. Get user dynamic topic of interest, thus effectively realize the user tag set to user topic of interest dynamic correspondence. 4) select the real user tagging data from Last.fm social tagging platform. The experimental research of user topic of interest mining is carried out, and the validity of user topic of interest model based on dynamic association index mining is verified by using coverage Acc and accurate rate Rec. The topic of user interest based on dynamic association index mining presented in this paper has a good performance in terms of effectiveness, and is obviously better than that based on TF method and TF-IDF method mining user topic of interest. The research results have high practical value for personalized recommendation.
【學(xué)位授予單位】:浙江理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.1;F49
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王杰;使圖像的編輯更加容易[J];中文信息;1998年Z1期
2 王波,姚敏;基于信息抽取的匿名用戶興趣描述[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年S1期
3 董全德;;用戶興趣遷移模式與個(gè)性化服務(wù)[J];電腦知識與技術(shù)(學(xué)術(shù)交流);2007年17期
4 鄭運(yùn)剛;馬建國;;基于分類的用戶興趣漂移模型[J];情報(bào)雜志;2008年01期
5 張濤;;基于瀏覽歷史的用戶興趣提取模型[J];軟件導(dǎo)刊;2009年06期
6 楊杰;陳恩紅;;面向個(gè)性化服務(wù)的用戶興趣偏移檢測及處理方法[J];電子技術(shù);2009年11期
7 陳圣兵;李龍澍;紀(jì)霞;;多層次用戶興趣模式的動態(tài)捕捉[J];計(jì)算機(jī)工程與應(yīng)用;2009年36期
8 鄭曉健;龐淑英;何英;;一種面向主題的用戶興趣挖掘模型研究[J];昆明學(xué)院學(xué)報(bào);2010年03期
9 花青松;劉海峰;胡錚;;基于基尼系數(shù)的用戶興趣分布模式度量方法[J];計(jì)算機(jī)工程;2012年22期
10 孫雨生;劉偉;仇蓉蓉;黃傳慧;;國內(nèi)用戶興趣建模研究進(jìn)展[J];情報(bào)雜志;2013年05期
相關(guān)會議論文 前7條
1 趙琦;駱志剛;田文穎;李聰;丁凡;;一種基于負(fù)反饋信息的用戶興趣模型修正方法[A];中國通信學(xué)會第六屆學(xué)術(shù)年會論文集(下)[C];2009年
2 孫靜;郭奇;張志強(qiáng);馮建華;;一種基于面向領(lǐng)域檢索系統(tǒng)的用戶興趣獲取方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2004年
3 孫鐵利;教巍巍;;基于馬爾科夫模型的用戶興趣導(dǎo)航模型系統(tǒng)(英文)[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展——全國第17屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會議論文集(上冊)[C];2006年
4 廖祝華;劉建勛;易愛平;;基于用戶興趣的Web服務(wù)發(fā)現(xiàn)[A];2006年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會議論文集(三)[C];2006年
5 李曉黎;史忠植;梁永全;劉福桃;;INTERNET網(wǎng)上一種識別用戶興趣的學(xué)習(xí)方法[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1999年
6 田萱;杜小勇;;基于SAM模型的用戶興趣表示研究[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2006年
7 王勇;劉奕群;張敏;馬少平;茹立云;;基于用戶興趣分析的網(wǎng)頁生命周期建模(英文)[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
相關(guān)重要報(bào)紙文章 前1條
1 中國科學(xué)院計(jì)算技術(shù)研究所 王 斌;內(nèi)容為王[N];計(jì)算機(jī)世界;2004年
相關(guān)博士學(xué)位論文 前9條
1 梁政;面向在線社交網(wǎng)絡(luò)輿情的信息傳播分析關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2014年
2 張召;在線論壇用戶興趣圖譜發(fā)現(xiàn)與個(gè)性化信息推薦[D];華東師范大學(xué);2012年
3 劉淇;基于用戶興趣建模的推薦方法及應(yīng)用研究[D];中國科學(xué)技術(shù)大學(xué);2013年
4 郭巖;網(wǎng)絡(luò)日志中用戶興趣的挖掘及利用[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年
5 吳麗輝;個(gè)性化的Web信息采集技術(shù)研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
6 謝興;社會網(wǎng)絡(luò)中興趣發(fā)現(xiàn)與信息組織的研究[D];復(fù)旦大學(xué);2011年
7 李東勝;基于興趣與保護(hù)隱私的在線社區(qū)推薦技術(shù)研究[D];復(fù)旦大學(xué);2012年
8 陳浩;Web搜索的用戶興趣與智能優(yōu)化研究[D];中南大學(xué);2012年
9 姜邵巍;基于競爭關(guān)系的推薦技術(shù)研究[D];北京郵電大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 陳媛媛;用戶興趣圖譜演化機(jī)制研究[D];武漢理工大學(xué);2014年
2 梁潤庭(Runting Leung);面向微博用戶的興趣識別算法的研究與實(shí)現(xiàn)[D];西南交通大學(xué);2015年
3 俞忻峰;新浪微博的數(shù)據(jù)采集和推薦方案研究[D];南京理工大學(xué);2015年
4 楊梅;基于樹型網(wǎng)絡(luò)的多源用戶興趣數(shù)據(jù)融合方法研究[D];四川師范大學(xué);2015年
5 石光蓮;基于形式概念分析的Folksonomy用戶興趣識別研究[D];西南大學(xué);2015年
6 湯文清;微博用戶的興趣及性格分析[D];上海大學(xué);2015年
7 梅佩;基于瀏覽內(nèi)容的用戶興趣研究[D];北京化工大學(xué);2015年
8 張少杰;基于用戶興趣的微博廣告投放系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];山西大學(xué);2015年
9 黃龍偉;基于蟻群算法的WEB日志用戶興趣路徑研究[D];江西師范大學(xué);2015年
10 方正;微博短文本分析技術(shù)研究及應(yīng)用[D];電子科技大學(xué);2014年
,本文編號:1400344
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1400344.html