基于用戶交互關(guān)系的用戶創(chuàng)作內(nèi)容質(zhì)量評估
本文選題:社會網(wǎng)絡(luò)分析 切入點:鏈接分析 出處:《北京郵電大學(xué)》2014年碩士論文 論文類型:學(xué)位論文
【摘要】:隨著Web2.0的發(fā)展日漸成熟,越來越多的網(wǎng)站信息資源依賴于用戶的參與、主導(dǎo)和建設(shè)。這些由用戶自發(fā)創(chuàng)造,并在傳播的過程中不斷豐富和壯大的信息資源被稱為用戶創(chuàng)作內(nèi)容(User-generated content, UGC)。目前,針對UGC的相關(guān)理論研究得到了各行業(yè)廣泛的關(guān)注和重視,同時也取得了很多有價值的研究成果。但是由于UGC具有人人均可參與創(chuàng)作的特點,導(dǎo)致其通常含金量很低、信息質(zhì)量參差不齊。在數(shù)據(jù)挖掘、輿情分析、熱點發(fā)現(xiàn)、信息搜索等眾多基于UGC的研究工作中,對于UGC自身內(nèi)容質(zhì)量的合理評估就變得十分必要。在本文中,我們對UGC用戶間的交互關(guān)系進行分析,衡量用戶的權(quán)威程度,并在此基礎(chǔ)上結(jié)合主題相似度分析過程,提出了一種評估用戶創(chuàng)作內(nèi)容質(zhì)量的方法。我們綜合考慮了用戶間靜態(tài)的社交關(guān)系和動態(tài)的交互行為關(guān)系,構(gòu)建用戶關(guān)系網(wǎng)絡(luò),在社會網(wǎng)絡(luò)分析過程中分析用戶所處網(wǎng)絡(luò)節(jié)點所具有的社會性質(zhì)并整合多種信息構(gòu)建用戶特征向量。使用基于用戶真實度的鏈接分析方法和神經(jīng)網(wǎng)絡(luò)回歸模型對用戶自身的權(quán)威度進行評分。用戶的權(quán)威度代表其影響力大小,并能在一定程度上反映其發(fā)布內(nèi)容的價值。同時,我們考慮了用戶權(quán)威性的主題性,根據(jù)網(wǎng)絡(luò)社區(qū)中用戶創(chuàng)作內(nèi)容多人參與的特點,使用作者-主題模型(AT)分析用戶興趣點的主題分布。最終結(jié)合用戶在UGC生成過程中的實際表現(xiàn),計算出一段多人參與的用戶創(chuàng)作內(nèi)容的內(nèi)容質(zhì)量。 為驗證結(jié)果的有效性,我們對綜合型社交論壇(天涯論壇)進行了較大規(guī)模的數(shù)據(jù)采集,并在真實數(shù)據(jù)集合上針對不同的影響因素進行了多次對比實驗。同時,我們設(shè)計出了比較有說服力的評估方法對結(jié)果進行分析。最終結(jié)果表明,本文提出的方法在綜合考慮多種因素時對于UGC自身質(zhì)量可以做到更加合理的評估。 本論文研究得到國家自然科學(xué)基金項目資助,編號71231002和61202247。
[Abstract]:With the development of Web2.0, more and more website information resources depend on the participation, leading and construction of users. And in the process of dissemination, the rich and growing information resources are called User-generated content (UGC). At present, the related theoretical research on UGC has been widely concerned and paid attention to by various industries. At the same time, many valuable research results have been made. However, because UGC has the characteristics that everyone can participate in the creation, it usually has very low gold content and uneven information quality. In data mining, public opinion analysis, hot spot discovery, In many research work based on UGC, such as information search, it is very necessary to evaluate the content quality of UGC itself. In this paper, we analyze the interaction between UGC users and measure the authority of users. On the basis of this, a method of evaluating the quality of user-created content is proposed based on the process of subject similarity analysis. We consider the static social relationship and dynamic interactive behavior relationship between users, and construct the user relationship network. In the process of social network analysis, the social properties of the nodes in which users are located are analyzed and the user feature vectors are constructed by integrating various kinds of information. The link analysis method based on user truthfulness and the neural network regression model are used to construct the user feature vectors. The user's own authority is rated. The user's authority represents the size of his influence, And can reflect the value of the content to some extent. At the same time, we consider the theme of user authority, according to the characteristics of users in the network community, The author-topic model (ATT) is used to analyze the topic distribution of user's point of interest. Finally, the content quality of a segment of user's creative content is calculated according to the user's actual performance in the process of UGC generation. In order to verify the validity of the results, we conducted a large scale data collection on the comprehensive social forum (Tianya Forum), and conducted several comparative experiments on different influencing factors on the real data set. At the same time, We have designed a more persuasive evaluation method to analyze the results. The final results show that the method proposed in this paper can be used to evaluate the quality of UGC in a more reasonable way when a variety of factors are taken into account. This thesis is supported by the National Natural Science Foundation of China, No. 71231002 and 61202247.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP393.09;TP391.1
【相似文獻】
相關(guān)期刊論文 前10條
1 孟耀;財經(jīng)類期刊怎樣辦出特色[J];東北財經(jīng)大學(xué)學(xué)報;2003年02期
2 張樹元;教材內(nèi)容質(zhì)量問題值得關(guān)注[J];科技與出版;2005年06期
3 高萬億;高新;;質(zhì)量是根本 技術(shù)是關(guān)鍵 制度是保證——湖北省報紙印刷質(zhì)量管理工作會議綜述[J];新聞前哨;2006年11期
4 邱裕明;;浮躁的圖書——透視出版業(yè)繁榮下的內(nèi)容質(zhì)量[J];中國質(zhì)量萬里行;2011年05期
5 ;品質(zhì)、品位、品格——本刊的追求[J];人民論壇·學(xué)術(shù)前沿;2012年03期
6 楊祖希;;沒有雜學(xué),焉來質(zhì)量[J];編輯之友;1993年04期
7 ;為進一步突出特色,提高海外和港澳臺板塊內(nèi)容質(zhì)量本刊召開專題研討會[J];出版參考;2006年33期
8 ;質(zhì)量,永遠的追求[J];四川教育;2007年12期
9 俞也平;提高作者、編者基礎(chǔ)水平是提高縣(市)綜合年鑒內(nèi)容質(zhì)量的關(guān)鍵[J];年鑒信息與研究;2005年04期
10 謝吉清;讀者·作者·編者[J];設(shè)備管理與維修;1998年01期
相關(guān)重要報紙文章 前8條
1 俞文君;多元化解讀人物是提升人物紀念館陳展內(nèi)容質(zhì)量的一大關(guān)鍵[N];中國文物報;2009年
2 實習(xí)生 趙昂;警惕出版業(yè)的“去文化”現(xiàn)象[N];中國新聞出版報;2007年
3 本報記者 馮文禮;陳昕:守住質(zhì)量方能守住出版高地[N];中國新聞出版報;2014年
4 本報記者 馮文禮;質(zhì)量評優(yōu)不“撒芝麻鹽”[N];中國新聞出版報;2008年
5 本報記者 楊雯;別具特色的競爭上稿制度[N];中國新聞出版報;2014年
6 馮靜芳;內(nèi)容為王,破數(shù)字出版之圍[N];中國新聞出版報;2014年
7 本報記者 李晉悅;陳海娟:制作“菜單式”教材[N];中華讀書報;2007年
8 袁躍興;微閱讀,怎樣才更動人[N];團結(jié)報;2014年
相關(guān)碩士學(xué)位論文 前2條
1 王博遠;基于用戶交互關(guān)系的用戶創(chuàng)作內(nèi)容質(zhì)量評估[D];北京郵電大學(xué);2014年
2 趙菲;基于偏差距離最小的大眾點評網(wǎng)的積極用戶生成內(nèi)容激勵機制研究[D];北京郵電大學(xué);2014年
,本文編號:1650461
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1650461.html