基于用戶圈和內(nèi)容聯(lián)動(dòng)關(guān)系的UGC內(nèi)容質(zhì)量評估
本文關(guān)鍵詞:基于用戶圈和內(nèi)容聯(lián)動(dòng)關(guān)系的UGC內(nèi)容質(zhì)量評估
更多相關(guān)文章: 用戶產(chǎn)生內(nèi)容 復(fù)雜網(wǎng)絡(luò)分析 內(nèi)容質(zhì)量評估 UCCC算法 用戶圈劃分
【摘要】:隨著移動(dòng)互聯(lián)網(wǎng)和社交網(wǎng)絡(luò)的大規(guī)模普及,越來越多的用戶每天會(huì)產(chǎn)生數(shù)以億計(jì)的用戶產(chǎn)生內(nèi)容(UGC)。然而,由于用戶發(fā)表內(nèi)容的門檻的降低,任何用戶在任何時(shí)間都可以發(fā)表自己的想法,因此,也導(dǎo)致了用戶產(chǎn)生內(nèi)容的質(zhì)量參差不齊。但是用戶產(chǎn)生內(nèi)容無論在商業(yè)價(jià)值的挖掘還是在政府對輿論的監(jiān)督等方面都有著重要的作用,因此,在大規(guī)模的UGC數(shù)據(jù)中尋找高質(zhì)量的內(nèi)容就成為了一個(gè)重要的研究課題。在本文中,我們提出了一種新的UGC質(zhì)量的評估方法,該方法使用了在社交網(wǎng)絡(luò)中的用戶圈結(jié)構(gòu),也就是一些興趣愛好相似的人組成的一種社區(qū)結(jié)構(gòu)。從直觀來看,內(nèi)容吸引用戶圈的數(shù)量比吸引用戶的數(shù)量更加能夠表現(xiàn)其內(nèi)容的質(zhì)量。因?yàn)檫@說明該內(nèi)容覆蓋的用戶層面更廣,更具有潛力成為熱點(diǎn)內(nèi)容。因此,本文提出了基于用戶圈和內(nèi)容聯(lián)動(dòng)關(guān)系的UGC內(nèi)容質(zhì)量評估算法,簡稱UCCC算法。UCCC算法基于用戶圈網(wǎng)絡(luò)圖,內(nèi)容網(wǎng)絡(luò)圖和用戶圈-內(nèi)容網(wǎng)絡(luò)圖進(jìn)行計(jì)算。其計(jì)算原理是基于用戶圈-內(nèi)容質(zhì)量的互增強(qiáng)原理。即與內(nèi)容相關(guān)的用戶圈質(zhì)量越高,內(nèi)容質(zhì)量越高;而內(nèi)容的質(zhì)量越高,也證明與其相關(guān)的用戶圈的質(zhì)量也越高。 本文基于真實(shí)的數(shù)據(jù)進(jìn)行了UGC質(zhì)量評估實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明UCCC算法在大部分實(shí)驗(yàn)數(shù)據(jù)上的評估效果要優(yōu)于其他的算法,同時(shí)也證明了用戶圈維度特征相比用戶維度在UGC質(zhì)量評估中更加有效。 本論文研究得到國家自然科學(xué)基金項(xiàng)目“基于hLDA層次主題模型的中文多文檔摘要研究”(項(xiàng)目批準(zhǔn)號(hào):61202247)和“面向不確定性的Web2.0用戶創(chuàng)作內(nèi)容管理研究”(項(xiàng)目批準(zhǔn)號(hào):71231002)的資助。
【關(guān)鍵詞】:用戶產(chǎn)生內(nèi)容 復(fù)雜網(wǎng)絡(luò)分析 內(nèi)容質(zhì)量評估 UCCC算法 用戶圈劃分
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:O157.5
【目錄】:
- 摘要4-6
- ABSTRACT6-8
- 目錄8-11
- 第一章 緒論11-15
- 1.1 研究背景及意義11-12
- 1.1.1 研究背景11
- 1.1.2 研究意義11-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-13
- 1.3 本課題研究工作13
- 1.4 論文結(jié)構(gòu)安排13-15
- 第二章 UGC質(zhì)量評估中運(yùn)用的模型及算法15-27
- 2.1 PageRank算法15-17
- 2.1.1 PageRank算法前提15
- 2.1.2 PageRank算法原理15-16
- 2.1.3 PageRank算法修正16
- 2.1.4 PageRank算法的優(yōu)缺點(diǎn)16-17
- 2.2 HITS算法17-18
- 2.2.1 HITS算法前提17
- 2.2.2 HITS算法基本思想和計(jì)算方法17
- 2.2.3 HITS算法存在的問題17-18
- 2.3 意見領(lǐng)袖發(fā)現(xiàn)算法18-22
- 2.3.1 意見領(lǐng)袖18-19
- 2.3.2 TwitterRank算法19-20
- 2.3.3 IP算法20-22
- 2.4 LDA主題模型22-23
- 2.4.1 詞袋模型22
- 2.4.2 LDA模型核心思想22-23
- 2.4.3 潛在狄利克雷分配特點(diǎn)23
- 2.5 圖分割算法23-25
- 2.5.1 復(fù)雜網(wǎng)絡(luò)23-24
- 2.5.2 GN算法24
- 2.5.3 Fast Unfolding算法24-25
- 2.6 文本相似度計(jì)算方法25-26
- 2.6.1 TF-IDF算法25
- 2.6.2 余弦相似度算法25-26
- 2.7 本章小結(jié)26-27
- 第三章 UGC質(zhì)量評估框架27-33
- 3.1 構(gòu)建用戶圈網(wǎng)絡(luò)圖G_(UC)27-28
- 3.1.1 構(gòu)建用戶網(wǎng)絡(luò)圖G_U27-28
- 3.1.2 劃分用戶圈28
- 3.1.3 構(gòu)建用戶圈網(wǎng)絡(luò)圖G_(UC)28
- 3.2 構(gòu)建內(nèi)容網(wǎng)絡(luò)圖G_(CT)28-29
- 3.3 構(gòu)建內(nèi)容-用戶圈網(wǎng)絡(luò)圖G_(CC)29-31
- 3.3.1 計(jì)算用戶發(fā)布的內(nèi)容與指定內(nèi)容的相似度29-30
- 3.3.2 計(jì)算內(nèi)容-用戶圈的轉(zhuǎn)移概率30
- 3.3.3 計(jì)算用戶圈-內(nèi)容的轉(zhuǎn)移概率30-31
- 3.4 UGC質(zhì)量評估計(jì)算方法(UCCC)31-32
- 3.4.1 構(gòu)建轉(zhuǎn)移概率矩陣31
- 3.4.2 UGC質(zhì)量評估計(jì)算方法31-32
- 3.5 本章小結(jié)32-33
- 第四章 基于用戶和內(nèi)容聯(lián)動(dòng)關(guān)系的UGC內(nèi)容質(zhì)量評估33-36
- 4.1 構(gòu)建用戶-內(nèi)容網(wǎng)絡(luò)圖33-34
- 4.1.1 計(jì)算內(nèi)容到用戶的邊的權(quán)重33-34
- 4.1.2 計(jì)算用戶到內(nèi)容的邊的權(quán)重34
- 4.2 構(gòu)建轉(zhuǎn)移概率矩陣34
- 4.3 UCC算法進(jìn)行UGC質(zhì)量評估34-35
- 4.4 本章小結(jié)35-36
- 第五章 UGC內(nèi)容質(zhì)量評估實(shí)驗(yàn)36-50
- 5.1 數(shù)據(jù)準(zhǔn)備和預(yù)處理36-37
- 5.2 構(gòu)建用戶網(wǎng)絡(luò)圖并劃分用戶圈37-39
- 5.3 實(shí)驗(yàn)及結(jié)果分析39-48
- 5.4 本章小結(jié)48-50
- 第六章 總結(jié)與展望50-51
- 6.1 本文的工作總結(jié)50
- 6.2 未來展望50-51
- 參考文獻(xiàn)51-53
- 致謝53-54
- 攻讀碩士學(xué)位期間發(fā)表的論文54
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 鄧群釗;賈仁安;梁英培;;多層次多輪實(shí)地群決策法及其應(yīng)用[J];安徽農(nóng)業(yè)科學(xué);2006年08期
2 楊朗;陳恩海;黃立飛;;系統(tǒng)科學(xué)在害蟲管理中的應(yīng)用[J];安徽農(nóng)業(yè)科學(xué);2009年21期
3 宋波,葉文虎;從增長和穩(wěn)定的角度重新認(rèn)識(shí)可持續(xù)發(fā)展的內(nèi)涵[J];北京大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2004年04期
4 戴汝為;“人機(jī)結(jié)合”的大成智慧[J];北方工業(yè)大學(xué)學(xué)報(bào);1996年03期
5 方芳;;金融復(fù)雜系統(tǒng)脆性理論在金融危機(jī)分析中的應(yīng)用[J];北方經(jīng)濟(jì);2011年06期
6 張江;李學(xué)偉;;認(rèn)知模型與統(tǒng)一集[J];北京交通大學(xué)學(xué)報(bào);2005年06期
7 梁為亮;趙金超;;武器裝備綜合集成的體系結(jié)構(gòu)與建模[J];兵工自動(dòng)化;2006年12期
8 李彥斌,李濤,張文泉;管理科學(xué)面臨復(fù)雜性科學(xué)的挑戰(zhàn)[J];北京航空航天大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2004年02期
9 馬藹乃;論地理科學(xué)的發(fā)展[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);1996年01期
10 王亮;盧永錦;;引用預(yù)見信息的人機(jī)耦合優(yōu)化方法[J];北京航空航天大學(xué)學(xué)報(bào);2008年04期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 吳慶洲;;迎接中國城市營建史研究之春天[A];《營造》第五輯——第五屆中國建筑史學(xué)國際研討會(huì)會(huì)議論文集(上)[C];2010年
2 鄧方;陳杰;陳文頡;朱琳;;元胞自動(dòng)機(jī)及其在兵力推演中的建模與仿真[A];第二十六屆中國控制會(huì)議論文集[C];2007年
3 王春生;吳敏;曹衛(wèi)華;;基于集成預(yù)測模型與專家推理策略的鉛鋅燒結(jié)配料優(yōu)化方法[A];第二十六屆中國控制會(huì)議論文集[C];2007年
4 魏紅英;黃石旺;;混沌理論的前沿性及其對公共行政的貢獻(xiàn)[A];地方政府發(fā)展研究(第三輯)[C];2008年
5 趙德勇;劉建國;;基于復(fù)雜性科學(xué)的綜合集成研討廳研究現(xiàn)狀與發(fā)展[A];'2003系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)交流會(huì)論文集[C];2003年
6 李亞;李習(xí)彬;;共贏方法論——協(xié)調(diào)社會(huì)利益關(guān)系的系統(tǒng)方法論[A];經(jīng)濟(jì)全球化與系統(tǒng)工程——中國系統(tǒng)工程學(xué)會(huì)第16屆學(xué)術(shù)年會(huì)論文集[C];2010年
7 劉怡君;唐錫晉;顧基發(fā);;專家會(huì)商的方法支持與工具應(yīng)用[A];經(jīng)濟(jì)全球化與系統(tǒng)工程——中國系統(tǒng)工程學(xué)會(huì)第16屆學(xué)術(shù)年會(huì)論文集[C];2010年
8 王德光;胡寶清;覃開賢;;復(fù)雜性科學(xué)在喀斯特土地利用系統(tǒng)研究中的應(yīng)用[A];發(fā)揮資源科技優(yōu)勢 保障西部創(chuàng)新發(fā)展——中國自然資源學(xué)會(huì)2011年學(xué)術(shù)年會(huì)論文集(上冊)[C];2011年
9 李存金;;大規(guī)模科學(xué)技術(shù)工程復(fù)雜系統(tǒng)管理方法論研究[A];第十三屆中國管理科學(xué)學(xué)術(shù)年會(huì)論文集[C];2011年
10 王階;何慶勇;姚魁武;朱明軍;馬長生;葉勇;王永霞;林謙;衷敬柏;湯艷莉;熊興江;荊魯;農(nóng)一兵;;以證候要素為內(nèi)容的冠心病心絞痛中醫(yī)療效評價(jià)體系研究[A];2011年中華中醫(yī)藥學(xué)會(huì)心病分會(huì)學(xué)術(shù)年會(huì)暨北京中醫(yī)藥學(xué)會(huì)心血管病專業(yè)委員會(huì)年會(huì)論文集[C];2011年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 楊莉;基于可持續(xù)發(fā)展的我國電源結(jié)構(gòu)優(yōu)化研究[D];哈爾濱工程大學(xué);2010年
2 王勁松;復(fù)雜系統(tǒng)脆性理論及其在電力系統(tǒng)風(fēng)險(xiǎn)分析中的應(yīng)用[D];哈爾濱工程大學(xué);2010年
3 趙金憲;復(fù)雜系統(tǒng)脆性理論在煤礦生產(chǎn)系統(tǒng)脆性風(fēng)險(xiǎn)評價(jià)中的應(yīng)用[D];哈爾濱工程大學(xué);2010年
4 石云龍;基于CAS理論的地震緊急救援系統(tǒng)模型構(gòu)建與模擬仿真[D];中國地質(zhì)大學(xué)(北京);2010年
5 陶有德;可修復(fù)模型的系統(tǒng)分析[D];北京信息控制研究所;2010年
6 于群;電力系統(tǒng)大停電的自組織臨界特性研究[D];中國電力科學(xué)研究院;2010年
7 羅國亮;災(zāi)害應(yīng)對與中國政府治理方式變革研究[D];南開大學(xué);2010年
8 張晨;我國資源型城市綠色轉(zhuǎn)型復(fù)合系統(tǒng)研究[D];南開大學(xué);2010年
9 雷國雄;不確定性、創(chuàng)新不足與經(jīng)濟(jì)演化[D];暨南大學(xué);2010年
10 翁勇南;安全支撐體系及其演化機(jī)理研究[D];北京交通大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 安軍建;海洋船舶類復(fù)雜產(chǎn)品供應(yīng)鏈協(xié)作機(jī)制研究[D];中國海洋大學(xué);2010年
2 楊林;求解帶性能約束圓集布局問題的啟發(fā)式蟻群算法研究[D];湘潭大學(xué);2010年
3 曹春苗;基于復(fù)雜網(wǎng)絡(luò)的知識(shí)價(jià)值鏈建模及應(yīng)用研究[D];中國海洋大學(xué);2010年
4 張莉莉;青島市突發(fā)公共事件應(yīng)急管理研究[D];中國海洋大學(xué);2010年
5 趙業(yè)清;鋼鐵生產(chǎn)流程的系統(tǒng)動(dòng)力學(xué)建模與動(dòng)態(tài)仿真[D];昆明理工大學(xué);2008年
6 周洋洋;云南高原山區(qū)農(nóng)村公路養(yǎng)護(hù)技術(shù)研究[D];昆明理工大學(xué);2010年
7 張雪梅;基于SLEUTH模型的城市擴(kuò)張分析及場景預(yù)測研究[D];昆明理工大學(xué);2010年
8 尤荻;公共基礎(chǔ)設(shè)施BOT-TOT-PPP集成融資模式應(yīng)用研究[D];昆明理工大學(xué);2008年
9 王榮華;HWME中“廣義專家”群體網(wǎng)絡(luò)研討過程的鏈接結(jié)構(gòu)及其分析算法研究[D];昆明理工大學(xué);2009年
10 鄭小亞;基于和諧理論的云南社會(huì)公共服務(wù)體系研究[D];昆明理工大學(xué);2010年
,本文編號(hào):914764
本文鏈接:http://sikaile.net/kejilunwen/yysx/914764.html