互聯(lián)網(wǎng)社區(qū)問答平臺(tái)上基于“眾包”的信息污染:測量、分析與防治
本文關(guān)鍵詞:互聯(lián)網(wǎng)社區(qū)問答平臺(tái)上基于“眾包”的信息污染:測量、分析與防治,由筆耕文化傳播整理發(fā)布。
【摘要】:“眾包”的工作方式由來已久,并且日益盛行。通過“眾包”的方式,雇主可以從人群中購買服務(wù),整合人力來完成一個(gè)復(fù)雜的工作。近些年來,“眾包”方式被廣泛應(yīng)用于互聯(lián)網(wǎng)中,“眾包”平臺(tái)就是作為該方式的運(yùn)行媒介而產(chǎn)生的。然而,“眾包”平臺(tái)在為大規(guī)模社會(huì)合作提供基礎(chǔ)服務(wù)的同時(shí)也經(jīng)常被惡意使用,雇主可以雇傭大量人力向網(wǎng)絡(luò)發(fā)布大量帶有偏見的評(píng)論和垃圾信息,甚至包含病毒的鏈接。這種由“眾包”平臺(tái)導(dǎo)致的向網(wǎng)絡(luò)信息污染,其用戶參與度高、影響范圍廣,儼然已經(jīng)形成了一個(gè)完整的網(wǎng)絡(luò)生態(tài)系統(tǒng),對(duì)網(wǎng)絡(luò)安全造成嚴(yán)重的威脅。但是,人們對(duì)這樣的生態(tài)系統(tǒng)仍缺乏認(rèn)識(shí),任由其對(duì)信息資源以及人類身心健康等造成損害或其他負(fù)面影響。 本文首次聚焦于“眾包”平臺(tái)中的“黑暗面”,研究了產(chǎn)生于“豬八戒”(大型中文“眾包”平臺(tái))上,以“百度知道”(國內(nèi)最大的社區(qū)問答平臺(tái))為污染目標(biāo)的“眾包”活動(dòng)。提出了一個(gè)大規(guī)模的網(wǎng)絡(luò)測量方法來收集“豬八戒“和“百度知道”的數(shù)據(jù)。通過把“豬八戒“的“眾包”需求和威客,以及“百度知道“的垃圾賬號(hào)和垃圾信息連接起來,提出一個(gè)隱藏于“眾包”平臺(tái)下的對(duì)網(wǎng)絡(luò)信息造成污染的網(wǎng)絡(luò)生態(tài)系統(tǒng)。同時(shí)從垃圾信息的規(guī)模與范圍、威客的“女巫賬號(hào)”及其相互合作、威客的工作與報(bào)酬、“眾包”活動(dòng)的質(zhì)量控制等不同方面全面深入地分析了該生態(tài)系統(tǒng)。另外,基于對(duì)“眾包”中產(chǎn)生垃圾信息的生態(tài)系統(tǒng)的理解以及對(duì)社區(qū)問答平臺(tái)中的垃圾賬號(hào)和普通賬號(hào)的行為差異的分析,提出一個(gè)全新的垃圾賬號(hào)鑒別方法。
【關(guān)鍵詞】:“眾包” 社區(qū)問答平臺(tái) 信息污染 社會(huì)網(wǎng)絡(luò) 垃圾鑒別
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP393.08
【目錄】:
- 摘要5-6
- ABSTRACT6-11
- 第一章 緒論11-19
- 1.1 研究背景與意義11-13
- 1.1.1 “眾包”平臺(tái)11-12
- 1.1.2 社區(qū)問答平臺(tái)12-13
- 1.2 國內(nèi)外研究現(xiàn)狀13-16
- 1.2.1 對(duì)社交網(wǎng)絡(luò)中的信息污染的相關(guān)研究13-14
- 1.2.2 對(duì)“眾包”平臺(tái)的研究14-15
- 1.2.3 對(duì)社區(qū)問答平臺(tái)的相關(guān)研究15-16
- 1.3 本文研究內(nèi)容和主要貢獻(xiàn)16-17
- 1.4 文章組織結(jié)構(gòu)17-19
- 第二章 數(shù)據(jù)收集19-33
- 2.1 數(shù)據(jù)源介紹19-24
- 2.1.1 “豬八戒”19-22
- 2.1.2 “百度知道”22-24
- 2.2 數(shù)據(jù)獲取24-28
- 2.2.1 “豬八戒”數(shù)據(jù)獲取24-25
- 2.2.2 “百度知道”數(shù)據(jù)獲取25-28
- 2.3 連接兩個(gè)數(shù)據(jù)集并分析28-31
- 2.3.1 跟蹤“豬八戒”威客到其所用的“百度知道”賬號(hào)28-30
- 2.3.2 垃圾問題的存活情況30-31
- 2.4 本章小結(jié)31-33
- 第三章 “眾包”中從事垃圾信息發(fā)布的網(wǎng)絡(luò)生態(tài)系統(tǒng)33-43
- 3.1 垃圾信息的規(guī)模與分布范圍33-34
- 3.2 百度知道垃圾賬號(hào)34-35
- 3.3 “女巫賬號(hào)“以及“女巫賬號(hào)”號(hào)間的“勾結(jié)”情況35-37
- 3.4 威客的努力與回報(bào)37-40
- 3.5 “眾包”活動(dòng)的質(zhì)量控制40-42
- 3.6 本章小結(jié)42-43
- 第四章 “百度知道”垃圾賬號(hào)鑒別43-57
- 4.1 準(zhǔn)備工作43-44
- 4.1.1 使用工具介紹43
- 4.1.2 構(gòu)建網(wǎng)絡(luò)圖43-44
- 4.2 屬性選擇44-47
- 4.2.1 個(gè)人信息屬性44
- 4.2.2 問題/答案屬性44-45
- 4.2.3 社會(huì)網(wǎng)絡(luò)屬性45-47
- 4.3 屬性排序與屬性分析47-50
- 4.4 實(shí)現(xiàn)鑒別系統(tǒng)50-54
- 4.4.1 使用樣本集50-51
- 4.4.2 分類算法選擇51-52
- 4.4.3 性能評(píng)估方法52-53
- 4.4.4 訓(xùn)練分類器53-54
- 4.5 本章小結(jié)54-57
- 第五章 總結(jié)57-59
- 參考文獻(xiàn)59-63
- 致謝63-65
- 在讀期間發(fā)表的學(xué)術(shù)論文與取得的其他研究成果65
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王永梅;胡學(xué)鋼;;決策樹中ID3算法的研究[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期
2 葉明全;;數(shù)據(jù)挖掘在醫(yī)療數(shù)據(jù)中的應(yīng)用[J];安徽工程科技學(xué)院學(xué)報(bào)(自然科學(xué)版);2007年03期
3 賈澤露;;基于GIS與SDM集成的農(nóng)用地定級(jí)專家系統(tǒng)[J];安徽農(nóng)業(yè)科學(xué);2008年14期
4 蔡麗艷;馮憲彬;丁蕊;;基于決策樹的農(nóng)戶小額貸款信用評(píng)估模型研究[J];安徽農(nóng)業(yè)科學(xué);2011年02期
5 趙靜嫻;;基于決策樹的食品安全評(píng)估研究[J];安徽農(nóng)業(yè)科學(xué);2011年32期
6 王斌;;基于聚類的決策樹在玉米種質(zhì)篩選中的應(yīng)用[J];安徽農(nóng)業(yè)科學(xué);2011年33期
7 陳文;基于決策樹的入侵檢測的實(shí)現(xiàn)[J];安徽技術(shù)師范學(xué)院學(xué)報(bào);2005年05期
8 覃愛明,胡昌振,譚惠民;網(wǎng)絡(luò)攻擊檢測中的機(jī)器學(xué)習(xí)方法綜述[J];安全與環(huán)境學(xué)報(bào);2001年01期
9 左吉峰;喬均儉;;ID3算法的合理性證明及實(shí)驗(yàn)分析[J];保定學(xué)院學(xué)報(bào);2008年04期
10 王曉紅,高洪深;數(shù)據(jù)挖掘技術(shù)在大型超市中的應(yīng)用研究[J];北方工業(yè)大學(xué)學(xué)報(bào);2003年03期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 葉紅云;倪志偉;陳恩紅;;一種混合型集成學(xué)習(xí)演化決策樹算法[A];2005年“數(shù)字安徽”博士科技論壇論文集[C];2005年
2 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九屆中國控制會(huì)議論文集[C];2010年
3 王琦;;基于貝葉斯決策樹算法的垃圾郵件識(shí)別機(jī)制[A];2011年通信與信息技術(shù)新進(jìn)展——第八屆中國通信學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2011年
4 魯松;;英文介詞短語歸并歧義的RMBL分類器消解[A];2005年信息與通信領(lǐng)域博士后學(xué)術(shù)會(huì)議論文集[C];2005年
5 劉海霞;鐘曉妮;周燕榮;田考聰;;決策樹在居民就診衛(wèi)生服務(wù)利用影響因素研究中的應(yīng)用[A];重慶市預(yù)防醫(yī)學(xué)會(huì)2010年論文集[C];2011年
6 汪云亮;呂久明;劉孝剛;;基于信息熵的輻射源屬性分類方法[A];2006北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)——通信與信息技術(shù)會(huì)議論文集(上)[C];2006年
7 葉中行;陸青;余敏杰;;計(jì)算智能在銀行信貸信用分類中的應(yīng)用[A];中國電子學(xué)會(huì)第十五屆信息論學(xué)術(shù)年會(huì)暨第一屆全國網(wǎng)絡(luò)編碼學(xué)術(shù)年會(huì)論文集(下冊(cè))[C];2008年
8 徐怡;余斌;李龍澍;;粗糙集在決策樹生成中的應(yīng)用[A];2005中國控制與決策學(xué)術(shù)年會(huì)論文集(下)[C];2005年
9 ;Rough Set Based Autolanding Control[A];第二十三屆中國控制會(huì)議論文集(下冊(cè))[C];2004年
10 劉東升;;基于Mobile Agent的分布式ID3挖掘模型[A];2005年全國開放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集[C];2005年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張明;電能質(zhì)量擾動(dòng)相關(guān)問題研究[D];華中科技大學(xué);2010年
2 渠瑜;基于SVM的高不平衡分類技術(shù)研究及其在電信業(yè)的應(yīng)用[D];浙江大學(xué);2010年
3 徐河杭;面向PLM的數(shù)據(jù)挖掘技術(shù)和應(yīng)用研究[D];浙江大學(xué);2010年
4 朱佳俊;不確定可拓群決策優(yōu)化方法及應(yīng)用[D];東華大學(xué);2010年
5 陳進(jìn);高光譜圖像分類方法研究[D];國防科學(xué)技術(shù)大學(xué);2010年
6 管紅波;食品連鎖經(jīng)營中的有效客戶反應(yīng)研究[D];東華大學(xué);2010年
7 李軍;不平衡數(shù)據(jù)學(xué)習(xí)的研究[D];吉林大學(xué);2011年
8 魏小濤;在線自適應(yīng)網(wǎng)絡(luò)異常檢測系統(tǒng)模型與相關(guān)算法研究[D];北京交通大學(xué);2009年
9 王中鋒;樹型貝葉斯網(wǎng)絡(luò)分類器鑒別式訓(xùn)練研究[D];北京交通大學(xué);2011年
10 楊明;分布式環(huán)境下的安全策略關(guān)鍵技術(shù)研究[D];吉林大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 岳海亮;信息論在粗糙集連續(xù)屬性離散化中的應(yīng)用[D];遼寧師范大學(xué);2010年
2 徐洪偉;數(shù)據(jù)挖掘中決策樹分類算法的研究與改進(jìn)[D];哈爾濱工程大學(xué);2010年
3 曹振興;適應(yīng)概念漂移的數(shù)據(jù)流分類算法研究[D];哈爾濱工程大學(xué);2010年
4 李曉光;數(shù)據(jù)挖掘技術(shù)在高校招生和教務(wù)管理中的應(yīng)用[D];哈爾濱工程大學(xué);2010年
5 秦園;基于SPOT5的土地信息提取技術(shù)研究[D];大連理工大學(xué);2010年
6 李仁良;決策樹算法在臨床診斷中的應(yīng)用研究[D];遼寧工程技術(shù)大學(xué);2009年
7 鄭陶;基于平面向量的決策樹算法在高考志愿選擇系統(tǒng)中的應(yīng)用[D];遼寧工程技術(shù)大學(xué);2010年
8 孫怡哲;一種改進(jìn)的決策樹算法研究與應(yīng)用[D];遼寧工程技術(shù)大學(xué);2010年
9 黃輝;基于LSI和SVC的網(wǎng)頁文本分類算法研究[D];長沙理工大學(xué);2010年
10 周翔;決策支持技術(shù)在企業(yè)銷售系統(tǒng)中的應(yīng)用研究[D];中國海洋大學(xué);2010年
本文關(guān)鍵詞:互聯(lián)網(wǎng)社區(qū)問答平臺(tái)上基于“眾包”的信息污染:測量、分析與防治,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):357344
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/357344.html