一種用于微博謠言檢測(cè)的半監(jiān)督學(xué)習(xí)算法
本文關(guān)鍵詞:一種用于微博謠言檢測(cè)的半監(jiān)督學(xué)習(xí)算法
更多相關(guān)文章: 微博 謠言檢測(cè) 不平衡數(shù)據(jù) 半監(jiān)督學(xué)習(xí) Co-Forest算法 SMOTE 代價(jià)敏感
【摘要】:在微博謠言檢測(cè)中,對(duì)微博謠言進(jìn)行正確標(biāo)注需要耗費(fèi)大量的人力和時(shí)間,同時(shí)數(shù)據(jù)類別的不平衡也影響了微博謠言的正確識(shí)別。為了解決該問題,提出一種基于Co-Forest算法針對(duì)不平衡數(shù)據(jù)集的改進(jìn)方法,利用SMOTE算法和分層抽樣平衡數(shù)據(jù)分布,并通過代價(jià)敏感的加權(quán)投票法來提高對(duì)未標(biāo)記樣本預(yù)測(cè)的正確率。該方法只需要對(duì)少量訓(xùn)練數(shù)據(jù)實(shí)例進(jìn)行謠言類別標(biāo)注即可有效檢測(cè)謠言。10組UCI測(cè)試數(shù)據(jù)和2組微博謠言的實(shí)證實(shí)驗(yàn)證明了算法有效性。
【作者單位】: 山東大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;中國人民解放軍61516部隊(duì);
【關(guān)鍵詞】: 微博 謠言檢測(cè) 不平衡數(shù)據(jù) 半監(jiān)督學(xué)習(xí) Co-Forest算法 SMOTE 代價(jià)敏感
【基金】:國家自然科學(xué)基金資助項(xiàng)目(61303005)
【分類號(hào)】:TP181
【正文快照】: 0引言謠言檢測(cè)屬于互聯(lián)網(wǎng)信息可信度[1]研究范疇,是互聯(lián)網(wǎng)信息可信度研究的新方向。國外學(xué)者對(duì)社交網(wǎng)絡(luò)和微博尤其是Twitter可信度作了大量的研究[2~9]。其研究工作首先從Twitter上抓取數(shù)據(jù),去除與特定事件話題無關(guān)的tweets作為樣本數(shù)據(jù);接著選取tweets文本內(nèi)容包含的元素統(tǒng)計(jì)
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊南海;黃明明;赫然;王秀坤;;基于最大相關(guān)熵準(zhǔn)則的魯棒半監(jiān)督學(xué)習(xí)算法[J];軟件學(xué)報(bào);2012年02期
2 陳志民;薛月菊;楊敬鋒;葉志嬋;陳劍虹;;半監(jiān)督學(xué)習(xí)算法在農(nóng)用地分等中的應(yīng)用[J];計(jì)算機(jī)工程與設(shè)計(jì);2008年23期
3 李凱;馬紅艷;楊楠;陳新勇;;半監(jiān)督學(xué)習(xí)算法的收斂性及其在人臉識(shí)別中的應(yīng)用[J];河北大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期
4 繆志敏;胡谷雨;趙陸文;陳彥德;;一種基于支持向量數(shù)據(jù)描述的半監(jiān)督學(xué)習(xí)算法[J];解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年01期
5 陳錦秀;姬東鴻;;基于圖的半監(jiān)督關(guān)系抽取[J];軟件學(xué)報(bào);2008年11期
6 任亞峰;姬東鴻;尹蘭;;基于半監(jiān)督學(xué)習(xí)算法的虛假評(píng)論識(shí)別研究[J];四川大學(xué)學(xué)報(bào)(工程科學(xué)版);2014年03期
7 許震;沙朝鋒;王曉玲;周傲英;;基于KL距離的非平衡數(shù)據(jù)半監(jiān)督學(xué)習(xí)算法[J];計(jì)算機(jī)研究與發(fā)展;2010年01期
8 劉德山;孫麗;閆德勤;;一種基因數(shù)據(jù)分析的半監(jiān)督學(xué)習(xí)算法[J];微型機(jī)與應(yīng)用;2014年12期
9 王江;張惠源;李芳;張兵文;李鵬;;腦機(jī)接口中半監(jiān)督學(xué)習(xí)算法研究[J];電子測(cè)量技術(shù);2014年05期
10 張健沛;趙瑩;楊靜;;最小二乘支持向量機(jī)的半監(jiān)督學(xué)習(xí)算法[J];哈爾濱工程大學(xué)學(xué)報(bào);2008年10期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 鄧超;基于“合作—參與”計(jì)算認(rèn)知模型的半監(jiān)督學(xué)習(xí)算法研究與應(yīng)用[D];哈爾濱工業(yè)大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 宿洪祿;結(jié)構(gòu)半監(jiān)督學(xué)習(xí)算法及其應(yīng)用研究[D];蘇州大學(xué);2010年
2 占惠融;基于圖的半監(jiān)督學(xué)習(xí)算法研究[D];華中科技大學(xué);2009年
3 魏征麗;基于圖半監(jiān)督學(xué)習(xí)算法的研究及應(yīng)用[D];西安電子科技大學(xué);2012年
4 徐寒香;一種基于李群的半監(jiān)督學(xué)習(xí)算法及應(yīng)用研究[D];蘇州大學(xué);2009年
5 徐培培;基于LNP的半監(jiān)督學(xué)習(xí)算法[D];西安電子科技大學(xué);2009年
6 常瑜;基于Tri-training的半監(jiān)督學(xué)習(xí)算法研究[D];山西大學(xué);2012年
7 王軼初;基于集成學(xué)習(xí)的半監(jiān)督學(xué)習(xí)算法研究[D];西安電子科技大學(xué);2011年
8 張毅鋒;一種基于對(duì)稱矩陣分解的半監(jiān)督學(xué)習(xí)算法的研究與應(yīng)用[D];中山大學(xué);2014年
9 許震;基于KL距離的半監(jiān)督分類算法[D];復(fù)旦大學(xué);2010年
10 楊洋;主動(dòng)式半監(jiān)督學(xué)習(xí)算法的研究[D];煙臺(tái)大學(xué);2012年
,本文編號(hào):816477
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/816477.html