基于AHP與SVM的微博機器用戶檢測方法
發(fā)布時間:2019-11-21 00:22
【摘要】:以新浪微博中的用戶為研究對象,分析并提取機器用戶的特征,提出一種新的微博機器用戶檢測方法。通過層次分析法構(gòu)建分類指標體系,對各指標特征進行量化評估,利用支持向量機(SVM)算法構(gòu)建機器用戶檢測模型。測試SVM中不同核函數(shù)對各分類指標的重要性預(yù)測,并與量化評估結(jié)果進行比對,同時測試不同核函數(shù)模型的分類精度,對比兩項結(jié)果綜合選擇出最優(yōu)分類器。實驗結(jié)果表明,該方法能夠?qū)ξ⒉┲械臋C器用戶進行較為精確的檢測。
【圖文】:
計算機工程2017年4月15日1總體思路目前對于網(wǎng)絡(luò)中的各種機器用戶的識別取得了很多成果,從不同的切入點分析機器用戶的特征以建立區(qū)分模型。但在已有的識別方法中,均未考慮到機器用戶特征的權(quán)重問題。分析并提取微博機器用戶的特征,運用層次分析法構(gòu)建分類指標體系,建立判斷矩陣來量化各個分類指標的權(quán)重,利用支持向量機算法構(gòu)建了機器用戶檢測模型,將分類指標的權(quán)重值考慮到分類模型中,其基本思路如圖1所示。圖1機器用戶識別模型建立的基本框架2基于層次分析法的機器用戶分類模型2.1機器用戶特征分析依靠程序自動地發(fā)布大量垃圾博文,其本身的用戶行為以及發(fā)布的博文內(nèi)容都與正常使用微博的正常用戶存在很大差異。本文從2個角度對機器用戶進行特征分析,即用戶行為特征和博文內(nèi)容特征。2.1.1用戶行為特征用戶行為特征方法如下:1)用戶被關(guān)注度。使用微博時會因自己在現(xiàn)實生活中的社交圈子而獲得一部分數(shù)量的“粉絲”。但機器用戶則不同,他們不存在自己的“社交圈”,其發(fā)布的博文內(nèi)容也大多是以營銷、炒作為目的,其內(nèi)容并不足以吸引普通用戶去關(guān)注,也就是說機器用戶會有很少的“粉絲”數(shù)量,并且他們?yōu)榱俗尭嗟娜丝吹剿麄,會大量地關(guān)注其他普通用戶。用戶被關(guān)注度可以表示為:用戶關(guān)注度=粉絲數(shù)關(guān)注人數(shù)+粉絲數(shù)可以看出,機器用戶的被關(guān)注度非常校2)互粉率;シ勐室彩潜憩F(xiàn)用戶正常社交的重要指標。普通用戶利用微博來進行日常的社交活動,互粉好友在其關(guān)注的人和粉絲數(shù)中一定會占有一定的比重。而機器用戶的身份都是由是機器人程序創(chuàng)建的,其存在的目的并不是社交。因此,機器用戶的互粉好友會非常少或幾乎沒有;シ勐士杀硎緸:互粉率=互粉數(shù)關(guān)注人數(shù)+粉絲數(shù)3)時間合理度。發(fā)博時間合理度表現(xiàn)
第43卷第4期張曉藝,路燕,翟惠良:基于AHP與SVM的微博機器用戶檢測方法戶分類體系,,將分類特征進行分層,以得到機器用戶分類體系模型。模型分為3層,即目標層A、準則層B和指標層C。機器用戶分類指標體系如圖2所示。圖2機器用戶分類指標體系2.2.2各分類特征權(quán)重的確定分類特征的權(quán)重確定步驟如下:步驟1判斷矩陣的建立。本次實驗選取10位經(jīng)常使用新浪微博的學(xué)生,對層次體系結(jié)構(gòu)中的各項指標進行兩兩比較,采用“1~9”的評判方法進行賦值,建立兩兩判斷矩陣[9]。判斷矩陣是進行相對重要程度計算的重要依據(jù)[10],可表示為:A=(aij)n×n其中,aij代表矩陣元素Ui與Uj相對于其上一層元素重要性的比例標度,比值越大,則Ui的重要度就越高。各層的比較標度如表1、表2所示。表1機器用戶分類體系用戶行為特征評價要素的比較標度分類要素用戶被關(guān)注度互粉率時間合理度用戶被關(guān)注度136互粉率1/315時間合理度1/61/51得到判斷矩陣為:U1=1361/3151/61/51表2機器用戶分類體系博文內(nèi)容特征評價要素的比較標度分類要素關(guān)鍵詞詞頻鏈接比例提及比例標簽比例關(guān)鍵詞詞頻1486鏈接比例1/4153提及比例1/81/511/3標簽比例1/61/331得到判斷矩陣為:U2=14861/41531/81/511/31/61/331步驟2權(quán)重的確定。對判斷矩陣中的每一列進行歸一化處理之后,對歸一化的值進行求和,再將求和結(jié)果進行歸一化,即可得到特征向量的值。經(jīng)過計算[11],最終得到機器用戶分類體系中目標層、準則層和指標層的各分類指標的權(quán)重,如表3所示。表3各分類指標體系權(quán)重目標層(A)準則層(B)指標權(quán)重(B)指標層(C)指標權(quán)重(C)指標總?
本文編號:2563758
【圖文】:
計算機工程2017年4月15日1總體思路目前對于網(wǎng)絡(luò)中的各種機器用戶的識別取得了很多成果,從不同的切入點分析機器用戶的特征以建立區(qū)分模型。但在已有的識別方法中,均未考慮到機器用戶特征的權(quán)重問題。分析并提取微博機器用戶的特征,運用層次分析法構(gòu)建分類指標體系,建立判斷矩陣來量化各個分類指標的權(quán)重,利用支持向量機算法構(gòu)建了機器用戶檢測模型,將分類指標的權(quán)重值考慮到分類模型中,其基本思路如圖1所示。圖1機器用戶識別模型建立的基本框架2基于層次分析法的機器用戶分類模型2.1機器用戶特征分析依靠程序自動地發(fā)布大量垃圾博文,其本身的用戶行為以及發(fā)布的博文內(nèi)容都與正常使用微博的正常用戶存在很大差異。本文從2個角度對機器用戶進行特征分析,即用戶行為特征和博文內(nèi)容特征。2.1.1用戶行為特征用戶行為特征方法如下:1)用戶被關(guān)注度。使用微博時會因自己在現(xiàn)實生活中的社交圈子而獲得一部分數(shù)量的“粉絲”。但機器用戶則不同,他們不存在自己的“社交圈”,其發(fā)布的博文內(nèi)容也大多是以營銷、炒作為目的,其內(nèi)容并不足以吸引普通用戶去關(guān)注,也就是說機器用戶會有很少的“粉絲”數(shù)量,并且他們?yōu)榱俗尭嗟娜丝吹剿麄,會大量地關(guān)注其他普通用戶。用戶被關(guān)注度可以表示為:用戶關(guān)注度=粉絲數(shù)關(guān)注人數(shù)+粉絲數(shù)可以看出,機器用戶的被關(guān)注度非常校2)互粉率;シ勐室彩潜憩F(xiàn)用戶正常社交的重要指標。普通用戶利用微博來進行日常的社交活動,互粉好友在其關(guān)注的人和粉絲數(shù)中一定會占有一定的比重。而機器用戶的身份都是由是機器人程序創(chuàng)建的,其存在的目的并不是社交。因此,機器用戶的互粉好友會非常少或幾乎沒有;シ勐士杀硎緸:互粉率=互粉數(shù)關(guān)注人數(shù)+粉絲數(shù)3)時間合理度。發(fā)博時間合理度表現(xiàn)
第43卷第4期張曉藝,路燕,翟惠良:基于AHP與SVM的微博機器用戶檢測方法戶分類體系,,將分類特征進行分層,以得到機器用戶分類體系模型。模型分為3層,即目標層A、準則層B和指標層C。機器用戶分類指標體系如圖2所示。圖2機器用戶分類指標體系2.2.2各分類特征權(quán)重的確定分類特征的權(quán)重確定步驟如下:步驟1判斷矩陣的建立。本次實驗選取10位經(jīng)常使用新浪微博的學(xué)生,對層次體系結(jié)構(gòu)中的各項指標進行兩兩比較,采用“1~9”的評判方法進行賦值,建立兩兩判斷矩陣[9]。判斷矩陣是進行相對重要程度計算的重要依據(jù)[10],可表示為:A=(aij)n×n其中,aij代表矩陣元素Ui與Uj相對于其上一層元素重要性的比例標度,比值越大,則Ui的重要度就越高。各層的比較標度如表1、表2所示。表1機器用戶分類體系用戶行為特征評價要素的比較標度分類要素用戶被關(guān)注度互粉率時間合理度用戶被關(guān)注度136互粉率1/315時間合理度1/61/51得到判斷矩陣為:U1=1361/3151/61/51表2機器用戶分類體系博文內(nèi)容特征評價要素的比較標度分類要素關(guān)鍵詞詞頻鏈接比例提及比例標簽比例關(guān)鍵詞詞頻1486鏈接比例1/4153提及比例1/81/511/3標簽比例1/61/331得到判斷矩陣為:U2=14861/41531/81/511/31/61/331步驟2權(quán)重的確定。對判斷矩陣中的每一列進行歸一化處理之后,對歸一化的值進行求和,再將求和結(jié)果進行歸一化,即可得到特征向量的值。經(jīng)過計算[11],最終得到機器用戶分類體系中目標層、準則層和指標層的各分類指標的權(quán)重,如表3所示。表3各分類指標體系權(quán)重目標層(A)準則層(B)指標權(quán)重(B)指標層(C)指標權(quán)重(C)指標總?
【相似文獻】
相關(guān)期刊論文 前3條
1 劉正勇;涂慶華;宋駿飛;;AHP法在校園網(wǎng)系統(tǒng)質(zhì)量評價體系中的應(yīng)用分析[J];制造業(yè)自動化;2011年09期
2 王健;王慧強;趙國生;;基于不確定型AHP的網(wǎng)絡(luò)生存能力模糊綜合評估[J];計算機科學(xué);2006年06期
3 ;[J];;年期
相關(guān)碩士學(xué)位論文 前2條
1 奚平;基于AHP的學(xué)生健康成長網(wǎng)絡(luò)監(jiān)控系統(tǒng)設(shè)計與實現(xiàn)[D];電子科技大學(xué);2013年
2 趙奎;基于INTRANET的群體AHP的信用評級系統(tǒng)及其實現(xiàn)[D];合肥工業(yè)大學(xué);2004年
本文編號:2563758
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2563758.html
最近更新
教材專著