網(wǎng)絡(luò)交易垃圾評(píng)論智能識(shí)別研究
【圖文】:
建立正規(guī)增益為屬性選擇標(biāo)準(zhǔn)的決策樹(shù)NG(A,S)=∑4t=1-pilog2pi-∑j∈value(A)SjS∑4t=1-pilog2pilog2n(2)其中pi是屬于類(lèi)別t的樣本占總樣本數(shù)的比例。Value(A)為特征A的取值集合。S和Sj分別為樣本總數(shù)以及特征A取值為j的樣本個(gè)數(shù)。3.3垃圾評(píng)論識(shí)別流程本文首先采用中科院計(jì)算技術(shù)研究所的ICTCLAS工具,并通過(guò)加入HowNet情感詞典和自定義詞典對(duì)評(píng)論語(yǔ)料進(jìn)行分詞和詞性標(biāo)注等預(yù)處理,再運(yùn)用神經(jīng)網(wǎng)絡(luò)與決策樹(shù)相結(jié)合的模型對(duì)數(shù)據(jù)進(jìn)行分類(lèi)。具體流程如圖1所示:圖1垃圾評(píng)論識(shí)別流程圖—59—2016年4月第36卷第4期現(xiàn)代情報(bào)JournalofModernInformationApr.,2016Vol.36No.4
,如果只要樣例被正確劃分為垃圾評(píng)論,而不必考慮具體是欺騙型、干擾性還是低效用性垃圾評(píng)論,則本文試驗(yàn)結(jié)果在查準(zhǔn)率、查全率、綜合F值、總準(zhǔn)確率上均遠(yuǎn)高于SVM模型。表4不同模型預(yù)測(cè)精度對(duì)比模型垃圾評(píng)論查準(zhǔn)率(%)查全率(%)綜合值F(%)評(píng)論總準(zhǔn)確率(%)Logistic回歸二分類(lèi)80.663.270.871.2SVM二分類(lèi)79.874.076.877.2本文模型四分類(lèi)80.776.078.380.5本文模型二分類(lèi)85.080.082.482.6為了進(jìn)一步驗(yàn)證本文方法的穩(wěn)定性,對(duì)以上數(shù)據(jù)采用4次交叉法重新實(shí)驗(yàn),4次實(shí)驗(yàn)結(jié)果的各性能指標(biāo)如圖2~4所示:圖24次實(shí)驗(yàn)的查準(zhǔn)率指標(biāo)因?yàn)橛?xùn)練集的子例是隨機(jī)選取,使各個(gè)類(lèi)型的子例在訓(xùn)練集中所占的比例不同,數(shù)據(jù)的結(jié)構(gòu)會(huì)有所變化,但每組實(shí)驗(yàn)的識(shí)別精度大致相同,,說(shuō)明方法的穩(wěn)定性較好。從篩選后用于建立決策樹(shù)的屬性來(lái)看,也存在比較穩(wěn)定的趨勢(shì),具體情況如表5所示!60—2016年4月第36卷第4期網(wǎng)絡(luò)交易垃圾評(píng)論智能識(shí)別研究Apr.,2016Vol.36No.4
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前9條
1 袁阿勇;盛步云;;新型分類(lèi)裝置的智能識(shí)別與控制[J];物流技術(shù);2006年11期
2 ;智能識(shí)別開(kāi)啟商業(yè)新時(shí)代[J];現(xiàn)代商業(yè);2014年19期
3 張正華;武邦濤;;危險(xiǎn)化學(xué)品禁忌智能識(shí)別和決策支持系統(tǒng)研究[J];上海管理科學(xué);2009年01期
4 彭嬋;;夢(mèng)想改變生活 挑戰(zhàn)識(shí)別銀晨——訪上海銀晨智能識(shí)別科技有限公司董事長(zhǎng)張青[J];中國(guó)公共安全(綜合版);2006年12期
5 張青;;智能識(shí)別市場(chǎng)現(xiàn)狀及未來(lái)幾年發(fā)展趨勢(shì)[J];中國(guó)安防;2007年Z1期
6 韓金輝;;安全還是管理? 淺析一卡通產(chǎn)品市場(chǎng)與技術(shù)[J];中國(guó)安防;2007年07期
7 蘇晨;;智能識(shí)別市場(chǎng)的現(xiàn)狀及發(fā)展趨勢(shì)[J];中國(guó)防偽報(bào)道;2007年12期
8 盧全進(jìn);;絞車(chē)智能識(shí)別系統(tǒng)在爐峪口礦的應(yīng)用[J];中國(guó)高新技術(shù)企業(yè);2013年33期
9 ;[J];;年期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前3條
1 杜松懷;劉志存;王忠義;施正香;;基于紅外通信的動(dòng)物身份智能識(shí)別裝置[A];農(nóng)業(yè)工程科技創(chuàng)新與建設(shè)現(xiàn)代農(nóng)業(yè)——2005年中國(guó)農(nóng)業(yè)工程學(xué)會(huì)學(xué)術(shù)年會(huì)論文集第三分冊(cè)[C];2005年
2 唐盛;鹿昌義;梁艷川;;微生物智能識(shí)別方法的研究與實(shí)現(xiàn)[A];中華醫(yī)學(xué)會(huì)第七次全國(guó)檢驗(yàn)醫(yī)學(xué)學(xué)術(shù)會(huì)議資料匯編[C];2008年
3 溫利東;;以太網(wǎng)技術(shù)發(fā)展趨勢(shì)[A];2003年內(nèi)蒙古自治區(qū)自然科學(xué)學(xué)術(shù)年會(huì)優(yōu)秀論文集[C];2003年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 ;近場(chǎng)通信實(shí)現(xiàn)畜牧業(yè)智能識(shí)別[N];人民郵電;2008年
2 鄭金武;中科院與香港科大共建智能識(shí)別實(shí)驗(yàn)室[N];江蘇科技報(bào);2009年
3 陳文 吳南強(qiáng);華雨科技人臉智能識(shí)別系統(tǒng)進(jìn)軍世博[N];宜興日?qǐng)?bào);2010年
4 本報(bào)記者蔡云錦;漢字智能識(shí)別產(chǎn)業(yè)漸成氣候[N];中國(guó)經(jīng)營(yíng)報(bào);2002年
5 《網(wǎng)絡(luò)世界》記者 高楊;智能識(shí)別開(kāi)啟音樂(lè)應(yīng)用新模式[N];網(wǎng)絡(luò)世界;2013年
6 記者 沐滟;智能識(shí)別企業(yè)抱團(tuán)拼搶市場(chǎng)[N];無(wú)錫日?qǐng)?bào);2012年
7 袁華;網(wǎng)絡(luò)時(shí)代呼喚智能識(shí)別[N];中國(guó)貿(mào)易報(bào);2000年
8 記者 喬佳妮 母家亮;西安出租車(chē)有了電子“身份證”[N];陜西日?qǐng)?bào);2010年
9 齊澤萍;今后,不停車(chē)即可進(jìn)行運(yùn)政稽查[N];山西經(jīng)濟(jì)日?qǐng)?bào);2008年
10 肖春飛 潘旭;大中小學(xué)生角逐“機(jī)器人”大賽[N];大眾科技報(bào);2009年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 皋軍;智能識(shí)別中的降維新方法及其應(yīng)用研究[D];江南大學(xué);2010年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 凌云峰;基于安控平臺(tái)的智能識(shí)別與報(bào)警[D];蘇州大學(xué);2009年
2 洪炎峰;實(shí)時(shí)海洋浮游生物目標(biāo)智能識(shí)別系統(tǒng)設(shè)計(jì)[D];浙江大學(xué);2012年
3 張翔;基于神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)損傷遠(yuǎn)程智能識(shí)別方法研究[D];武漢理工大學(xué);2004年
4 張知臨;工商網(wǎng)上違法廣告智能識(shí)別關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];浙江大學(xué);2013年
5 駱曉娟;市容違章行為智能識(shí)別系統(tǒng)設(shè)計(jì)[D];浙江大學(xué);2014年
6 吳成勇;基于模糊技術(shù)的智能識(shí)別及其應(yīng)用研究[D];江南大學(xué);2011年
7 丁方;心電畸異波智能識(shí)別方法的研究[D];華東理工大學(xué);2012年
8 李翔基;基于本體的虛擬零件智能識(shí)別方法研究與應(yīng)用[D];北京郵電大學(xué);2009年
9 史中輝;玉米種子品種智能識(shí)別系統(tǒng)研究[D];山東農(nóng)業(yè)大學(xué);2011年
10 王強(qiáng);基于小波和希爾伯特—黃變換的氣液兩相流流型智能識(shí)別方法[D];東北電力大學(xué);2007年
本文編號(hào):2567124
本文鏈接:http://sikaile.net/jingjilunwen/hongguanjingjilunwen/2567124.html