中文文本局部特征選擇方法研究
【文章頁數(shù)】:51 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.1局部特征選擇文本分類流程
中文文本局部特征選擇方法研究4圖1.1局部特征選擇文本分類流程Figure1.1localfeatureselectiontextclassificationprocess本文主要研究內(nèi)容為以下三大部分:1)研究傳統(tǒng)卡方統(tǒng)計量與改進(jìn)后卡方統(tǒng)計量的區(qū)別。傳統(tǒng)卡方統(tǒng)計量(CHI)方法....
圖2.1支持向量機(jī)與超平面
第二章文本分類描述理論及方法13計算間隔最大的超平面,其目標(biāo)函數(shù)為:,2,..()1||||Tiiwbmaxstywxbw(2.15)其中,y表示樣本所屬的類別,分為正類和負(fù)類。當(dāng)樣本屬于正類時,1Twxb,當(dāng)樣本屬于負(fù)類時,1Twxb。圖2.1支持向量機(jī)與超平面Figure2.....
圖4.1局部特征選擇算法主要思想圖示
第四章基于梯度上升和共現(xiàn)分析的局部特征選擇方法23的共現(xiàn)強(qiáng)度,當(dāng)共現(xiàn)強(qiáng)度大于事先設(shè)定好的閾值時,刪除兩個關(guān)鍵詞中對分類作用小的詞,依次計算得到每個類別下的關(guān)鍵詞子集,最后將所有類別下的關(guān)鍵詞合并得到最終結(jié)果。圖4.1局部特征選擇算法主要思想圖示Figure4.1mainidead....
圖4.2詞共現(xiàn)強(qiáng)度分塊操作示意圖
中文文本局部特征選擇方法研究24Step6將詞共現(xiàn)強(qiáng)度矩陣nnQ按照類別的順序進(jìn)行分塊,從而得到多個局部詞共現(xiàn)強(qiáng)度矩陣,其中ijQ為第i個類別的代表關(guān)鍵詞和第j個類別的代表關(guān)鍵詞之間的共現(xiàn)強(qiáng)度矩陣。圖4.2詞共現(xiàn)強(qiáng)度分塊操作示意圖Figure4.2wordco-occurrenc....
本文編號:3926342
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3926342.html