天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

中文文本局部特征選擇方法研究

發(fā)布時間:2024-03-12 01:42
  如今互聯(lián)網(wǎng)的快速發(fā)展,各領(lǐng)域都產(chǎn)生了大量的數(shù)據(jù),如何充分的利用這些數(shù)據(jù),是目前最需解決的問題。在處理文檔數(shù)據(jù)的過程中,常常采用文本自動分類技術(shù),來實現(xiàn)文檔數(shù)據(jù)的量化存儲工作,如此分類技術(shù)也應(yīng)當(dāng)加以改進(jìn),其中特征維度的降低顯得尤為的重要,通過局部特征選擇方法來降低特征空間維度,去除冗余關(guān)鍵詞,準(zhǔn)確選取能夠代表各類別的關(guān)鍵詞,對分類器本身的性能進(jìn)行改進(jìn),從而提高文本分類精度。本文針對傳統(tǒng)的卡方統(tǒng)計量(CHI)進(jìn)行特征選擇時,僅考慮特征詞在該類別是否出現(xiàn)的缺點,提出引入詞頻權(quán)重和負(fù)相關(guān)修正因子,得到一種新的改進(jìn)后CHI特征選擇方法,記為CHI-NFID特征選擇方法,在此基礎(chǔ)上,考慮引入共現(xiàn)矩陣,提出一種新的局部特征選擇方法,既考慮特征詞與類別之間的相關(guān)關(guān)系,又考慮特征詞之間的語義關(guān)系,確保文本特征含有盡可能少的冗余信息,從而降低特征向量維度。首先,將改進(jìn)的卡方特征選擇方法與傳統(tǒng)的卡方特征選擇方法進(jìn)行對比,進(jìn)行模擬分類實驗。其次,利用XGBoost(梯度提升法)計算關(guān)鍵詞在分類過程中的重要度,根據(jù)篇詞矩陣,得到類詞頻數(shù)矩陣,利用改進(jìn)后的卡方特征選擇方法,計算類詞卡方矩陣,選出各個關(guān)鍵詞的最大卡...

【文章頁數(shù)】:51 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖1.1局部特征選擇文本分類流程

圖1.1局部特征選擇文本分類流程

中文文本局部特征選擇方法研究4圖1.1局部特征選擇文本分類流程Figure1.1localfeatureselectiontextclassificationprocess本文主要研究內(nèi)容為以下三大部分:1)研究傳統(tǒng)卡方統(tǒng)計量與改進(jìn)后卡方統(tǒng)計量的區(qū)別。傳統(tǒng)卡方統(tǒng)計量(CHI)方法....


圖2.1支持向量機(jī)與超平面

圖2.1支持向量機(jī)與超平面

第二章文本分類描述理論及方法13計算間隔最大的超平面,其目標(biāo)函數(shù)為:,2,..()1||||Tiiwbmaxstywxbw(2.15)其中,y表示樣本所屬的類別,分為正類和負(fù)類。當(dāng)樣本屬于正類時,1Twxb,當(dāng)樣本屬于負(fù)類時,1Twxb。圖2.1支持向量機(jī)與超平面Figure2.....


圖4.1局部特征選擇算法主要思想圖示

圖4.1局部特征選擇算法主要思想圖示

第四章基于梯度上升和共現(xiàn)分析的局部特征選擇方法23的共現(xiàn)強(qiáng)度,當(dāng)共現(xiàn)強(qiáng)度大于事先設(shè)定好的閾值時,刪除兩個關(guān)鍵詞中對分類作用小的詞,依次計算得到每個類別下的關(guān)鍵詞子集,最后將所有類別下的關(guān)鍵詞合并得到最終結(jié)果。圖4.1局部特征選擇算法主要思想圖示Figure4.1mainidead....


圖4.2詞共現(xiàn)強(qiáng)度分塊操作示意圖

圖4.2詞共現(xiàn)強(qiáng)度分塊操作示意圖

中文文本局部特征選擇方法研究24Step6將詞共現(xiàn)強(qiáng)度矩陣nnQ按照類別的順序進(jìn)行分塊,從而得到多個局部詞共現(xiàn)強(qiáng)度矩陣,其中ijQ為第i個類別的代表關(guān)鍵詞和第j個類別的代表關(guān)鍵詞之間的共現(xiàn)強(qiáng)度矩陣。圖4.2詞共現(xiàn)強(qiáng)度分塊操作示意圖Figure4.2wordco-occurrenc....



本文編號:3926342

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3926342.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b9249***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
中文字幕中文字幕一区二区| 尹人大香蕉一级片免费看| 日韩免费国产91在线| 一区二区在线激情视频| 丰满人妻一二区二区三区av| 亚洲男人的天堂久久a| 亚洲最新中文字幕在线视频 | 国产三级视频不卡在线观看| 沐浴偷拍一区二区视频| 国产精品亚洲精品亚洲| 最新69国产精品视频| 欧美午夜色视频国产精品| 日韩精品视频一二三区| 国产欧美日韩在线精品一二区| 国产目拍亚洲精品区一区| 欧美熟妇一区二区在线| 成人国产激情福利久久| 小草少妇视频免费看视频| 九九热国产这里只有精品| 日韩欧美第一页在线观看| 精品亚洲一区二区三区w竹菊| 国产一区二区熟女精品免费| 欧美丰满大屁股一区二区三区| 亚洲免费观看一区二区三区| 东京干男人都知道的天堂| 在线欧洲免费无线码二区免费| 中日韩免费一区二区三区| 人妻偷人精品一区二区三区不卡 | 91播色在线免费播放| 国产精品制服丝袜美腿丝袜| 国产老女人性生活视频| 国产高清精品福利私拍| 国产又粗又猛又爽又黄的文字| 国产精品夜色一区二区三区不卡| 国产熟女一区二区精品视频| 日韩免费成人福利在线| 日本加勒比在线观看一区| 搡老熟女老女人一区二区| 亚洲最新的黄色录像在线| 国产欧美性成人精品午夜| 真实国产乱子伦对白视频不卡|