天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于自身特征擴(kuò)展的短文本分類方法

發(fā)布時(shí)間:2018-06-13 21:33

  本文選題:短文本 + 稀疏; 參考:《計(jì)算機(jī)應(yīng)用研究》2017年04期


【摘要】:短文本具有特征稀疏、描述概念信號(hào)弱等特點(diǎn),傳統(tǒng)方法對(duì)短文本進(jìn)行分類很難取得較好結(jié)果。針對(duì)上述問(wèn)題,提出了一種基于自身特征擴(kuò)展的短文本分類方法 SC-FE。該方法首先基于類內(nèi)離散度從每個(gè)類中選取高類別指示性的特征組成特征空間;其次對(duì)樣本的特征,在已選的特征空間中選取其相關(guān)度最大的特征加入短文本中進(jìn)行擴(kuò)充。在實(shí)際數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該方法可有效提高短文本的分類效果。
[Abstract]:Short text is characterized by sparse features and weak description of conceptual signals. It is difficult to obtain good results by traditional methods for classifying short text. In order to solve the above problems, a novel short text classification method, SC-FE, is proposed, which is based on the expansion of its own features. The method firstly selects high class indicative features from each class to form a feature space based on the intra-class dispersion; secondly, the feature of the sample is selected and the feature with the highest correlation is selected in the selected feature space to be added to the short text to expand the feature space. The experimental results on actual data sets show that the proposed method can effectively improve the classification effect of short text.
【作者單位】: 合肥工業(yè)大學(xué)計(jì)算機(jī)與信息學(xué)院;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(61503112,61305063,61673152)
【分類號(hào)】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 陳林;楊丹;;獨(dú)立于語(yǔ)種的文本分類方法[J];計(jì)算機(jī)工程與科學(xué);2008年06期

2 張燕平;徐慶鵬;蘇守寶;邢猛;;一種基于貪婪覆蓋的文本分類方法[J];計(jì)算機(jī)技術(shù)與發(fā)展;2009年01期

3 焦慶爭(zhēng);蔚承建;;一種基于特征投票的文本分類方法[J];計(jì)算機(jī)工程;2010年09期

4 孟海東;張煉;呂海林;;基于圖模型的文本分類方法的研究[J];計(jì)算機(jī)與現(xiàn)代化;2010年09期

5 仲兆滿;李存華;;基于重要事件的文本分類方法研究[J];微電子學(xué)與計(jì)算機(jī);2012年03期

6 赫芳;王洋;;網(wǎng)絡(luò)的簡(jiǎn)監(jiān)督文本分類方法[J];計(jì)算機(jī)與網(wǎng)絡(luò);2012年17期

7 朱志寧;萬(wàn)小容;黃青松;;一種改進(jìn)的基于信噪比的文本分類方法[J];寧波廣播電視大學(xué)學(xué)報(bào);2005年04期

8 朱斐;刁紅軍;呂強(qiáng);;一種富文本分類方法的設(shè)計(jì)和實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用與軟件;2007年12期

9 臺(tái)德藝;謝飛;胡學(xué)鋼;;新的基于簇劃分文本分類方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年06期

10 楊林波;王士同;;基于類別分布特征的快速文本分類方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年05期

相關(guān)會(huì)議論文 前9條

1 陳克利;宗成慶;王霞;;基于大規(guī)模真實(shí)文本的平衡語(yǔ)料分析與文本分類方法[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年

2 姚天f ;彭思崴;;漢語(yǔ)主客觀文本分類方法的研究[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

3 李月倫;李湘;常寶寶;袁毓林;;一種基于認(rèn)知情景框架的文本分類方法[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年

4 張永;陳思睿;楊志勇;;一種改進(jìn)的文本分類方法的研究[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

5 陳毅恒;秦兵;劉挺;林建國(guó);李生;;基于錯(cuò)誤預(yù)測(cè)的文本分類方法[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年

6 宋鑫穎;周志逵;;一種基于SVM的主動(dòng)學(xué)習(xí)文本分類方法[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年

7 盧嬌麗;鄭家恒;;基于粗糙集的文本分類方法研究[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年

8 牛強(qiáng);王志曉;陳岱;夏士雄;;基于支持向量機(jī)的Web文本分類方法[A];2006年全國(guó)開(kāi)放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集(一)[C];2006年

9 張政;周水庚;周傲英;;一種新的基于kNN和Rocchio的文本分類方法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年

相關(guān)碩士學(xué)位論文 前10條

1 江大鵬;基于詞向量的短文本分類方法研究[D];浙江大學(xué);2015年

2 陳遠(yuǎn)超;基于MapReduce的大數(shù)據(jù)文本分類方法研究[D];浙江師范大學(xué);2015年

3 年素磊;自由文本分類技術(shù)研究[D];南京大學(xué);2014年

4 譚建平;基于半監(jiān)督的SVM遷移學(xué)習(xí)文本分類方法[D];廣東工業(yè)大學(xué);2016年

5 黃旭;基于機(jī)器學(xué)習(xí)的漢語(yǔ)短文本分類方法研究與實(shí)現(xiàn)[D];黑龍江大學(xué);2016年

6 王丹丹;基于特征選擇的文本分類方法研究及其應(yīng)用[D];江南大學(xué);2017年

7 朱斐;一種富文本分類方法的研究與實(shí)現(xiàn)[D];蘇州大學(xué);2006年

8 李萍;基于改進(jìn)詞語(yǔ)權(quán)重的文本分類方法研究[D];東北師范大學(xué);2010年

9 王燕霞;基于相關(guān)主題模型的文本分類方法研究[D];蘇州大學(xué);2010年

10 張建興;一種提取類核的快速文本分類方法[D];蘭州理工大學(xué);2010年



本文編號(hào):2015493

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2015493.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶259ae***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com