天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于集成學(xué)習(xí)的標(biāo)題分類(lèi)算法研究

發(fā)布時(shí)間:2018-02-25 09:19

  本文關(guān)鍵詞: 自然語(yǔ)言處理 標(biāo)題分類(lèi) 集成學(xué)習(xí) 改進(jìn)隨機(jī)森林 OOB二維權(quán)重分布 出處:《計(jì)算機(jī)應(yīng)用研究》2017年04期  論文類(lèi)型:期刊論文


【摘要】:標(biāo)題分類(lèi)是對(duì)一個(gè)標(biāo)題性語(yǔ)句進(jìn)行分類(lèi),通常這個(gè)標(biāo)題是不超過(guò)20個(gè)字的短文本,內(nèi)容精煉且概括性強(qiáng)。針對(duì)標(biāo)題文本的特征稀疏性和含義不確定性,提出了一種融合隨機(jī)森林與貝葉斯多項(xiàng)式的標(biāo)題分類(lèi)算法。該算法將貝葉斯多項(xiàng)式模型引入到隨機(jī)森林底層分類(lèi)器構(gòu)建過(guò)程中,同時(shí)利用隨機(jī)森林附帶的OOB數(shù)據(jù)提出了一種基于二維權(quán)重分布的投票機(jī)制。最后在圖書(shū)館真實(shí)書(shū)目數(shù)據(jù)上進(jìn)行實(shí)驗(yàn),針對(duì)分類(lèi)性能與當(dāng)前基于LDA主題擴(kuò)展的SVM算法進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果表明在一定條件下,該方法性能穩(wěn)定、表現(xiàn)較佳。
[Abstract]:Title categorization is the classification of a title statement, usually a short text with no more than 20 words, which is concise and general. A title classification algorithm combining stochastic forest and Bayesian polynomials is proposed, in which Bayesian polynomial model is introduced into the process of constructing stochastic forest classifier. At the same time, a voting mechanism based on two-dimensional weight distribution is proposed by using the OOB data attached to random forest. Finally, an experiment is carried out on the real bibliographic data of the library, and the classification performance is compared with the current SVM algorithm based on the extension of LDA topic. The experimental results show that the performance of this method is stable and good under certain conditions.
【作者單位】: 寧波大學(xué)信息科學(xué)與工程學(xué)院;
【基金】:國(guó)家社會(huì)科學(xué)基金資助項(xiàng)目(15FTQ002)
【分類(lèi)號(hào)】:TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前4條

1 葛文鎮(zhèn);劉柏嵩;王洋洋;趙福青;;基于層級(jí)類(lèi)別信息的標(biāo)題自動(dòng)分類(lèi)研究[J];計(jì)算機(jī)應(yīng)用研究;2016年07期

2 呂超鎮(zhèn);姬東鴻;吳飛飛;;基于LDA特征擴(kuò)展的短文本分類(lèi)[J];計(jì)算機(jī)工程與應(yīng)用;2015年04期

3 翟延冬;王康平;張東娜;黃嵐;周春光;;一種基于WordNet的短文本語(yǔ)義相似性算法[J];電子學(xué)報(bào);2012年03期

4 寧亞輝;樊興華;吳渝;;基于領(lǐng)域詞語(yǔ)本體的短文本分類(lèi)[J];計(jì)算機(jī)科學(xué);2009年03期

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 史慶偉;劉雨詩(shī);張豐田;;基于微博文本的詞對(duì)主題演化模型[J];計(jì)算機(jī)應(yīng)用;2017年05期

2 張磊;;文本分類(lèi)及分類(lèi)算法研究綜述[J];電腦知識(shí)與技術(shù);2016年34期

3 黃賢英;李沁東;劉英濤;;結(jié)合詞性的短文本相似度算法及其在文本分類(lèi)中的應(yīng)用[J];電訊技術(shù);2017年01期

4 郝偉學(xué);于劍;周雪忠;;本體對(duì)齊技術(shù)概述及其在中醫(yī)領(lǐng)域的應(yīng)用探討[J];世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化;2017年01期

5 張謙;高章敏;劉嘉勇;;基于Word2vec的微博短文本分類(lèi)研究[J];信息網(wǎng)絡(luò)安全;2017年01期

6 段旭磊;張仰森;郭正斌;;微博文本聚類(lèi)中特征擴(kuò)展策略研究[J];計(jì)算機(jī)工程與應(yīng)用;2017年13期

7 儲(chǔ)濤濤;;基于LDA主題模型的用戶(hù)興趣發(fā)現(xiàn)方法[J];軟件;2016年12期

8 王震;代巖巖;陳亮;林曉蘭;;基于LDA模型的95598熱點(diǎn)業(yè)務(wù)工單挖掘分析[J];電子技術(shù)與軟件工程;2016年22期

9 張群;王紅軍;王倫文;;一種結(jié)合上下文語(yǔ)義的短文本聚類(lèi)算法[J];計(jì)算機(jī)科學(xué);2016年S2期

10 李湘東;劉康;丁叢;廖香鵬;;基于知網(wǎng)語(yǔ)義特征擴(kuò)展的題名信息分類(lèi)[J];圖書(shū)館雜志;2017年02期

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 姚長(zhǎng)青;杜永萍;;降維技術(shù)在專(zhuān)利文本聚類(lèi)中的應(yīng)用研究[J];情報(bào)學(xué)報(bào);2014年05期

2 張素智;劉婧姣;;基于語(yǔ)義的KNN短文本分類(lèi)算法研究[J];鄭州輕工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)版);2012年06期

3 何力;賈焰;韓偉紅;譚霜;陳志坤;;大規(guī)模層次分類(lèi)問(wèn)題研究及其進(jìn)展[J];計(jì)算機(jī)學(xué)報(bào);2012年10期

4 翟延冬;王康平;張東娜;黃嵐;周春光;;一種基于WordNet的短文本語(yǔ)義相似性算法[J];電子學(xué)報(bào);2012年03期

5 劉金嶺;嚴(yán)云洋;;基于上下文的短信文本分類(lèi)方法[J];計(jì)算機(jī)工程;2011年10期

6 姚全珠;宋志理;彭程;;基于LDA模型的文本分類(lèi)研究[J];計(jì)算機(jī)工程與應(yīng)用;2011年13期

7 祝翠玲;馬軍;張冬梅;;面向?qū)哟畏诸?lèi)的文本特征選擇方法[J];模式識(shí)別與人工智能;2011年01期

8 魯婷;王浩;姚宏亮;;一種基于中心文檔的KNN中文文本分類(lèi)算法[J];計(jì)算機(jī)工程與應(yīng)用;2011年02期

9 張東娜;周春光;劉彥斌;郭東偉;;一種基于WordNet和Corpus Statistics的語(yǔ)義相似性計(jì)算方法[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2010年05期

10 賀濤;曹先彬;譚輝;;基于免疫的中文網(wǎng)絡(luò)短文本聚類(lèi)算法[J];自動(dòng)化學(xué)報(bào);2009年07期

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 袁漢寧;;雙層多示例集成學(xué)習(xí)[J];武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版);2011年05期

2 俞揚(yáng);周志華;;集成學(xué)習(xí)中完全隨機(jī)學(xué)習(xí)策略研究[J];計(jì)算機(jī)工程;2006年17期

3 張滄生;崔麗娟;楊剛;倪志宏;;集成學(xué)習(xí)算法的比較研究[J];河北大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年05期

4 陳凱;;基于聚類(lèi)技術(shù)的集成學(xué)習(xí)差異性研究[J];南京工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報(bào);2008年04期

5 李凱;崔麗娟;;集成學(xué)習(xí)算法的差異性及性能比較[J];計(jì)算機(jī)工程;2008年06期

6 潘志松;燕繼坤;;少數(shù)類(lèi)的集成學(xué)習(xí)[J];南京航空航天大學(xué)學(xué)報(bào);2009年04期

7 陳凱;馬景義;;一種選擇性SER-BagBoosting Trees集成學(xué)習(xí)研究[J];計(jì)算機(jī)科學(xué);2009年09期

8 陳全;趙文輝;李潔;江雨燕;;選擇性集成學(xué)習(xí)算法的研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2010年02期

9 張燕平;曹振田;趙姝;鄭堯軍;杜玲;竇蓉蓉;;一種新的決策樹(shù)選擇性集成學(xué)習(xí)方法[J];計(jì)算機(jī)工程與應(yīng)用;2010年17期

10 饒峰;;核機(jī)器集成學(xué)習(xí)算法的誤差分析[J];重慶文理學(xué)院學(xué)報(bào)(自然科學(xué)版);2010年04期

相關(guān)會(huì)議論文 前4條

1 關(guān)菁華;劉大有;賈海洋;;自適應(yīng)多分類(lèi)器集成學(xué)習(xí)算法[A];第二十五屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(二)[C];2008年

2 劉伍穎;王挺;;一種多過(guò)濾器集成學(xué)習(xí)垃圾郵件過(guò)濾方法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

3 葉紅云;倪志偉;陳恩紅;;一種混合型集成學(xué)習(xí)演化決策樹(shù)算法[A];2005年“數(shù)字安徽”博士科技論壇論文集[C];2005年

4 李燁;蔡云澤;許曉鳴;;基于支持向量機(jī)集成的故障診斷[A];第16屆中國(guó)過(guò)程控制學(xué)術(shù)年會(huì)暨第4屆全國(guó)故障診斷與安全性學(xué)術(shù)會(huì)議論文集[C];2005年

相關(guān)博士學(xué)位論文 前10條

1 阿里木·賽買(mǎi)提(Alim.Samat);基于集成學(xué)習(xí)的全極化SAR圖像分類(lèi)研究[D];南京大學(xué);2015年

2 王永明;集成回歸問(wèn)題若干關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2015年

3 常征;基于混合集成學(xué)習(xí)的眼部與四肢交互動(dòng)作建模與識(shí)別[D];北京科技大學(xué);2016年

4 張春霞;集成學(xué)習(xí)中有關(guān)算法的研究[D];西安交通大學(xué);2010年

5 劉天羽;基于特征選擇技術(shù)的集成學(xué)習(xí)方法及其應(yīng)用研究[D];上海大學(xué);2007年

6 尹華;面向高維和不平衡數(shù)據(jù)分類(lèi)的集成學(xué)習(xí)研究[D];武漢大學(xué);2012年

7 王清;集成學(xué)習(xí)中若干關(guān)鍵問(wèn)題的研究[D];復(fù)旦大學(xué);2011年

8 方育柯;集成學(xué)習(xí)理論研究及其在個(gè)性化推薦中的應(yīng)用[D];電子科技大學(xué);2011年

9 侯勇;特征提取與集成學(xué)習(xí)算法的研究及應(yīng)用[D];北京科技大學(xué);2015年

10 李燁;基于支持向量機(jī)的集成學(xué)習(xí)研究[D];上海交通大學(xué);2007年

相關(guān)碩士學(xué)位論文 前10條

1 高偉;基于半監(jiān)督集成學(xué)習(xí)的情感分類(lèi)方法研究[D];蘇州大學(xué);2015年

2 宋文展;基于抽樣的集成進(jìn)化算法研究[D];廣西大學(xué);2015年

3 湯瑩;遷移與集成學(xué)習(xí)在文本分類(lèi)中的應(yīng)用研究[D];江蘇科技大學(xué);2015年

4 劉政;基于知識(shí)元和集成學(xué)習(xí)的中文微博情感分析[D];大連理工大學(xué);2015年

5 丘橋云;結(jié)合文本傾向性分析的股評(píng)可信度計(jì)算研究[D];哈爾濱工業(yè)大學(xué);2014年

6 秦海;融合非標(biāo)記樣本選擇的集成學(xué)習(xí)研究[D];湘潭大學(xué);2015年

7 李想;基于多示例的集成學(xué)習(xí)理論與應(yīng)用研究[D];合肥工業(yè)大學(xué);2014年

8 李震宇;基于集成學(xué)習(xí)的數(shù)字圖像隱寫(xiě)定量分析[D];解放軍信息工程大學(xué);2014年

9 王希玲;基于選擇性集成學(xué)習(xí)的網(wǎng)絡(luò)入侵檢測(cè)方法研究[D];青島科技大學(xué);2016年

10 陳范曙;基于信息整合的藥物相關(guān)信息挖掘方法研究[D];華東師范大學(xué);2016年

,

本文編號(hào):1533841

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1533841.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)5eb60***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com