面向概念漂移問題的選擇性適應(yīng)集成學(xué)習(xí)方法研究
本文關(guān)鍵詞:面向概念漂移問題的選擇性適應(yīng)集成學(xué)習(xí)方法研究 出處:《中國科學(xué)技術(shù)大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 增量學(xué)習(xí) 概念漂移 遷移學(xué)習(xí) 集成學(xué)習(xí)
【摘要】:在當(dāng)前的大數(shù)據(jù)時代,增量學(xué)習(xí)作為一種能增量處理數(shù)據(jù)的方法變得愈發(fā)重要,而概念漂移問題則是增量學(xué)習(xí)中亟待解決的一個關(guān)鍵問題。目前為止,盡管有很多算法已經(jīng)被提出用來解決這個問題,但是仍舊難以做到快速有效的響應(yīng)漂移的發(fā)生。在本文中,我們的主要研究就是如何有效解決增量學(xué)習(xí)中的概念漂移問題。我們首先提出了一種新的叫做 STIL(Selective Transfer Incremental Learning)的方法來解決概念漂移這個難題。STIL在經(jīng)典的基于數(shù)據(jù)塊集成算法基礎(chǔ)上使用了一種選擇性遷移的策略。以這種方式,STIL在通過遷移學(xué)習(xí)很好的適應(yīng)新概念的同時,制定了適當(dāng)?shù)倪x擇策略有效防止了遷移學(xué)習(xí)過程中可能發(fā)生的負(fù)遷移和過擬合問題。我們將這個算法在15個合成數(shù)據(jù)集和3個真實數(shù)據(jù)集上進行了評估,實驗結(jié)果顯示STIL在幾乎所有數(shù)據(jù)集上都好于其它5個先進的相關(guān)算法。其次,我們研究了子模型適應(yīng)性對集成模型應(yīng)對概念漂移的影響。并通過實驗分析發(fā)現(xiàn):包含一批具有過強適應(yīng)性的子模型不會提升集成模型的效果,反而會限制其作為整體對概念漂移的響應(yīng)能力。并且在這個觀點的基礎(chǔ)上,我們發(fā)現(xiàn)與提升全部子模型相比,只提升部分子模型的適應(yīng)性能夠有效提升算法的性能。在當(dāng)前采用能增量更新的子模型成為基于數(shù)據(jù)塊集成方法的一大趨勢的研究背景下,我們的這項研究說明了子模型適應(yīng)性的提升需要有節(jié)制,且部分提升的效果會更好。另外,我們在6個合成數(shù)據(jù)集和2個真實數(shù)據(jù)集上對這兩個觀點進行了驗證,實驗結(jié)果很好地證明了我們的觀點。
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP181
【相似文獻】
相關(guān)期刊論文 前10條
1 崔麗娟;李凱;倪志宏;;基于分類的集成學(xué)習(xí)算法研究[J];河北大學(xué)學(xué)報(自然科學(xué)版);2007年04期
2 袁漢寧;;雙層多示例集成學(xué)習(xí)[J];武漢理工大學(xué)學(xué)報(信息與管理工程版);2011年05期
3 俞揚;周志華;;集成學(xué)習(xí)中完全隨機學(xué)習(xí)策略研究[J];計算機工程;2006年17期
4 張滄生;崔麗娟;楊剛;倪志宏;;集成學(xué)習(xí)算法的比較研究[J];河北大學(xué)學(xué)報(自然科學(xué)版);2007年05期
5 陳凱;;基于聚類技術(shù)的集成學(xué)習(xí)差異性研究[J];南京工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報;2008年04期
6 李凱;崔麗娟;;集成學(xué)習(xí)算法的差異性及性能比較[J];計算機工程;2008年06期
7 潘志松;燕繼坤;;少數(shù)類的集成學(xué)習(xí)[J];南京航空航天大學(xué)學(xué)報;2009年04期
8 陳凱;馬景義;;一種選擇性SER-BagBoosting Trees集成學(xué)習(xí)研究[J];計算機科學(xué);2009年09期
9 陳全;趙文輝;李潔;江雨燕;;選擇性集成學(xué)習(xí)算法的研究[J];計算機技術(shù)與發(fā)展;2010年02期
10 張燕平;曹振田;趙姝;鄭堯軍;杜玲;竇蓉蓉;;一種新的決策樹選擇性集成學(xué)習(xí)方法[J];計算機工程與應(yīng)用;2010年17期
相關(guān)會議論文 前4條
1 關(guān)菁華;劉大有;賈海洋;;自適應(yīng)多分類器集成學(xué)習(xí)算法[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(二)[C];2008年
2 劉伍穎;王挺;;一種多過濾器集成學(xué)習(xí)垃圾郵件過濾方法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
3 葉紅云;倪志偉;陳恩紅;;一種混合型集成學(xué)習(xí)演化決策樹算法[A];2005年“數(shù)字安徽”博士科技論壇論文集[C];2005年
4 李燁;蔡云澤;許曉鳴;;基于支持向量機集成的故障診斷[A];第16屆中國過程控制學(xué)術(shù)年會暨第4屆全國故障診斷與安全性學(xué)術(shù)會議論文集[C];2005年
相關(guān)博士學(xué)位論文 前10條
1 阿里木·賽買提(Alim.Samat);基于集成學(xué)習(xí)的全極化SAR圖像分類研究[D];南京大學(xué);2015年
2 王永明;集成回歸問題若干關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2015年
3 常征;基于混合集成學(xué)習(xí)的眼部與四肢交互動作建模與識別[D];北京科技大學(xué);2016年
4 張春霞;集成學(xué)習(xí)中有關(guān)算法的研究[D];西安交通大學(xué);2010年
5 劉天羽;基于特征選擇技術(shù)的集成學(xué)習(xí)方法及其應(yīng)用研究[D];上海大學(xué);2007年
6 尹華;面向高維和不平衡數(shù)據(jù)分類的集成學(xué)習(xí)研究[D];武漢大學(xué);2012年
7 王清;集成學(xué)習(xí)中若干關(guān)鍵問題的研究[D];復(fù)旦大學(xué);2011年
8 方育柯;集成學(xué)習(xí)理論研究及其在個性化推薦中的應(yīng)用[D];電子科技大學(xué);2011年
9 侯勇;特征提取與集成學(xué)習(xí)算法的研究及應(yīng)用[D];北京科技大學(xué);2015年
10 李燁;基于支持向量機的集成學(xué)習(xí)研究[D];上海交通大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 高偉;基于半監(jiān)督集成學(xué)習(xí)的情感分類方法研究[D];蘇州大學(xué);2015年
2 宋文展;基于抽樣的集成進化算法研究[D];廣西大學(xué);2015年
3 湯瑩;遷移與集成學(xué)習(xí)在文本分類中的應(yīng)用研究[D];江蘇科技大學(xué);2015年
4 劉政;基于知識元和集成學(xué)習(xí)的中文微博情感分析[D];大連理工大學(xué);2015年
5 丘橋云;結(jié)合文本傾向性分析的股評可信度計算研究[D];哈爾濱工業(yè)大學(xué);2014年
6 秦海;融合非標(biāo)記樣本選擇的集成學(xué)習(xí)研究[D];湘潭大學(xué);2015年
7 李想;基于多示例的集成學(xué)習(xí)理論與應(yīng)用研究[D];合肥工業(yè)大學(xué);2014年
8 李震宇;基于集成學(xué)習(xí)的數(shù)字圖像隱寫定量分析[D];解放軍信息工程大學(xué);2014年
9 王希玲;基于選擇性集成學(xué)習(xí)的網(wǎng)絡(luò)入侵檢測方法研究[D];青島科技大學(xué);2016年
10 陳范曙;基于信息整合的藥物相關(guān)信息挖掘方法研究[D];華東師范大學(xué);2016年
,本文編號:1330051
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1330051.html