基于鄰域影像重疊實現(xiàn)特征遷移機器學(xué)習(xí)的大區(qū)域草地分布提取方法研究
【學(xué)位單位】:蘭州大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2020
【中圖分類】:S812
【部分圖文】:
技術(shù)路線圖
蘭州大學(xué)碩士學(xué)位論文基于鄰域影像重疊實現(xiàn)特征遷移機器學(xué)習(xí)的大區(qū)域草地分布提取方法研究14越大。圖2-1決策樹示意圖C4.5算法繼承了ID3算法的優(yōu)點,采用信息增益率(信息增益與內(nèi)在信息的比值)作為測試特征選擇的度量標(biāo)準(zhǔn)。內(nèi)在信息是指單個特征信息分支所需要的信息量。內(nèi)在信息量與值數(shù)量成正比,可校正值數(shù)量對信息增益率的影響,克服了在選擇信息增益的屬性時,存有多個屬性值的偏向選擇的缺點。在構(gòu)造樹的過程中進(jìn)行修剪可實現(xiàn)連續(xù)屬性的離散化,并且可以處理不完整的數(shù)據(jù)。2.2.2隨機森林隨機森林(RandomForest,RF)[76]是集成算法中的一種,它依靠決策樹的投票選擇來決定最后的分類結(jié)果(圖2-2)。自2001年隨機森林算法被提出以來,在遙感影像信息提取領(lǐng)域得到了不斷的改進(jìn),被證明是一種具有魯棒性的分類器[77]。其基本思想是在訓(xùn)練數(shù)據(jù)和相關(guān)變量的隨機子集上生長多棵決策樹,隨機森林通過聚合單棵決策樹的不同輸出來減少可能導(dǎo)致決策樹錯誤的方差。通過多數(shù)投票算法,可以找到大多數(shù)單棵樹給出的平均輸出,從而平滑了方差,這樣的集成在復(fù)雜的數(shù)據(jù)集上表現(xiàn)出了魯棒和準(zhǔn)確的性能,幾乎不需要進(jìn)行微調(diào),并且可以抑制有許多噪聲的變量[42]。隨機森林為了保證較強的抗過擬合和抗噪聲能力,在構(gòu)建每一棵CART決策樹的時候采用了行抽樣和列抽樣的隨機化。行抽樣是指:假設(shè)訓(xùn)練集的數(shù)據(jù)行數(shù)為N,對于每一棵CART樹,從N個原始樣本中有放回地隨機抽取N個作為單棵樹的訓(xùn)練集。假設(shè)隨機森林中CART樹數(shù)目為K,那么通過該辦法生成K個獨立的訓(xùn)練集用于CART的訓(xùn)練。列抽樣是指:假設(shè)原始數(shù)據(jù)集的特征數(shù)為
蘭州大學(xué)碩士學(xué)位論文基于鄰域影像重疊實現(xiàn)特征遷移機器學(xué)習(xí)的大區(qū)域草地分布提取方法研究15M,在通過行采樣獲取每棵CART樹的訓(xùn)練集后,隨機森林會隨機選取m個特征(m<M)訓(xùn)練用于每一棵CART樹的生成。當(dāng)m越小時,模型的抗干擾性和抗過擬合性越強,但是模型的準(zhǔn)確率會下降,因此在實際建模過程中,常需要用交叉驗證等方式選擇合適的m值。圖2-2隨機森林示意圖2.2.3支持向量機支持向量機(SupportVectorMachines,SVM)是一種非參數(shù)監(jiān)督學(xué)習(xí)分類器算法,在遙感應(yīng)用中得到了越來越廣泛的應(yīng)用[78]。SVM理論最初由Vapnik和Chervonenkis在1971年提出[79],在1999年由Vapnik詳細(xì)討論[80]。支持向量機是一個二分類算法,支持線性分類和非線性分類。其基本思想是在特征空間上找到最佳的分離超平面使得訓(xùn)練集上正負(fù)樣本間隔最大,并將其作為決策邊界區(qū)分不同的類[45]。圖2-3[81]為二維輸入空間中一個二分類問題的簡單場景。術(shù)語“最佳分離超平面”是指在訓(xùn)練步驟中獲得的最小化誤分類的決策邊界,即圖2-3(a)中黑色實線。在虛線上被藍(lán)色和紅色圓圈圈出的點即為支持向量。所謂支持向量是指距離分隔超平面最近的點。關(guān)于二元分類的問題,若是有一個分離超平面可以分離不同類別的數(shù)據(jù)(也就是說,兩種類型的數(shù)據(jù)恰好位于超平面的兩側(cè)),則稱為線性可分。如果沒有這樣的超平面,則稱其為線性不可分的。在現(xiàn)實分類的過程中,訓(xùn)練數(shù)據(jù)集中會包含有噪聲,而且手動的添加訓(xùn)練樣本類別的過程中也可能存在一些誤差,因此,訓(xùn)練集數(shù)據(jù)的分類函數(shù)不需要太完美,太完美會使模型本身過擬合,對其他數(shù)據(jù)難以適應(yīng)。為了糾正這些分類中容易出現(xiàn)的錯誤,
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 任海娟;董建軍;李曉媛;牛建明;張雪峰;;利用多時相Landsat8圖像提取苜蓿人工草地信息[J];中國草地學(xué)報;2015年02期
2 吳田軍;駱劍承;夏列鋼;楊海平;沈占鋒;胡曉東;;遷移學(xué)習(xí)支持下的遙感影像對象級分類樣本自動選擇方法[J];測繪學(xué)報;2014年09期
3 郭釔宏;王博;劉勇;楊亦寧;;綜合優(yōu)度法和不一致性法的最優(yōu)分割參數(shù)選擇方法[J];遙感技術(shù)與應(yīng)用;2014年03期
4 牛赟;劉賢德;敬文茂;雷軍;苗毓新;;祁連山北坡土壤特性與植被垂直分布的關(guān)系[J];山地學(xué)報;2013年05期
5 汪有奎;;祁連山國家級自然保護區(qū)有效管理評價研究[J];中南林業(yè)科技大學(xué)學(xué)報(社會科學(xué)版);2013年04期
6 吳煒;沈占鋒;李均力;楊海平;駱劍承;;聯(lián)合概率密度脊提取的影像鑲嵌色彩一致性處理方法[J];測繪學(xué)報;2013年02期
7 錢育蓉;于炯;賈振紅;孫華;古麗給娜·達(dá)列力汗;;基于決策樹的典型荒漠草地遙感分類策略[J];西北農(nóng)林科技大學(xué)學(xué)報(自然科學(xué)版);2013年02期
8 于海達(dá);楊秀春;徐斌;金云翔;高添;李金亞;;草原植被長勢遙感監(jiān)測研究進(jìn)展[J];地理科學(xué)進(jìn)展;2012年07期
9 張健康;程彥培;張發(fā)旺;岳德鵬;郭曉曉;董華;王計平;唐宏才;;基于多時相遙感影像的作物種植信息提取[J];農(nóng)業(yè)工程學(xué)報;2012年02期
10 朱江洪;李江風(fēng);葉菁;;利用決策樹工具的土地利用類型遙感識別方法研究[J];武漢大學(xué)學(xué)報(信息科學(xué)版);2011年03期
相關(guān)博士學(xué)位論文 前2條
1 于惠;青藏高原草地變化及其對氣候的響應(yīng)[D];蘭州大學(xué);2013年
2 劉莊;祁連山自然保護區(qū)生態(tài)承載力評價研究[D];南京師范大學(xué);2004年
相關(guān)碩士學(xué)位論文 前8條
1 陸海霞;集成機器學(xué)習(xí)與面向?qū)ο笥跋穹诸惖拇髤^(qū)域林地信息提取及其泛化能力研究[D];蘭州大學(xué);2019年
2 王小鵬;基于弱監(jiān)督深度學(xué)習(xí)的圖像檢索技術(shù)研究與實現(xiàn)[D];西北大學(xué);2018年
3 李肖娟;氣候變化和人類活動對祁連山草地演變影響程度的研究[D];陜西師范大學(xué);2018年
4 韓希光;面向?qū)ο蟮母叻直媛蔬b感影像土地覆被分類制圖研究[D];蘭州大學(xué);2018年
5 蔣捷峰;基于BP神經(jīng)網(wǎng)絡(luò)的高分辨率遙感影像分類研究[D];首都師范大學(xué);2011年
6 王富貴;祁連山自然保護區(qū)民族地區(qū)經(jīng)濟可持續(xù)發(fā)展研究[D];蘭州大學(xué);2010年
7 李勵恒;祁連山自然保護區(qū)社會經(jīng)濟發(fā)展模式研究[D];蘭州大學(xué);2009年
8 劉祺;決策樹ID3算法的改進(jìn)研究[D];哈爾濱工程大學(xué);2009年
本文編號:2880223
本文鏈接:http://sikaile.net/shoufeilunwen/zaizhiyanjiusheng/2880223.html