基于少數(shù)類過采樣的馬尾松毛蟲發(fā)生面積等級(jí)預(yù)測(cè)算法及應(yīng)用
發(fā)布時(shí)間:2024-01-31 01:35
馬尾松毛蟲蟲害是我國(guó)重要的森林病蟲害之一,準(zhǔn)確的預(yù)測(cè)預(yù)報(bào)能有效降低病蟲害防治工作成本,提高防治效果;诮(jīng)典機(jī)器學(xué)習(xí)算法的林業(yè)病蟲害預(yù)測(cè)預(yù)報(bào)方法無法有效處理樣本數(shù)量少、分布不均衡、特征維度高的蟲害數(shù)據(jù),因而在預(yù)測(cè)樣本數(shù)量較少的嚴(yán)重級(jí)別蟲害時(shí)準(zhǔn)確性有限。少數(shù)類過采樣能夠有效增加模型訓(xùn)練中可用樣本的數(shù)量、平衡樣本空間數(shù)據(jù)分布,可為林業(yè)病蟲害準(zhǔn)確穩(wěn)定預(yù)測(cè)提供思路。因而,本文面向?qū)嶋H林業(yè)病蟲害防治預(yù)警任務(wù)需求,針對(duì)蟲害數(shù)據(jù)的不平衡性展開研究,重點(diǎn)解決了運(yùn)用傳統(tǒng)機(jī)器學(xué)習(xí)方法建立蟲害發(fā)生面積等級(jí)預(yù)測(cè)模型時(shí)因數(shù)據(jù)不平衡所導(dǎo)致少數(shù)類樣本的預(yù)測(cè)精度有限、泛化能力弱的問題,本文的主要研究工作如下:1.設(shè)計(jì)了一種馬尾松毛蟲蟲害樣本數(shù)據(jù)庫。本文通過國(guó)家林業(yè)病蟲害防治總站和國(guó)家氣象數(shù)據(jù)共享中心搜集了廣東省4個(gè)地區(qū)的馬尾松毛蟲歷年發(fā)生面積、氣象因子等數(shù)據(jù),采用組合特征工程對(duì)特征數(shù)據(jù)進(jìn)行篩選,明確了不同地區(qū)影響馬尾松毛蟲蟲害發(fā)生的氣象因素,為馬尾松毛蟲蟲害發(fā)生面積等級(jí)預(yù)測(cè)算法研究的開展提供了素材。2提出了一種基于少數(shù)類過采樣的馬尾松毛蟲發(fā)生等級(jí)預(yù)測(cè)算法。本文基于合成少數(shù)類過采樣算法,結(jié)合樣本排序、自調(diào)參k-近鄰搜索...
【文章頁數(shù)】:74 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 林業(yè)病蟲害測(cè)報(bào)方法研究現(xiàn)狀
1.2.2 不平衡數(shù)據(jù)分類研究現(xiàn)狀
1.3 論文主要研究?jī)?nèi)容
1.4 論文結(jié)構(gòu)安排
2 馬尾松毛蟲蟲害數(shù)據(jù)庫的建立
2.1 蟲害搜集區(qū)域概況
2.2 數(shù)據(jù)搜集
2.2.1 蟲害數(shù)據(jù)
2.2.2 氣象因子
2.2.3 林分因子
2.2.4 人為活動(dòng)因子
2.3 數(shù)據(jù)處理
2.3.1 數(shù)據(jù)預(yù)處理
2.3.2 特征選擇
2.4 本章小結(jié)
3 基于少數(shù)類過采樣預(yù)測(cè)分類模型的構(gòu)建
3.1 不平衡數(shù)據(jù)概述
3.1.1 不平衡數(shù)據(jù)的本質(zhì)
3.1.2 不平衡數(shù)據(jù)分類困難原因
3.2 合成少數(shù)類過采樣算法
3.3 基于自調(diào)參的改進(jìn)合成少數(shù)類算法
3.3.1 樣本排序
3.3.2 自適應(yīng)k值最近鄰搜索算法
3.4 算法的綜合與調(diào)參
3.4.1 算法描述
3.4.2 樣本合成
3.4.3 樣本權(quán)值更新
3.4.4 訓(xùn)練誤差的界
3.4.5 參數(shù)β的選擇
3.5 本章小結(jié)
4 分類預(yù)測(cè)模型實(shí)驗(yàn)驗(yàn)證與分析
4.1 模型性能評(píng)估指標(biāo)
4.1.1 F-measure準(zhǔn)則
4.1.2 G-mean準(zhǔn)則
4.1.3 ROC曲線及AUC值
4.2 UCI公共數(shù)據(jù)集實(shí)驗(yàn)
4.2.1 數(shù)據(jù)集描述
4.2.2 實(shí)驗(yàn)方案設(shè)計(jì)
4.2.3 實(shí)驗(yàn)結(jié)果與分析
4.3 蟲害數(shù)據(jù)集實(shí)驗(yàn)
4.3.1 數(shù)據(jù)準(zhǔn)備及實(shí)驗(yàn)方法
4.3.2 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
5 馬尾松毛蟲蟲害測(cè)報(bào)軟件的設(shè)計(jì)與實(shí)現(xiàn)
5.1 軟件開發(fā)工具
5.1.1 實(shí)現(xiàn)平臺(tái)概述
5.1.2 Tkinter模塊概述
5.2 軟件設(shè)計(jì)及開發(fā)方法
5.2.1 軟件設(shè)計(jì)基本思路
5.2.2 軟件開發(fā)基本步驟
5.3 軟件關(guān)鍵功能實(shí)現(xiàn)
5.3.1 主界面
5.3.2 輸入數(shù)據(jù)預(yù)測(cè)界面
5.3.3 上傳文件預(yù)測(cè)界面
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
個(gè)人簡(jiǎn)介
導(dǎo)師簡(jiǎn)介
攻讀碩士學(xué)位期間獲得成果目錄清單
致謝
本文編號(hào):3890725
【文章頁數(shù)】:74 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 林業(yè)病蟲害測(cè)報(bào)方法研究現(xiàn)狀
1.2.2 不平衡數(shù)據(jù)分類研究現(xiàn)狀
1.3 論文主要研究?jī)?nèi)容
1.4 論文結(jié)構(gòu)安排
2 馬尾松毛蟲蟲害數(shù)據(jù)庫的建立
2.1 蟲害搜集區(qū)域概況
2.2 數(shù)據(jù)搜集
2.2.1 蟲害數(shù)據(jù)
2.2.2 氣象因子
2.2.3 林分因子
2.2.4 人為活動(dòng)因子
2.3 數(shù)據(jù)處理
2.3.1 數(shù)據(jù)預(yù)處理
2.3.2 特征選擇
2.4 本章小結(jié)
3 基于少數(shù)類過采樣預(yù)測(cè)分類模型的構(gòu)建
3.1 不平衡數(shù)據(jù)概述
3.1.1 不平衡數(shù)據(jù)的本質(zhì)
3.1.2 不平衡數(shù)據(jù)分類困難原因
3.2 合成少數(shù)類過采樣算法
3.3 基于自調(diào)參的改進(jìn)合成少數(shù)類算法
3.3.1 樣本排序
3.3.2 自適應(yīng)k值最近鄰搜索算法
3.4 算法的綜合與調(diào)參
3.4.1 算法描述
3.4.2 樣本合成
3.4.3 樣本權(quán)值更新
3.4.4 訓(xùn)練誤差的界
3.4.5 參數(shù)β的選擇
3.5 本章小結(jié)
4 分類預(yù)測(cè)模型實(shí)驗(yàn)驗(yàn)證與分析
4.1 模型性能評(píng)估指標(biāo)
4.1.1 F-measure準(zhǔn)則
4.1.2 G-mean準(zhǔn)則
4.1.3 ROC曲線及AUC值
4.2 UCI公共數(shù)據(jù)集實(shí)驗(yàn)
4.2.1 數(shù)據(jù)集描述
4.2.2 實(shí)驗(yàn)方案設(shè)計(jì)
4.2.3 實(shí)驗(yàn)結(jié)果與分析
4.3 蟲害數(shù)據(jù)集實(shí)驗(yàn)
4.3.1 數(shù)據(jù)準(zhǔn)備及實(shí)驗(yàn)方法
4.3.2 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
5 馬尾松毛蟲蟲害測(cè)報(bào)軟件的設(shè)計(jì)與實(shí)現(xiàn)
5.1 軟件開發(fā)工具
5.1.1 實(shí)現(xiàn)平臺(tái)概述
5.1.2 Tkinter模塊概述
5.2 軟件設(shè)計(jì)及開發(fā)方法
5.2.1 軟件設(shè)計(jì)基本思路
5.2.2 軟件開發(fā)基本步驟
5.3 軟件關(guān)鍵功能實(shí)現(xiàn)
5.3.1 主界面
5.3.2 輸入數(shù)據(jù)預(yù)測(cè)界面
5.3.3 上傳文件預(yù)測(cè)界面
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
個(gè)人簡(jiǎn)介
導(dǎo)師簡(jiǎn)介
攻讀碩士學(xué)位期間獲得成果目錄清單
致謝
本文編號(hào):3890725
本文鏈接:http://sikaile.net/nykjlw/dzwbhlw/3890725.html
最近更新
教材專著