傳統(tǒng)土壤屬性數(shù)據(jù)處理一般是以具體應(yīng)用為導(dǎo)向,對(duì)單一行業(yè)及小規(guī)模數(shù)據(jù)進(jìn)行處理,忽略數(shù)據(jù)本身的數(shù)學(xué)特征,存在數(shù)據(jù)處理過程繁瑣、分析受專業(yè)限制、數(shù)據(jù)跨行業(yè)不共享等問題。數(shù)據(jù)挖掘技術(shù)則是基于數(shù)據(jù)本身數(shù)學(xué)特征,忽略數(shù)據(jù)本身的專業(yè)意義去探索、發(fā)現(xiàn)其內(nèi)在價(jià)值的數(shù)據(jù)處理技術(shù)。本研究系統(tǒng)性地引入數(shù)據(jù)挖掘技術(shù)處理土壤屬性數(shù)據(jù),并將其處理方法與傳統(tǒng)的土壤學(xué)方法進(jìn)行比對(duì)以探索其關(guān)聯(lián)性,可為傳統(tǒng)土壤數(shù)據(jù)處理打通一條進(jìn)行大規(guī)模數(shù)據(jù)處理、跨行業(yè)數(shù)據(jù)共享通道,為土壤學(xué)數(shù)據(jù)處理方法的改進(jìn)及與大數(shù)據(jù)時(shí)代接軌提供理論依據(jù)。本研究的研究目標(biāo)主要是通過對(duì)基于數(shù)據(jù)挖掘技術(shù)與基于傳統(tǒng)土壤學(xué)數(shù)據(jù)處理方法的比對(duì),探索兩種方法所存在的關(guān)聯(lián)關(guān)系。以廣東省74個(gè)縣市區(qū)176種土壤剖面樣本為數(shù)據(jù)來源,開展數(shù)據(jù)挖掘技術(shù)在土壤屬性數(shù)據(jù)處理方面應(yīng)用研究,并得出以下研究結(jié)果:(1)構(gòu)建了基于數(shù)據(jù)挖掘算法的土壤屬性數(shù)據(jù)分析與處理模型,包括聚類法、ID3決策樹法、灰色關(guān)聯(lián)系數(shù)法、數(shù)據(jù)挖掘可視化展示工具法等。利用數(shù)據(jù)挖掘技術(shù)對(duì)土壤屬性元數(shù)據(jù)進(jìn)行清洗、整理、轉(zhuǎn)換,將部分重復(fù)數(shù)據(jù)、空數(shù)據(jù)、明顯不合理偏離值臟數(shù)據(jù)進(jìn)行刪除或修正處理,最終確定797條最終數(shù)據(jù)作為本...
【文章頁數(shù)】:137 頁
【學(xué)位級(jí)別】:博士
【部分圖文】:

圖1.1技術(shù)路線圖

圖2.1土壤屬性數(shù)據(jù)挖掘分析流程圖
為土壤屬性數(shù)據(jù)處理提供一個(gè)便捷的、普遍適用的數(shù)據(jù)處理流程與方法的集合。模型構(gòu)建的意義在于:(1)圍繞土壤屬性數(shù)據(jù),集中、充分發(fā)掘數(shù)據(jù)多方面的潛在價(jià)值。(2)靈活集成各種土壤屬性數(shù)據(jù)處理的技術(shù)、方法。(3)便于針對(duì)土壤屬性數(shù)據(jù)處理,開發(fā)出相關(guān)的信息應(yīng)用系統(tǒng)。(4)便于土壤屬性數(shù)據(jù)處....

圖2.3用Tableau軟件繪制的展示有機(jī)碳含量盒須圖示例
函數(shù)輸出結(jié)果,densino(容重)的缺失率超過50%,hx酸)缺失值超過15%,通過追查原因可知容重及交換性抽樣進(jìn)行,因此出現(xiàn)缺失值;虿铄e(cuò))異常值發(fā)現(xiàn)與分析盒須圖來發(fā)現(xiàn)數(shù)據(jù)中的異常值。根據(jù)盒須圖發(fā)現(xiàn)異常0),本研究異常值定義為小于QL-1.5IQR或大于QU+1.5....

圖2.4以地域?yàn)榫S度某屬性數(shù)據(jù)分布直方圖
根據(jù)數(shù)據(jù)核實(shí),這些離散值均為嚴(yán)格測(cè)量值,可歸為土壤屬性臟數(shù)據(jù),因此予以保留。該法可用于大量的數(shù)據(jù)篩選及尋找并定位異常數(shù)據(jù)特征分析行數(shù)據(jù)特征分析對(duì)整體土壤屬性數(shù)據(jù)挖掘及是否能獲得預(yù)期結(jié)果有著義。利用tableau繪制出可視化圖表,可用于輔助進(jìn)行數(shù)據(jù)特征分析。特征分析主要包括以....
本文編號(hào):
3921659
本文鏈接:http://sikaile.net/projectlw/zrdllw/3921659.html