基于隨機(jī)森林模型的巖爆等級預(yù)測研究
發(fā)布時間:2019-11-22 02:09
【摘要】:以巖石單軸抗壓強(qiáng)度、單軸抗拉強(qiáng)度、硐室最大切向應(yīng)力、巖石壓拉比、應(yīng)力系數(shù)、彈性變形指數(shù)和完整性系數(shù)為巖爆評價指標(biāo),建立了4種評價方案;在引入隨機(jī)森林算法的基礎(chǔ)上,建立了巖爆等級預(yù)測的隨機(jī)森林模型,并通過R語言編寫代碼對該模型進(jìn)行了計算,得出評價指標(biāo)的重要性和預(yù)測結(jié)果;將4種評價方案用隨機(jī)森林法、線性回歸法和支持向量機(jī)法分別進(jìn)行預(yù)測并將結(jié)果進(jìn)行對比分析。結(jié)果表明:隨機(jī)森林法的巖爆預(yù)測準(zhǔn)確率較高(達(dá)到97%),適用于解決數(shù)據(jù)不完全的小樣本問題;巖石完整性系數(shù)重要度最大,巖石單軸抗壓強(qiáng)重要度最小。
【圖文】:
并行處理、運算效率高、訓(xùn)練速度快、對異常值和噪聲容忍度好、預(yù)測準(zhǔn)確率高、可對變量重要性進(jìn)行排序和不容易出現(xiàn)過擬合等優(yōu)點在巖土工程[11]、水電系統(tǒng)[12]、金融證券[13]、生態(tài)學(xué)[14]等方面取得了廣泛的應(yīng)用。2巖爆等級預(yù)測模型的構(gòu)建2.1模型構(gòu)建流程隨機(jī)森林分類是由很多決策樹分類模型{h(X,Θm),m=1,…,n}組成的分類模型的集合,參數(shù)集{Θm}是獨立同分布的隨機(jī)向量,在給定自變量X下,每個決策樹分類模型都有一票投票權(quán)來選擇最優(yōu)的分類結(jié)果。巖爆等級預(yù)測的隨機(jī)森林模型構(gòu)建流程見圖1。圖1巖爆等級判別的隨機(jī)森林模型構(gòu)建流程模型構(gòu)建步驟[12,15]如下:1)從給定的n個巖爆樣本中隨機(jī)有放回的抽出m個樣本,每棵分類樹的全部訓(xùn)練數(shù)據(jù)形成一個訓(xùn)練樣本集。2)每個訓(xùn)練樣本集單獨生長成為一棵不剪枝葉的分類樹。在樹的每個節(jié)點處從K個特征中隨機(jī)挑選k個特征(k≤K),在每個節(jié)點上從k個特征中選取最優(yōu)特征進(jìn)行分支生長。這棵分類樹充分生長,使每個節(jié)點的不純度達(dá)到最小,不進(jìn)行剪枝操作。3)根據(jù)步驟2),按生成的多個樹分類器對巖爆測試樣本進(jìn)行預(yù)測。對m個巖爆樣本分別建立m個巖爆決策樹模型,對測試樣本的分類進(jìn)行決策,總共得到m個分類結(jié)果,巖爆測試樣本的預(yù)測結(jié)果按每個樹分類器的投票多少而決定。2.2模型的實現(xiàn)巖爆等級預(yù)測的隨機(jī)森林模型的實現(xiàn)需借助相關(guān)的數(shù)據(jù)處理工具。R[12]是一種自由軟件編程語言與操作環(huán)境,是一種數(shù)學(xué)計算的環(huán)境,是一套完整的數(shù)據(jù)處理、計算和制圖軟件系統(tǒng),具備高效的數(shù)據(jù)處理和存儲功能。本文利用R語言,通過調(diào)用隨機(jī)森林算法程序包,編寫數(shù)據(jù)處理計算的R語言代碼,進(jìn)而實現(xiàn)巖爆預(yù)測隨機(jī)森林模型計算。其具體計算流程如圖2所示。圖2隨機(jī)森?
6奙個巖爆樣本分別建立m個巖爆決策樹模型,,對測試樣本的分類進(jìn)行決策,總共得到m個分類結(jié)果,巖爆測試樣本的預(yù)測結(jié)果按每個樹分類器的投票多少而決定。2.2模型的實現(xiàn)巖爆等級預(yù)測的隨機(jī)森林模型的實現(xiàn)需借助相關(guān)的數(shù)據(jù)處理工具。R[12]是一種自由軟件編程語言與操作環(huán)境,是一種數(shù)學(xué)計算的環(huán)境,是一套完整的數(shù)據(jù)處理、計算和制圖軟件系統(tǒng),具備高效的數(shù)據(jù)處理和存儲功能。本文利用R語言,通過調(diào)用隨機(jī)森林算法程序包,編寫數(shù)據(jù)處理計算的R語言代碼,進(jìn)而實現(xiàn)巖爆預(yù)測隨機(jī)森林模型計算。其具體計算流程如圖2所示。圖2隨機(jī)森林模型計算流程需要注意的是,為了便于數(shù)據(jù)的調(diào)用和后續(xù)計算,數(shù)據(jù)集應(yīng)按照R的格式要求保存成csv格式,再進(jìn)行導(dǎo)入。隨機(jī)森林主要參數(shù)有巖爆預(yù)測中輸入變量的數(shù)量(mtry)及選擇森林中樹的數(shù)量(ntree),這2個參數(shù)決定計算的效率和結(jié)果的準(zhǔn)確性,出于對樣本的數(shù)量和計算結(jié)果的準(zhǔn)確性考慮,本文將mtry和ntree分別設(shè)置為3和500。R本身不具備對隨機(jī)森林模型的處理功能,要實現(xiàn)巖爆預(yù)測隨機(jī)森林模型的計算,需要對相關(guān)過程進(jìn)行R語言編程。在開源的R語言環(huán)境下,本文編寫了軟件包調(diào)用、數(shù)據(jù)導(dǎo)入、數(shù)據(jù)計算以及結(jié)果輸出的代碼,具體如下:>install.packages("randomForest")>library(randomForest)24礦冶工程第37卷
本文編號:2564275
【圖文】:
并行處理、運算效率高、訓(xùn)練速度快、對異常值和噪聲容忍度好、預(yù)測準(zhǔn)確率高、可對變量重要性進(jìn)行排序和不容易出現(xiàn)過擬合等優(yōu)點在巖土工程[11]、水電系統(tǒng)[12]、金融證券[13]、生態(tài)學(xué)[14]等方面取得了廣泛的應(yīng)用。2巖爆等級預(yù)測模型的構(gòu)建2.1模型構(gòu)建流程隨機(jī)森林分類是由很多決策樹分類模型{h(X,Θm),m=1,…,n}組成的分類模型的集合,參數(shù)集{Θm}是獨立同分布的隨機(jī)向量,在給定自變量X下,每個決策樹分類模型都有一票投票權(quán)來選擇最優(yōu)的分類結(jié)果。巖爆等級預(yù)測的隨機(jī)森林模型構(gòu)建流程見圖1。圖1巖爆等級判別的隨機(jī)森林模型構(gòu)建流程模型構(gòu)建步驟[12,15]如下:1)從給定的n個巖爆樣本中隨機(jī)有放回的抽出m個樣本,每棵分類樹的全部訓(xùn)練數(shù)據(jù)形成一個訓(xùn)練樣本集。2)每個訓(xùn)練樣本集單獨生長成為一棵不剪枝葉的分類樹。在樹的每個節(jié)點處從K個特征中隨機(jī)挑選k個特征(k≤K),在每個節(jié)點上從k個特征中選取最優(yōu)特征進(jìn)行分支生長。這棵分類樹充分生長,使每個節(jié)點的不純度達(dá)到最小,不進(jìn)行剪枝操作。3)根據(jù)步驟2),按生成的多個樹分類器對巖爆測試樣本進(jìn)行預(yù)測。對m個巖爆樣本分別建立m個巖爆決策樹模型,對測試樣本的分類進(jìn)行決策,總共得到m個分類結(jié)果,巖爆測試樣本的預(yù)測結(jié)果按每個樹分類器的投票多少而決定。2.2模型的實現(xiàn)巖爆等級預(yù)測的隨機(jī)森林模型的實現(xiàn)需借助相關(guān)的數(shù)據(jù)處理工具。R[12]是一種自由軟件編程語言與操作環(huán)境,是一種數(shù)學(xué)計算的環(huán)境,是一套完整的數(shù)據(jù)處理、計算和制圖軟件系統(tǒng),具備高效的數(shù)據(jù)處理和存儲功能。本文利用R語言,通過調(diào)用隨機(jī)森林算法程序包,編寫數(shù)據(jù)處理計算的R語言代碼,進(jìn)而實現(xiàn)巖爆預(yù)測隨機(jī)森林模型計算。其具體計算流程如圖2所示。圖2隨機(jī)森?
6奙個巖爆樣本分別建立m個巖爆決策樹模型,,對測試樣本的分類進(jìn)行決策,總共得到m個分類結(jié)果,巖爆測試樣本的預(yù)測結(jié)果按每個樹分類器的投票多少而決定。2.2模型的實現(xiàn)巖爆等級預(yù)測的隨機(jī)森林模型的實現(xiàn)需借助相關(guān)的數(shù)據(jù)處理工具。R[12]是一種自由軟件編程語言與操作環(huán)境,是一種數(shù)學(xué)計算的環(huán)境,是一套完整的數(shù)據(jù)處理、計算和制圖軟件系統(tǒng),具備高效的數(shù)據(jù)處理和存儲功能。本文利用R語言,通過調(diào)用隨機(jī)森林算法程序包,編寫數(shù)據(jù)處理計算的R語言代碼,進(jìn)而實現(xiàn)巖爆預(yù)測隨機(jī)森林模型計算。其具體計算流程如圖2所示。圖2隨機(jī)森林模型計算流程需要注意的是,為了便于數(shù)據(jù)的調(diào)用和后續(xù)計算,數(shù)據(jù)集應(yīng)按照R的格式要求保存成csv格式,再進(jìn)行導(dǎo)入。隨機(jī)森林主要參數(shù)有巖爆預(yù)測中輸入變量的數(shù)量(mtry)及選擇森林中樹的數(shù)量(ntree),這2個參數(shù)決定計算的效率和結(jié)果的準(zhǔn)確性,出于對樣本的數(shù)量和計算結(jié)果的準(zhǔn)確性考慮,本文將mtry和ntree分別設(shè)置為3和500。R本身不具備對隨機(jī)森林模型的處理功能,要實現(xiàn)巖爆預(yù)測隨機(jī)森林模型的計算,需要對相關(guān)過程進(jìn)行R語言編程。在開源的R語言環(huán)境下,本文編寫了軟件包調(diào)用、數(shù)據(jù)導(dǎo)入、數(shù)據(jù)計算以及結(jié)果輸出的代碼,具體如下:>install.packages("randomForest")>library(randomForest)24礦冶工程第37卷
【相似文獻(xiàn)】
相關(guān)期刊論文 前1條
1 溫廷新;張波;邵良杉;;煤與瓦斯突出預(yù)測的隨機(jī)森林模型[J];計算機(jī)工程與應(yīng)用;2014年10期
本文編號:2564275
本文鏈接:http://sikaile.net/kejilunwen/kuangye/2564275.html
最近更新
教材專著