基于隨機(jī)森林模型的巖爆等級(jí)預(yù)測(cè)研究
發(fā)布時(shí)間:2019-11-22 02:09
【摘要】:以巖石單軸抗壓強(qiáng)度、單軸抗拉強(qiáng)度、硐室最大切向應(yīng)力、巖石壓拉比、應(yīng)力系數(shù)、彈性變形指數(shù)和完整性系數(shù)為巖爆評(píng)價(jià)指標(biāo),建立了4種評(píng)價(jià)方案;在引入隨機(jī)森林算法的基礎(chǔ)上,建立了巖爆等級(jí)預(yù)測(cè)的隨機(jī)森林模型,并通過R語(yǔ)言編寫代碼對(duì)該模型進(jìn)行了計(jì)算,得出評(píng)價(jià)指標(biāo)的重要性和預(yù)測(cè)結(jié)果;將4種評(píng)價(jià)方案用隨機(jī)森林法、線性回歸法和支持向量機(jī)法分別進(jìn)行預(yù)測(cè)并將結(jié)果進(jìn)行對(duì)比分析。結(jié)果表明:隨機(jī)森林法的巖爆預(yù)測(cè)準(zhǔn)確率較高(達(dá)到97%),適用于解決數(shù)據(jù)不完全的小樣本問題;巖石完整性系數(shù)重要度最大,巖石單軸抗壓強(qiáng)重要度最小。
【圖文】:
并行處理、運(yùn)算效率高、訓(xùn)練速度快、對(duì)異常值和噪聲容忍度好、預(yù)測(cè)準(zhǔn)確率高、可對(duì)變量重要性進(jìn)行排序和不容易出現(xiàn)過擬合等優(yōu)點(diǎn)在巖土工程[11]、水電系統(tǒng)[12]、金融證券[13]、生態(tài)學(xué)[14]等方面取得了廣泛的應(yīng)用。2巖爆等級(jí)預(yù)測(cè)模型的構(gòu)建2.1模型構(gòu)建流程隨機(jī)森林分類是由很多決策樹分類模型{h(X,Θm),m=1,…,n}組成的分類模型的集合,參數(shù)集{Θm}是獨(dú)立同分布的隨機(jī)向量,在給定自變量X下,每個(gè)決策樹分類模型都有一票投票權(quán)來選擇最優(yōu)的分類結(jié)果。巖爆等級(jí)預(yù)測(cè)的隨機(jī)森林模型構(gòu)建流程見圖1。圖1巖爆等級(jí)判別的隨機(jī)森林模型構(gòu)建流程模型構(gòu)建步驟[12,15]如下:1)從給定的n個(gè)巖爆樣本中隨機(jī)有放回的抽出m個(gè)樣本,每棵分類樹的全部訓(xùn)練數(shù)據(jù)形成一個(gè)訓(xùn)練樣本集。2)每個(gè)訓(xùn)練樣本集單獨(dú)生長(zhǎng)成為一棵不剪枝葉的分類樹。在樹的每個(gè)節(jié)點(diǎn)處從K個(gè)特征中隨機(jī)挑選k個(gè)特征(k≤K),在每個(gè)節(jié)點(diǎn)上從k個(gè)特征中選取最優(yōu)特征進(jìn)行分支生長(zhǎng)。這棵分類樹充分生長(zhǎng),使每個(gè)節(jié)點(diǎn)的不純度達(dá)到最小,不進(jìn)行剪枝操作。3)根據(jù)步驟2),按生成的多個(gè)樹分類器對(duì)巖爆測(cè)試樣本進(jìn)行預(yù)測(cè)。對(duì)m個(gè)巖爆樣本分別建立m個(gè)巖爆決策樹模型,對(duì)測(cè)試樣本的分類進(jìn)行決策,總共得到m個(gè)分類結(jié)果,巖爆測(cè)試樣本的預(yù)測(cè)結(jié)果按每個(gè)樹分類器的投票多少而決定。2.2模型的實(shí)現(xiàn)巖爆等級(jí)預(yù)測(cè)的隨機(jī)森林模型的實(shí)現(xiàn)需借助相關(guān)的數(shù)據(jù)處理工具。R[12]是一種自由軟件編程語(yǔ)言與操作環(huán)境,是一種數(shù)學(xué)計(jì)算的環(huán)境,是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng),具備高效的數(shù)據(jù)處理和存儲(chǔ)功能。本文利用R語(yǔ)言,通過調(diào)用隨機(jī)森林算法程序包,編寫數(shù)據(jù)處理計(jì)算的R語(yǔ)言代碼,進(jìn)而實(shí)現(xiàn)巖爆預(yù)測(cè)隨機(jī)森林模型計(jì)算。其具體計(jì)算流程如圖2所示。圖2隨機(jī)森?
6奙個(gè)巖爆樣本分別建立m個(gè)巖爆決策樹模型,,對(duì)測(cè)試樣本的分類進(jìn)行決策,總共得到m個(gè)分類結(jié)果,巖爆測(cè)試樣本的預(yù)測(cè)結(jié)果按每個(gè)樹分類器的投票多少而決定。2.2模型的實(shí)現(xiàn)巖爆等級(jí)預(yù)測(cè)的隨機(jī)森林模型的實(shí)現(xiàn)需借助相關(guān)的數(shù)據(jù)處理工具。R[12]是一種自由軟件編程語(yǔ)言與操作環(huán)境,是一種數(shù)學(xué)計(jì)算的環(huán)境,是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng),具備高效的數(shù)據(jù)處理和存儲(chǔ)功能。本文利用R語(yǔ)言,通過調(diào)用隨機(jī)森林算法程序包,編寫數(shù)據(jù)處理計(jì)算的R語(yǔ)言代碼,進(jìn)而實(shí)現(xiàn)巖爆預(yù)測(cè)隨機(jī)森林模型計(jì)算。其具體計(jì)算流程如圖2所示。圖2隨機(jī)森林模型計(jì)算流程需要注意的是,為了便于數(shù)據(jù)的調(diào)用和后續(xù)計(jì)算,數(shù)據(jù)集應(yīng)按照R的格式要求保存成csv格式,再進(jìn)行導(dǎo)入。隨機(jī)森林主要參數(shù)有巖爆預(yù)測(cè)中輸入變量的數(shù)量(mtry)及選擇森林中樹的數(shù)量(ntree),這2個(gè)參數(shù)決定計(jì)算的效率和結(jié)果的準(zhǔn)確性,出于對(duì)樣本的數(shù)量和計(jì)算結(jié)果的準(zhǔn)確性考慮,本文將mtry和ntree分別設(shè)置為3和500。R本身不具備對(duì)隨機(jī)森林模型的處理功能,要實(shí)現(xiàn)巖爆預(yù)測(cè)隨機(jī)森林模型的計(jì)算,需要對(duì)相關(guān)過程進(jìn)行R語(yǔ)言編程。在開源的R語(yǔ)言環(huán)境下,本文編寫了軟件包調(diào)用、數(shù)據(jù)導(dǎo)入、數(shù)據(jù)計(jì)算以及結(jié)果輸出的代碼,具體如下:>install.packages("randomForest")>library(randomForest)24礦冶工程第37卷
本文編號(hào):2564275
【圖文】:
并行處理、運(yùn)算效率高、訓(xùn)練速度快、對(duì)異常值和噪聲容忍度好、預(yù)測(cè)準(zhǔn)確率高、可對(duì)變量重要性進(jìn)行排序和不容易出現(xiàn)過擬合等優(yōu)點(diǎn)在巖土工程[11]、水電系統(tǒng)[12]、金融證券[13]、生態(tài)學(xué)[14]等方面取得了廣泛的應(yīng)用。2巖爆等級(jí)預(yù)測(cè)模型的構(gòu)建2.1模型構(gòu)建流程隨機(jī)森林分類是由很多決策樹分類模型{h(X,Θm),m=1,…,n}組成的分類模型的集合,參數(shù)集{Θm}是獨(dú)立同分布的隨機(jī)向量,在給定自變量X下,每個(gè)決策樹分類模型都有一票投票權(quán)來選擇最優(yōu)的分類結(jié)果。巖爆等級(jí)預(yù)測(cè)的隨機(jī)森林模型構(gòu)建流程見圖1。圖1巖爆等級(jí)判別的隨機(jī)森林模型構(gòu)建流程模型構(gòu)建步驟[12,15]如下:1)從給定的n個(gè)巖爆樣本中隨機(jī)有放回的抽出m個(gè)樣本,每棵分類樹的全部訓(xùn)練數(shù)據(jù)形成一個(gè)訓(xùn)練樣本集。2)每個(gè)訓(xùn)練樣本集單獨(dú)生長(zhǎng)成為一棵不剪枝葉的分類樹。在樹的每個(gè)節(jié)點(diǎn)處從K個(gè)特征中隨機(jī)挑選k個(gè)特征(k≤K),在每個(gè)節(jié)點(diǎn)上從k個(gè)特征中選取最優(yōu)特征進(jìn)行分支生長(zhǎng)。這棵分類樹充分生長(zhǎng),使每個(gè)節(jié)點(diǎn)的不純度達(dá)到最小,不進(jìn)行剪枝操作。3)根據(jù)步驟2),按生成的多個(gè)樹分類器對(duì)巖爆測(cè)試樣本進(jìn)行預(yù)測(cè)。對(duì)m個(gè)巖爆樣本分別建立m個(gè)巖爆決策樹模型,對(duì)測(cè)試樣本的分類進(jìn)行決策,總共得到m個(gè)分類結(jié)果,巖爆測(cè)試樣本的預(yù)測(cè)結(jié)果按每個(gè)樹分類器的投票多少而決定。2.2模型的實(shí)現(xiàn)巖爆等級(jí)預(yù)測(cè)的隨機(jī)森林模型的實(shí)現(xiàn)需借助相關(guān)的數(shù)據(jù)處理工具。R[12]是一種自由軟件編程語(yǔ)言與操作環(huán)境,是一種數(shù)學(xué)計(jì)算的環(huán)境,是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng),具備高效的數(shù)據(jù)處理和存儲(chǔ)功能。本文利用R語(yǔ)言,通過調(diào)用隨機(jī)森林算法程序包,編寫數(shù)據(jù)處理計(jì)算的R語(yǔ)言代碼,進(jìn)而實(shí)現(xiàn)巖爆預(yù)測(cè)隨機(jī)森林模型計(jì)算。其具體計(jì)算流程如圖2所示。圖2隨機(jī)森?
6奙個(gè)巖爆樣本分別建立m個(gè)巖爆決策樹模型,,對(duì)測(cè)試樣本的分類進(jìn)行決策,總共得到m個(gè)分類結(jié)果,巖爆測(cè)試樣本的預(yù)測(cè)結(jié)果按每個(gè)樹分類器的投票多少而決定。2.2模型的實(shí)現(xiàn)巖爆等級(jí)預(yù)測(cè)的隨機(jī)森林模型的實(shí)現(xiàn)需借助相關(guān)的數(shù)據(jù)處理工具。R[12]是一種自由軟件編程語(yǔ)言與操作環(huán)境,是一種數(shù)學(xué)計(jì)算的環(huán)境,是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng),具備高效的數(shù)據(jù)處理和存儲(chǔ)功能。本文利用R語(yǔ)言,通過調(diào)用隨機(jī)森林算法程序包,編寫數(shù)據(jù)處理計(jì)算的R語(yǔ)言代碼,進(jìn)而實(shí)現(xiàn)巖爆預(yù)測(cè)隨機(jī)森林模型計(jì)算。其具體計(jì)算流程如圖2所示。圖2隨機(jī)森林模型計(jì)算流程需要注意的是,為了便于數(shù)據(jù)的調(diào)用和后續(xù)計(jì)算,數(shù)據(jù)集應(yīng)按照R的格式要求保存成csv格式,再進(jìn)行導(dǎo)入。隨機(jī)森林主要參數(shù)有巖爆預(yù)測(cè)中輸入變量的數(shù)量(mtry)及選擇森林中樹的數(shù)量(ntree),這2個(gè)參數(shù)決定計(jì)算的效率和結(jié)果的準(zhǔn)確性,出于對(duì)樣本的數(shù)量和計(jì)算結(jié)果的準(zhǔn)確性考慮,本文將mtry和ntree分別設(shè)置為3和500。R本身不具備對(duì)隨機(jī)森林模型的處理功能,要實(shí)現(xiàn)巖爆預(yù)測(cè)隨機(jī)森林模型的計(jì)算,需要對(duì)相關(guān)過程進(jìn)行R語(yǔ)言編程。在開源的R語(yǔ)言環(huán)境下,本文編寫了軟件包調(diào)用、數(shù)據(jù)導(dǎo)入、數(shù)據(jù)計(jì)算以及結(jié)果輸出的代碼,具體如下:>install.packages("randomForest")>library(randomForest)24礦冶工程第37卷
【相似文獻(xiàn)】
相關(guān)期刊論文 前1條
1 溫廷新;張波;邵良杉;;煤與瓦斯突出預(yù)測(cè)的隨機(jī)森林模型[J];計(jì)算機(jī)工程與應(yīng)用;2014年10期
本文編號(hào):2564275
本文鏈接:http://www.sikaile.net/kejilunwen/kuangye/2564275.html
最近更新
教材專著