多維貧困視角下中國(guó)農(nóng)村貧困家庭的識(shí)別研究
【學(xué)位授予單位】:首都經(jīng)濟(jì)貿(mào)易大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:F323.8
【圖文】:
圖 4.1 特征指標(biāo)的重要性(2)選取對(duì)模型有重要影響的指標(biāo)進(jìn)行建模根據(jù)上述理由闡述并不是所有變量都會(huì)進(jìn)入最終的隨機(jī)森林模型,篩選之后,進(jìn)隨機(jī)森林模型的有人均年收入、醫(yī)療保險(xiǎn)、居住環(huán)境、受教育程度、生活負(fù)擔(dān)、養(yǎng)老險(xiǎn)、掌握技能和電器資產(chǎn)等 8 個(gè)變量。根據(jù)已有文獻(xiàn)劉波[23](2017)主觀貧困并不等于客觀貧困,有些時(shí)候往往還有更豐富的內(nèi)涵,比客觀貧困更能夠代表貧困家庭的情所以選擇主客觀法相結(jié)合主要是因?yàn)椋瑔为?dú)的客觀貧困只能看到貧困家庭的物質(zhì)方面需求和匱乏,而精神方面的貧困缺失,會(huì)損失很多有用的信息,繼而不能過(guò)全面很好對(duì)貧困戶進(jìn)行識(shí)別。所以對(duì)主觀指標(biāo)包括居住環(huán)境、生活負(fù)擔(dān)和掌握技能的入選,是方便了筆者在做實(shí)證分析的經(jīng)驗(yàn)。4.3.2 農(nóng)村多維貧困的隨機(jī)森林識(shí)別模型本小節(jié)主要是對(duì)建立農(nóng)村多維貧困的隨機(jī)森林識(shí)別模型,之前收集到的數(shù)據(jù)集5563 條觀測(cè),訓(xùn)練集為 4564 條,測(cè)試集為 999 條,預(yù)測(cè)集數(shù)據(jù)是在建立模型之前預(yù)
圖 4.2 Mtry=2 誤差圖由圖 4.2Mtry=2 時(shí)的誤差圖可知,當(dāng) ntree 的值大概大于 400 之后,模型誤差趨穩(wěn)定,沒(méi)有特別大的波動(dòng),基本穩(wěn)定在一個(gè)定值附近,所以我們可以將模型中的 n的值大致確定為 400 左右,最佳隨機(jī)森林模型就選擇當(dāng) Mtry=2。由圖 4.3 當(dāng) Mtry=2 時(shí)的誤差圖時(shí)可知,當(dāng) ntree 的值大概在大于 400 之后,模型差趨于穩(wěn)定,沒(méi)有特別大的波動(dòng),基本穩(wěn)定在一個(gè)定值附近,當(dāng) Mtry=3 時(shí)的誤差圖可知,當(dāng) ntree 的值大概在大于 400 之后,模型誤差趨于穩(wěn)定,沒(méi)有特別大的波動(dòng),本穩(wěn)定在一個(gè)定值附近,所以我們可以將模型中的 ntree 的值大致確定為 400 左右,此來(lái)達(dá)到最佳隨機(jī)森林模型。通過(guò)以上分析之后,加上之前所述使用全變量做隨機(jī)森林模型,通過(guò)上文可知,n的值為 400 的模型具有很好的穩(wěn)定性,但是決策數(shù)個(gè)數(shù)是多少,還沒(méi)有最終的確定以本文決定最優(yōu)模型為決策樹(shù)節(jié)點(diǎn)處變量個(gè)數(shù)為 2 和 3,模型中 ntree 的值為 400 的型,通過(guò)建立模型,然后再比較哪一個(gè)模型是比較好的。建立隨機(jī)森林模型過(guò)程及顯結(jié)果如表 4.4,部分重要變量建立隨機(jī)森林模型結(jié)果如表 4.4 和表 4.5。
圖 4.3 Mtry=3 誤差圖表 4.4 Mtry=2 全部變量的隨機(jī)森林模型的混淆矩陣混淆矩陣預(yù)測(cè)值系統(tǒng)誤差 模型內(nèi)誤差0 1真實(shí)值0 1660 328 0.165012.4%1 238 2338 0.0924表 4.5 Mtry=3 全部變量的隨機(jī)森林模型的混淆矩陣混淆矩陣預(yù)測(cè)值系統(tǒng)誤差 模型內(nèi)誤差0 1真實(shí)值0 1653 335 0.168512.62%1 241 2335 0.0936表 4.6 Mtry=2 重要變量的隨機(jī)森林模型的混淆矩陣
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 高艷云;馬瑜;;多維框架下中國(guó)家庭貧困的動(dòng)態(tài)識(shí)別[J];統(tǒng)計(jì)研究;2013年12期
2 王艷慧;錢樂(lè)毅;段福洲;;縣級(jí)多維貧困度量及其空間分布格局研究——以連片特困區(qū)扶貧重點(diǎn)縣為例[J];地理科學(xué);2013年12期
3 王素霞;王小林;;中國(guó)多維貧困測(cè)量[J];中國(guó)農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2013年02期
4 高艷云;;中國(guó)城鄉(xiāng)多維貧困的測(cè)度及比較[J];統(tǒng)計(jì)研究;2012年11期
5 陸康強(qiáng);;要素均衡:人類發(fā)展指數(shù)的算法改進(jìn)與實(shí)證研究[J];統(tǒng)計(jì)研究;2012年10期
6 王小林;;貧困標(biāo)準(zhǔn)及全球貧困狀況[J];經(jīng)濟(jì)研究參考;2012年55期
7 方迎風(fēng);;中國(guó)貧困的多維測(cè)度[J];當(dāng)代經(jīng)濟(jì)科學(xué);2012年04期
8 郭建宇;吳國(guó)寶;;基于不同指標(biāo)及權(quán)重選擇的多維貧困測(cè)量——以山西省貧困縣為例[J];中國(guó)農(nóng)村經(jīng)濟(jì);2012年02期
9 鄒薇;方迎風(fēng);;關(guān)于中國(guó)貧困的動(dòng)態(tài)多維度研究[J];中國(guó)人口科學(xué);2011年06期
10 郭勁光;;我國(guó)貧困人口的脆弱度與貧困動(dòng)態(tài)[J];統(tǒng)計(jì)研究;2011年09期
本文編號(hào):2780305
本文鏈接:http://www.sikaile.net/jingjilunwen/nongyejingjilunwen/2780305.html