天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于改進(jìn)鄰域粗糙集和隨機(jī)森林算法的糖尿病預(yù)測研究

發(fā)布時(shí)間:2020-11-01 13:48
   糖尿病已成為全球危害性較大的慢性疾病之一,而中國更是全球糖尿病第一大國,近年來患病率還呈現(xiàn)出逐年增高的趨勢,嚴(yán)重影響人類健康。并且隨著醫(yī)療服務(wù)水平的不斷提高,人們對醫(yī)療診斷效率以及準(zhǔn)確率有了更高的要求。目前該疾病的診斷主要是在化驗(yàn)的基礎(chǔ)上由醫(yī)生人工診斷完成,但是糖尿病的潛伏期較長,而且各地區(qū)醫(yī)療資源不協(xié)調(diào)。針對以上這些問題,論文采集了國家人口與健康科學(xué)數(shù)據(jù)共享服務(wù)平臺某醫(yī)院糖尿病數(shù)據(jù),并針對鄰域粗糙集的只依賴單屬性計(jì)算重要度的不足,提出了改進(jìn)的鄰域粗糙集(INRS)屬性約簡算法,后將其與隨機(jī)森林(RF)組成分類預(yù)測模型應(yīng)用在糖尿病數(shù)據(jù)上,形成了高精度的糖尿病預(yù)測模型,旨為醫(yī)生臨床診斷和疾病研究等提供輔助支持,提高臨床診斷治療水平。本文分別使用MATLAB和WEKA實(shí)現(xiàn)糖尿病數(shù)據(jù)的改進(jìn)的鄰域粗糙集(INRS)屬性約簡和隨機(jī)森林(RF)分類預(yù)測。后面為探討該組合模型的成效,分別從屬性約簡和分類器選擇兩個(gè)方面進(jìn)行了對比分析。首先從屬性約簡效果分析,分別以不約簡、粗糙集約簡、鄰域粗糙集約簡和改進(jìn)的鄰域粗糙集算法建立特征模型,并將約簡后的數(shù)據(jù)使用隨機(jī)森林分類器評估效果,發(fā)現(xiàn)約簡后的數(shù)據(jù)明顯比不約簡好,分類更準(zhǔn)確,而改進(jìn)后的鄰域粗糙集雖然屬性個(gè)數(shù)比未改進(jìn)的多,但分類準(zhǔn)確率最優(yōu),說明改進(jìn)算法有改善。然后從分類器選擇效果分析,對INRS約簡后的數(shù)據(jù)使用隨機(jī)森林算法、BP算法、C4.5算法及Naive Byes算法分類器從建模耗時(shí)、誤差、分類準(zhǔn)確率、ROC面積四個(gè)方面進(jìn)行對比分析,發(fā)現(xiàn)綜合效果最優(yōu)的是隨機(jī)森林分類器。綜上,本論文中的基于改進(jìn)的鄰域粗糙集和隨機(jī)森林的組合模型得到的糖尿病預(yù)測模型的分類準(zhǔn)確率達(dá)到92.05%,其綜合效果甚佳。通過本次研究希望后續(xù)可以將糖尿病預(yù)測功能添加到醫(yī)院的診療系統(tǒng)中,進(jìn)而輔助醫(yī)生對糖尿病診斷做出科學(xué)的診斷決策。
【學(xué)位單位】:首都經(jīng)濟(jì)貿(mào)易大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:R587.1;TP18
【部分圖文】:

技術(shù)路線圖


技術(shù)路線圖

生成過程,森林


圖 2-1 隨機(jī)森林生成過程圖主要包括以下幾步:1)從原始樣本數(shù)據(jù) D 中采用有放回抽樣的方式形成 k 個(gè)樣本kD[26]2)假設(shè)原始樣本中屬性個(gè)數(shù)為 a ,每個(gè)樣本選擇 a 中的 m 個(gè)特征,利用最佳分割點(diǎn)方式建立決策樹。3)重復(fù)以上過程 次,產(chǎn)生 棵決策樹4)對獲得的分類結(jié)果采用多數(shù)投票方式確定最優(yōu)分類結(jié)果[25]2.2.2 Naive Bayes樸素貝葉斯分類器(NBC)是貝葉斯分類器中應(yīng)用最廣泛的模型之一[27]。它具有非常高的學(xué)習(xí)效率,只需要掃描訓(xùn)練數(shù)據(jù)就可以估計(jì)所有的概率。研究者們對比分析了不同的分類算法的優(yōu)缺點(diǎn),得出結(jié)論:NaiveBayes 的分類效果比神經(jīng)網(wǎng)絡(luò)和決策樹還要好[28]。Naive Bayes 算法主要思想依賴于一假設(shè):屬性條件獨(dú)立性假設(shè),即對已知類別,假

神經(jīng)網(wǎng)絡(luò)模型


它不需要關(guān)于表達(dá)式映射數(shù)學(xué)方程的先驗(yàn)知識,就能夠以訓(xùn)練和入和輸出模式映射關(guān)系[29]。絡(luò)采用經(jīng)典的 BP 算法,而 BP 算法則是以梯度最速下降法為基礎(chǔ),以誤函數(shù),使神經(jīng)網(wǎng)絡(luò)算法具有學(xué)習(xí)和記憶的能力[30]。一個(gè)簡單的三層 BP 神現(xiàn)從 n 維到 m 維的任意一個(gè)映射,其思想清晰、編程簡單、結(jié)構(gòu)簡單、性強(qiáng),因此在很多領(lǐng)域得到了廣泛的應(yīng)用。主要應(yīng)用領(lǐng)域有模式識別、智能斷、圖像識別處理、最優(yōu)計(jì)算、信息處理、財(cái)務(wù)預(yù)測、市場分析和業(yè)務(wù)管神經(jīng)網(wǎng)絡(luò)的分類結(jié)果往往伴隨不穩(wěn)定的現(xiàn)象且易產(chǎn)生過擬合[31]。P 神經(jīng)網(wǎng)絡(luò)由輸入層、輸出層和一個(gè)或多個(gè)隱藏層組成[32]。它是由輸入層隱藏層,通過每個(gè)單元的動作函數(shù)操作后,隱藏層會將信息傳遞到輸出層的結(jié)果[33]。BP 神經(jīng)網(wǎng)絡(luò)模型如圖 2-1 所示,BP 網(wǎng)絡(luò)采用梯度下降法,梯于梯度的誤差函數(shù)為每兩個(gè)節(jié)點(diǎn)加權(quán),并計(jì)算誤差的權(quán)重貢獻(xiàn),然后根據(jù)改權(quán)重以實(shí)現(xiàn)學(xué)習(xí)的目的。法模型如下:
【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 嵇靈;牛東曉;汪鵬;;基于相似日聚類和貝葉斯神經(jīng)網(wǎng)絡(luò)的光伏發(fā)電功率預(yù)測研究[J];中國管理科學(xué);2015年03期

2 劉增明;陳運(yùn)非;蔣海青;;基于PCA-BP神經(jīng)網(wǎng)絡(luò)方法的供應(yīng)商選擇[J];工業(yè)工程與管理;2014年01期

3 李玲;周學(xué)平;李國春;王韻琴;;運(yùn)用數(shù)據(jù)挖掘技術(shù)探討周仲瑛教授診療類風(fēng)濕性關(guān)節(jié)炎經(jīng)驗(yàn)[J];中國中西醫(yī)結(jié)合雜志;2013年12期

4 吳信東;葉明全;胡東輝;吳共慶;胡學(xué)鋼;王浩;;普適醫(yī)療信息管理與服務(wù)的關(guān)鍵技術(shù)與挑戰(zhàn)[J];計(jì)算機(jī)學(xué)報(bào);2012年05期

5 劉偉偉;;基于遺傳算法的粗糙集知識約簡[J];科技經(jīng)濟(jì)市場;2010年06期

6 程雪峰;敖華飛;顧建;王勤;毛小慧;;特發(fā)性突聾風(fēng)險(xiǎn)預(yù)測中關(guān)聯(lián)規(guī)則的應(yīng)用[J];上海交通大學(xué)學(xué)報(bào)(醫(yī)學(xué)版);2009年12期

7 唐曉茜;余穎;伍青生;;決策樹法用于心臟病高發(fā)人群的挖掘研究[J];中國衛(wèi)生統(tǒng)計(jì);2008年05期

8 陳健美;宋順林;朱玉全;宋余慶;陳耿;程鵬;桂長青;;一種基于貝葉斯和神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像組合分類方法[J];計(jì)算機(jī)科學(xué);2008年03期

9 黃富銀,張欽廷,呂成榮,蔡偉雄,吳家聲,湯濤,汪建君;精神病犯服刑能力評定量表研究[J];法醫(yī)學(xué)雜志;2005年03期

10 艾艷,湯志亞,王敏;基于BP神經(jīng)網(wǎng)絡(luò)的短期降水預(yù)報(bào)[J];河南教育學(xué)院學(xué)報(bào)(自然科學(xué)版);2004年03期


相關(guān)碩士學(xué)位論文 前7條

1 梁海龍;基于鄰域粗糙集的屬性約簡和樣本約減算法研究及在文本分類中的應(yīng)用[D];太原理工大學(xué);2015年

2 雒洋洋;早期溢流漏失地面監(jiān)測診斷系統(tǒng)研究與設(shè)計(jì)[D];西南石油大學(xué);2014年

3 梁世磊;基于Hadoop平臺的隨機(jī)森林算法研究及圖像分類系統(tǒng)實(shí)現(xiàn)[D];廈門大學(xué);2014年

4 李友坤;BP神經(jīng)網(wǎng)絡(luò)的研究分析及改進(jìn)應(yīng)用[D];安徽理工大學(xué);2012年

5 賈麗娜;基于改進(jìn)區(qū)分矩陣的屬性約簡算法研究與應(yīng)用[D];遼寧工程技術(shù)大學(xué);2011年

6 龔萍;基于數(shù)據(jù)挖掘的移動夢網(wǎng)數(shù)據(jù)業(yè)務(wù)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2007年

7 張欣;遞歸神經(jīng)網(wǎng)絡(luò)的研究及在非線性動態(tài)系統(tǒng)辨識中的應(yīng)用[D];太原理工大學(xué);2005年



本文編號:2865625

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/yixuelunwen/nfm/2865625.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶58410***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com