天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

隨機(jī)森林算法改進(jìn)及其在醫(yī)療診斷系統(tǒng)中的應(yīng)用

發(fā)布時(shí)間:2024-06-04 03:10
  隨著醫(yī)療信息化技術(shù)的發(fā)展,各大醫(yī)院逐步建立起完備的電子信息系統(tǒng),為醫(yī)療診斷與大數(shù)據(jù)挖掘技術(shù)相融合提供了充分的數(shù)據(jù)支持。其中隨機(jī)森林算法因其分類準(zhǔn)確率高的優(yōu)點(diǎn)成為運(yùn)用最廣泛的挖掘算法之一。然而,醫(yī)學(xué)數(shù)據(jù)因其極不平衡且特征維度高的特點(diǎn),使得傳統(tǒng)隨機(jī)森林算法在醫(yī)療領(lǐng)域的分類性能被嚴(yán)重削弱,同時(shí)隨機(jī)森林本身需要構(gòu)建多棵決策樹(shù),導(dǎo)致運(yùn)算時(shí)間較長(zhǎng)。針對(duì)上述問(wèn)題,本文深入的分析和研究了隨機(jī)森林算法在醫(yī)療診斷領(lǐng)域的應(yīng)用,提出了幾點(diǎn)針對(duì)性的算法改進(jìn),最后設(shè)計(jì)并實(shí)現(xiàn)了一套針對(duì)敗血癥的醫(yī)療輔助診斷系統(tǒng),主要工作如下:首先,針對(duì)醫(yī)療數(shù)據(jù)極不平衡且特征維度高的特點(diǎn),提出了一種基于特征約簡(jiǎn)的隨機(jī)森林改進(jìn)算法RW_RF(Relief F&Wrapper Random Forest)。使用改進(jìn)的Relief F算法將特征按分類能力進(jìn)行區(qū)分,在隨機(jī)森林構(gòu)建過(guò)程中,分層抽取特征并遞歸地訓(xùn)練決策樹(shù),直到子樹(shù)分類性能達(dá)到最佳。實(shí)驗(yàn)證明,RW_RF算法比傳統(tǒng)隨機(jī)森林算法有更好的分類精度,在不平衡數(shù)據(jù)中也有很好的表現(xiàn)。其次,為減輕算法的時(shí)間復(fù)雜度,提出了一種基于Spark的改進(jìn)隨機(jī)森林算法,對(duì)RW_RF算法的兩處進(jìn)行并行...

【文章頁(yè)數(shù)】:69 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 課題研究背景及意義
    1.2 研究現(xiàn)狀及發(fā)展趨勢(shì)
        1.2.1 大數(shù)據(jù)在醫(yī)療診斷方面的研究現(xiàn)狀及發(fā)展趨勢(shì)
        1.2.2 隨機(jī)森林算法研究現(xiàn)狀及發(fā)展趨勢(shì)
        1.2.3 Spark研究現(xiàn)狀及趨勢(shì)
    1.3 研究?jī)?nèi)容及主要工作
    1.4 結(jié)構(gòu)安排
第二章 相關(guān)背景知識(shí)介紹
    2.1 隨機(jī)森林算法介紹
        2.1.1 決策樹(shù)
        2.1.2 隨機(jī)森林定義
        2.1.3 隨機(jī)森林構(gòu)建過(guò)程
        2.1.4 隨機(jī)森林算法評(píng)價(jià)
    2.2 分布式相關(guān)技術(shù)介紹
        2.2.1 Hadoop相關(guān)技術(shù)介紹
        2.2.2 Spark相關(guān)技術(shù)介紹
    2.3 分類問(wèn)題評(píng)價(jià)指標(biāo)介紹
        2.3.1 分類問(wèn)題的評(píng)價(jià)指標(biāo)
        2.3.2 分布式系統(tǒng)特性與衡量標(biāo)準(zhǔn)
    2.4 本章小結(jié)
第三章 基于特征約簡(jiǎn)的隨機(jī)森林改進(jìn)算法
    3.1 基于改進(jìn)Relief F的隨機(jī)森林算法
        3.1.1 改進(jìn)的Relief F算法
        3.1.2 改進(jìn)的Relief F算法與隨機(jī)森林相結(jié)合
    3.2 基于Wrapper思想的改進(jìn)隨機(jī)森林算法
        3.2.1 Wrapper遞歸思想
        3.2.2 改進(jìn)特征選擇法與隨機(jī)森林算法結(jié)合的RWRF算法
    3.3 實(shí)驗(yàn)分析
        3.3.1 實(shí)驗(yàn)數(shù)據(jù)集
        3.3.2 實(shí)驗(yàn)過(guò)程
        3.3.3 實(shí)驗(yàn)結(jié)果分析
    3.4 本章小結(jié)
第四章 改進(jìn)隨機(jī)森林算法的并行化設(shè)計(jì)
    4.1 RWRF算法的并行化設(shè)計(jì)
        4.1.1 特征權(quán)重計(jì)算的并行化設(shè)計(jì)
        4.1.2 隨機(jī)森林分布式實(shí)現(xiàn)步驟
    4.2 實(shí)驗(yàn)驗(yàn)證
        4.2.1 實(shí)驗(yàn)環(huán)境及條件
        4.2.2 實(shí)驗(yàn)結(jié)果與分析
    4.3 本章小結(jié)
第五章 敗血癥輔助診斷系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
    5.1 系統(tǒng)應(yīng)用領(lǐng)域介紹
    5.2 數(shù)據(jù)采集與處理
        5.2.1 數(shù)據(jù)采集
        5.2.2 數(shù)據(jù)預(yù)處理
    5.3 系統(tǒng)構(gòu)建
        5.3.1 獲取分類規(guī)則
        5.3.2 規(guī)則評(píng)估
        5.3.3 疾病診斷預(yù)測(cè)
    5.4 應(yīng)用結(jié)果分析
        5.4.1 敗血癥數(shù)據(jù)集預(yù)處理
        5.4.2 實(shí)驗(yàn)結(jié)果分析
    5.5 本章小結(jié)
第六章 總結(jié)與展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間撰寫(xiě)的論文
致謝



本文編號(hào):3988777

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/lindaojc/3988777.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a37fa***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com