基于集成學習的乳腺癌分類研究
發(fā)布時間:2021-03-31 04:21
目的由于傳統(tǒng)機器學習算法的分類能力較低,不足以輔助臨床診斷,本研究將分類功能強大的集成學習與醫(yī)療診斷相結合,提高診斷準確率和召回率。方法研究應用集成學習的隨機森林算法和Xgboost算法來提高模型準確率和召回率,并利用交叉驗證和網(wǎng)格搜索提高模型擬合能力。結果通過對比隨機森林模型、Xgboost模型和傳統(tǒng)機器學習的決策樹模型,研究得出,集成學習極大地提高了乳腺癌診斷的準確率和召回率,準確率從0.92提高至0.96,召回率從0.90提高至0.97和0.99。結論將集成學習算法與實際醫(yī)療診斷技術相結合具有實際的研究意義,可以進一步將兩種領域相結合,以提高醫(yī)療診斷的效率和準確率。
【文章來源】:中國醫(yī)療設備. 2020,35(12)
【文章頁數(shù)】:4 頁
【部分圖文】:
決策樹結構
隨機森林是1995年由貝爾實驗室的Tin Kam Ho提出的[12],該模型是根據(jù)多個決策樹分類器的輸出,采用投票取眾數(shù)的方法進行決策[13,14],其模型結構如圖2所示,第一層是弱分類器,每個弱分類器都根據(jù)數(shù)據(jù)做出自己的判斷,最后采取投票選擇投票最多的結果作為真實輸出結果。此項目模型利用了10折交叉驗證和網(wǎng)格搜索等方法優(yōu)化模型,提高模型泛化能力和準確度。n折交叉驗證就是在訓練模型時將訓練樣本分成n份,其中的1份保留作為驗證模型的數(shù)據(jù),其余的n-1個樣本用來訓練,交叉驗證重復n次,最終每個子樣本都驗證一次,然后將n次的結果平均得到一個單一的估測值,可以防止模型過擬合,提高模型的泛化能力。
Xgboost結構
【參考文獻】:
期刊論文
[1]集成學習在糖尿病預測中的應用[J]. 張玉璽,賀松,尤思夢. 智能計算機與應用. 2019(05)
[2]改進隨機森林算法綜述[J]. 孫明喆,畢瑤家,孫馳. 現(xiàn)代信息科技. 2019(20)
[3]基于XGBoost算法的風機葉片結冰狀態(tài)評測[J]. 李大中,王超,李穎宇. 電力科學與工程. 2019(09)
[4]基于主動集成學習的中醫(yī)智能診斷模型及構建方法[J]. 任雪,郭艷. 中國循證醫(yī)學雜志. 2019(09)
[5]基于卷積神經(jīng)網(wǎng)絡和集成學習的阿爾茨海默癥早期診斷[J]. 曾安,賈龍飛,潘丹,Song Xiaowei. 生物醫(yī)學工程學雜志. 2019(05)
[6]隨機森林算法研究綜述[J]. 呂紅燕,馮倩. 河北省科學院學報. 2019(03)
[7]基于XGBoost的特征選擇算法[J]. 李占山,劉兆賡. 通信學報. 2019(10)
[8]集成學習方法研究[J]. 周鋼,郭福亮. 計算技術與自動化. 2018(04)
[9]集成學習方法:研究綜述[J]. 徐繼偉,楊云. 云南大學學報(自然科學版). 2018(06)
博士論文
[1]基于集成學習的工業(yè)過程監(jiān)測[D]. 劉玥.浙江大學 2019
本文編號:3110780
【文章來源】:中國醫(yī)療設備. 2020,35(12)
【文章頁數(shù)】:4 頁
【部分圖文】:
決策樹結構
隨機森林是1995年由貝爾實驗室的Tin Kam Ho提出的[12],該模型是根據(jù)多個決策樹分類器的輸出,采用投票取眾數(shù)的方法進行決策[13,14],其模型結構如圖2所示,第一層是弱分類器,每個弱分類器都根據(jù)數(shù)據(jù)做出自己的判斷,最后采取投票選擇投票最多的結果作為真實輸出結果。此項目模型利用了10折交叉驗證和網(wǎng)格搜索等方法優(yōu)化模型,提高模型泛化能力和準確度。n折交叉驗證就是在訓練模型時將訓練樣本分成n份,其中的1份保留作為驗證模型的數(shù)據(jù),其余的n-1個樣本用來訓練,交叉驗證重復n次,最終每個子樣本都驗證一次,然后將n次的結果平均得到一個單一的估測值,可以防止模型過擬合,提高模型的泛化能力。
Xgboost結構
【參考文獻】:
期刊論文
[1]集成學習在糖尿病預測中的應用[J]. 張玉璽,賀松,尤思夢. 智能計算機與應用. 2019(05)
[2]改進隨機森林算法綜述[J]. 孫明喆,畢瑤家,孫馳. 現(xiàn)代信息科技. 2019(20)
[3]基于XGBoost算法的風機葉片結冰狀態(tài)評測[J]. 李大中,王超,李穎宇. 電力科學與工程. 2019(09)
[4]基于主動集成學習的中醫(yī)智能診斷模型及構建方法[J]. 任雪,郭艷. 中國循證醫(yī)學雜志. 2019(09)
[5]基于卷積神經(jīng)網(wǎng)絡和集成學習的阿爾茨海默癥早期診斷[J]. 曾安,賈龍飛,潘丹,Song Xiaowei. 生物醫(yī)學工程學雜志. 2019(05)
[6]隨機森林算法研究綜述[J]. 呂紅燕,馮倩. 河北省科學院學報. 2019(03)
[7]基于XGBoost的特征選擇算法[J]. 李占山,劉兆賡. 通信學報. 2019(10)
[8]集成學習方法研究[J]. 周鋼,郭福亮. 計算技術與自動化. 2018(04)
[9]集成學習方法:研究綜述[J]. 徐繼偉,楊云. 云南大學學報(自然科學版). 2018(06)
博士論文
[1]基于集成學習的工業(yè)過程監(jiān)測[D]. 劉玥.浙江大學 2019
本文編號:3110780
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3110780.html
最近更新
教材專著