基于有限數(shù)據(jù)的臨床預測模型研究
發(fā)布時間:2021-06-12 04:55
隨著信息技術的高速發(fā)展和醫(yī)院信息系統(tǒng)的日益普及,患者的臨床資料得以電子化記錄和存儲。這些臨床數(shù)據(jù)能夠反映患者的身體狀況,為患病嚴重程度評估和疾病風險預測提供重要依據(jù)。臨床預測模型是基于醫(yī)學數(shù)據(jù)利用機器學習技術建立的疾病診斷和預測工具,能夠為醫(yī)生診斷病情、制定治療管理方案以及進行醫(yī)學研究提供科學依據(jù)和決策支持,具有重要的應用價值。但在臨床實踐中,醫(yī)學樣本往往數(shù)量較少且數(shù)據(jù)不完整,容易導致機器學習算法過擬合、預測誤差大、不穩(wěn)定,限制了臨床預測模型的性能。針對上述問題,本論文研究了有限醫(yī)學數(shù)據(jù)條件下預測模型的構建方法,以提升模型的預測性能,促進臨床預測模型在實踐中發(fā)揮切實有效的作用。本論文主要完成了以下工作:(1)針對醫(yī)學數(shù)據(jù)缺失的問題,建立了自適應加權投票隨機森林(Adaptive weight voting random forest,AWVRF)算法。當樹節(jié)點變量缺失時,該算法允許被處理的樣本在當前節(jié)點上退出并根據(jù)所涉及變量的強度調整投票權重,通過加權投票做出最終決策。采用10個UCI標準數(shù)據(jù)集對該算法進行測試,結果表明AWVRF的正確率和AUROC指標優(yōu)于現(xiàn)行的補缺策略決策算法mea...
【文章來源】:浙江大學浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:121 頁
【學位級別】:博士
【部分圖文】:
圖2.2典型RNN模型??
?第2章臨床預測模型技術基礎???v?輸出層??圖2.2典型RNN模型??9?yt-i?9t?yt+i??o?o?o?o??v?v?v?v??h?_?/if_i?ht?hf+i??u?u?u?u??X?Xt_i?xt?xt+1??圖2.3典型RNN模型的展開圖??圖2.4展示了?RNN中重復模塊的結構。??ht??r?、??tanh?ht??Tl^r??Xt??圖2.4?RNN中重復模塊的結構??第f?zhèn)時刻重復模塊的輸出為??21??
?浙江大學博士學位論文???輸出門這3種門控開關,可分別處理不同的信息:遺忘門負責去除不再需要的信??息;輸入門負責添加有用信息至記憶單元;輸出門負責控制輸出。由于遺忘門、??輸入門和輸出門以及記憶單元的設計,LSTM能夠勝任保留和更新長距離信息的??任務。??ht????人■?-W?ct??fL?XX?0trl??xt??圖2.7?LSTM結構圖??LSTM?模塊的輸入是Xt。由公式(2-10)、(2-11)、(2-12)、(2-13)和(2-14)分別計??算得到當前時刻的遺忘門A、輸入門it、候選值G、細胞狀態(tài)&和輸出門ot。再通??過公式(2-15)計算可得第/個時刻隱藏層的輸出/it。??ft?=?a(wr[ht^,Xt]?+?bf)?(2-10)??it?=?〇-(^i?■?[ht-vXt]?+?bi)?(2-11)??Ct?-?tanh(wc?■?+?bc)?(2-12)??Ct?=?ft*?Q-1?+?it*Ct?(2-13)??〇t?=?〇-(w〇?■?[h^Xt]?+?b〇)?(2-14)??ht?=?ot?*?tanh{Ct)?(2-15)??在這些公式中,和匕是模型的權重和偏置參數(shù),是上一時刻隱藏層的??輸出,Cm是上一時刻細胞狀態(tài)。符號?代表矩陣乘法(Matrixmultiplication),??而符號*代表元素積(Element-wise?product)。符號a代表sigmoid函數(shù),符號??tan/i代表hyperbolic?tangent函數(shù),其具體形式如公式(2-16)和(2-17)所不。??a(z)?=?_??-眷?g?(2-17)??
【參考文獻】:
期刊論文
[1]臨床預測模型:基本概念、應用場景及研究思路[J]. 谷鴻秋,周支瑞,章仲恒,周權. 中國循證心血管醫(yī)學雜志. 2018(12)
[2]基于臨床數(shù)據(jù)集的缺失值處理方法比較[J]. 李琳,楊紅梅,楊日東,胡珊,張學良,周毅. 中國數(shù)字醫(yī)學. 2018(04)
[3]重癥監(jiān)護室住院死亡風險的預測方法研究[J]. 謝俊卿,藺軻,孔桂蘭. 計算機工程與應用. 2017(20)
[4]基于隨機森林的乳腺腫瘤細針穿刺輔助診斷[J]. 孫偉,張俊升,邢培銳. 計算機應用. 2015(S2)
[5]常用分類算法在不同樣本量和類分布的不平衡數(shù)據(jù)中的分類效果比較[J]. 袁聯(lián)雄,佘玲玲,林愛華,駱福添. 中國醫(yī)院統(tǒng)計. 2015 (01)
[6]數(shù)據(jù)缺失的類型和處理方法及其在醫(yī)學中的應用[J]. 黃光煒. 中國醫(yī)院統(tǒng)計. 2013 (03)
[7]臨床研究中缺失值的類型和處理方法研究[J]. 唐健元,楊志敏,楊進波,黃欽,吳春芳,馮毅. 中國衛(wèi)生統(tǒng)計. 2011(03)
[8]有限樣本下中文垃圾郵件過濾的研究與實現(xiàn)[J]. 張洪勝,耿煥同,喻為民. 計算機應用與軟件. 2008(01)
[9]幾種不同缺失值填充方法的比較[J]. 劉星毅,農國才. 南寧師范高等?茖W校學報. 2007(03)
[10]小樣本機器學習算法的特性分析與應用[J]. 辛憲會,葉秋果,滕惠忠,郭思海,李軍,張靚,韓曉宏. 海洋測繪. 2007(03)
博士論文
[1]遷移學習問題與方法研究[D]. 龍明盛.清華大學 2014
[2]數(shù)據(jù)挖掘中分類分析的策略研究及其生物醫(yī)學應用[D]. 張超.南方醫(yī)科大學 2008
碩士論文
[1]不完全數(shù)據(jù)的處理方法及其在醫(yī)學研究中的應用[D]. 李樹威.重慶醫(yī)科大學 2014
[2]機器學習中的特征選擇算法研究[D]. 姜百寧.中國海洋大學 2009
[3]基于實例和特征的遷移學習算法研究[D]. 戴文淵.上海交通大學 2009
[4]數(shù)據(jù)倉庫中數(shù)據(jù)質量控制問題研究[D]. 熊霞.武漢大學 2004
本文編號:3225989
【文章來源】:浙江大學浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:121 頁
【學位級別】:博士
【部分圖文】:
圖2.2典型RNN模型??
?第2章臨床預測模型技術基礎???v?輸出層??圖2.2典型RNN模型??9?yt-i?9t?yt+i??o?o?o?o??v?v?v?v??h?_?/if_i?ht?hf+i??u?u?u?u??X?Xt_i?xt?xt+1??圖2.3典型RNN模型的展開圖??圖2.4展示了?RNN中重復模塊的結構。??ht??r?、??tanh?ht??Tl^r??Xt??圖2.4?RNN中重復模塊的結構??第f?zhèn)時刻重復模塊的輸出為??21??
?浙江大學博士學位論文???輸出門這3種門控開關,可分別處理不同的信息:遺忘門負責去除不再需要的信??息;輸入門負責添加有用信息至記憶單元;輸出門負責控制輸出。由于遺忘門、??輸入門和輸出門以及記憶單元的設計,LSTM能夠勝任保留和更新長距離信息的??任務。??ht????人■?-W?ct??fL?XX?0trl??xt??圖2.7?LSTM結構圖??LSTM?模塊的輸入是Xt。由公式(2-10)、(2-11)、(2-12)、(2-13)和(2-14)分別計??算得到當前時刻的遺忘門A、輸入門it、候選值G、細胞狀態(tài)&和輸出門ot。再通??過公式(2-15)計算可得第/個時刻隱藏層的輸出/it。??ft?=?a(wr[ht^,Xt]?+?bf)?(2-10)??it?=?〇-(^i?■?[ht-vXt]?+?bi)?(2-11)??Ct?-?tanh(wc?■?+?bc)?(2-12)??Ct?=?ft*?Q-1?+?it*Ct?(2-13)??〇t?=?〇-(w〇?■?[h^Xt]?+?b〇)?(2-14)??ht?=?ot?*?tanh{Ct)?(2-15)??在這些公式中,和匕是模型的權重和偏置參數(shù),是上一時刻隱藏層的??輸出,Cm是上一時刻細胞狀態(tài)。符號?代表矩陣乘法(Matrixmultiplication),??而符號*代表元素積(Element-wise?product)。符號a代表sigmoid函數(shù),符號??tan/i代表hyperbolic?tangent函數(shù),其具體形式如公式(2-16)和(2-17)所不。??a(z)?=?_??-眷?g?(2-17)??
【參考文獻】:
期刊論文
[1]臨床預測模型:基本概念、應用場景及研究思路[J]. 谷鴻秋,周支瑞,章仲恒,周權. 中國循證心血管醫(yī)學雜志. 2018(12)
[2]基于臨床數(shù)據(jù)集的缺失值處理方法比較[J]. 李琳,楊紅梅,楊日東,胡珊,張學良,周毅. 中國數(shù)字醫(yī)學. 2018(04)
[3]重癥監(jiān)護室住院死亡風險的預測方法研究[J]. 謝俊卿,藺軻,孔桂蘭. 計算機工程與應用. 2017(20)
[4]基于隨機森林的乳腺腫瘤細針穿刺輔助診斷[J]. 孫偉,張俊升,邢培銳. 計算機應用. 2015(S2)
[5]常用分類算法在不同樣本量和類分布的不平衡數(shù)據(jù)中的分類效果比較[J]. 袁聯(lián)雄,佘玲玲,林愛華,駱福添. 中國醫(yī)院統(tǒng)計. 2015 (01)
[6]數(shù)據(jù)缺失的類型和處理方法及其在醫(yī)學中的應用[J]. 黃光煒. 中國醫(yī)院統(tǒng)計. 2013 (03)
[7]臨床研究中缺失值的類型和處理方法研究[J]. 唐健元,楊志敏,楊進波,黃欽,吳春芳,馮毅. 中國衛(wèi)生統(tǒng)計. 2011(03)
[8]有限樣本下中文垃圾郵件過濾的研究與實現(xiàn)[J]. 張洪勝,耿煥同,喻為民. 計算機應用與軟件. 2008(01)
[9]幾種不同缺失值填充方法的比較[J]. 劉星毅,農國才. 南寧師范高等?茖W校學報. 2007(03)
[10]小樣本機器學習算法的特性分析與應用[J]. 辛憲會,葉秋果,滕惠忠,郭思海,李軍,張靚,韓曉宏. 海洋測繪. 2007(03)
博士論文
[1]遷移學習問題與方法研究[D]. 龍明盛.清華大學 2014
[2]數(shù)據(jù)挖掘中分類分析的策略研究及其生物醫(yī)學應用[D]. 張超.南方醫(yī)科大學 2008
碩士論文
[1]不完全數(shù)據(jù)的處理方法及其在醫(yī)學研究中的應用[D]. 李樹威.重慶醫(yī)科大學 2014
[2]機器學習中的特征選擇算法研究[D]. 姜百寧.中國海洋大學 2009
[3]基于實例和特征的遷移學習算法研究[D]. 戴文淵.上海交通大學 2009
[4]數(shù)據(jù)倉庫中數(shù)據(jù)質量控制問題研究[D]. 熊霞.武漢大學 2004
本文編號:3225989
本文鏈接:http://www.sikaile.net/shoufeilunwen/yxlbs/3225989.html
最近更新
教材專著