天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

小樣本臨床數(shù)據(jù)的擴增協(xié)同分類輔助診斷方法研究與應(yīng)用

發(fā)布時間:2020-08-09 00:13
【摘要】:臨床數(shù)據(jù)中蘊含著許多有價值的信息,對于醫(yī)生明確診斷,治療疾病具有重要意義。但是現(xiàn)實生活中的臨床數(shù)據(jù)由于保密性、不完整性,罕見疾病樣本數(shù)量少,以及對于一些診斷困難疾病的臨床數(shù)據(jù)類別標簽獲取困難等客觀原因?qū)е聼o法獲得大量的臨床樣本。由這些原因造成的臨床數(shù)據(jù)分類問題是一個典型的小樣本數(shù)據(jù)分類問題。但是小樣本臨床數(shù)據(jù)采用傳統(tǒng)分類算法訓練的分類模型分類性能較低,不能滿足現(xiàn)實生活的需要。為了進一步提高分類性能,為臨床診斷提供一種有效的輔助診斷手段,本論文以臨床數(shù)據(jù)為基礎(chǔ),針對不同疾病的小樣本臨床數(shù)據(jù)進行了研究,提出了數(shù)據(jù)擴增協(xié)同分類的小樣本臨床數(shù)據(jù)分類方法。本論文主要取得了如下成果:1.從臨床數(shù)據(jù)樣本量少出發(fā),為了能夠獲得大量的樣本,提出了基于高斯混合模型的數(shù)據(jù)擴增方法。通過對已有臨床數(shù)據(jù)高斯混合分布的估計生成大量帶有類別標簽的虛擬數(shù)據(jù)即擴增數(shù)據(jù),這樣可以為接下來的分類任務(wù)提供大量的數(shù)據(jù)支持。2.本文在“數(shù)據(jù)擴增協(xié)同分類”思想下提出了兩種分類算法:第一種是基于數(shù)據(jù)擴增的分類算法:對臨床訓練數(shù)據(jù)通過數(shù)據(jù)擴增生成大量擴增數(shù)據(jù),然后將擴增數(shù)據(jù)和臨床訓練數(shù)據(jù)組成新的訓練集訓練傳統(tǒng)的有監(jiān)督分類模型。第二種是數(shù)據(jù)擴增協(xié)同半監(jiān)督循環(huán)隨機森林(DA-SSCRF)分類算法:通過對第一種算法的理論及實驗分析發(fā)現(xiàn)數(shù)據(jù)擴增給出的類別標簽存在錯誤會導(dǎo)致分類性能下降。因此為了給擴增數(shù)據(jù)標記可信度高的類別標簽,本文引入了半監(jiān)督學習思想,將臨床訓練數(shù)據(jù)作為有標簽數(shù)據(jù),對臨床訓練數(shù)據(jù)擴增得到的擴增數(shù)據(jù)作為無標簽數(shù)據(jù),最終提出了小樣本分類背景下的半監(jiān)督循環(huán)隨機森林分類算法。通過構(gòu)造半監(jiān)督分類模型,使得擴增數(shù)據(jù)能夠起到強化分類性能的作用。3.通過八種疾病臨床數(shù)據(jù)集的驗證,DA-SSCRF分類算法的分類準確率比不進行數(shù)據(jù)擴增的有監(jiān)督分類算法和進行數(shù)據(jù)擴增的其它半監(jiān)督分類算法的準確率提升了3%到11%。4.為了證明DA-SSCRF算法的實用性,將DA-SSCRF算法應(yīng)用到了來自某三甲醫(yī)院的腦膜炎疾病臨床數(shù)據(jù)集上。本文通過基于變異系數(shù)的特征選擇方法從原始的52維臨床信息中選出了10維特征組成腦膜炎臨床數(shù)據(jù)集,實驗結(jié)果也表明DA-SSCRF算法在腦膜炎疾病類型的診斷準確率上提升3%,在臨床醫(yī)生診斷困難的結(jié)核性腦膜炎和隱球菌腦膜炎這兩種類型的診斷率上分別提升了6%和10%。DA-SSCRF算法通過10維腦膜炎臨床信息就能夠?qū)崿F(xiàn)對腦膜炎快速高效的診斷,對于腦膜炎疾病類型診斷具有重要意義。綜上,本文針對小樣本臨床數(shù)據(jù)的分類問題提出了相應(yīng)的解決辦法,有效提高了疾病診斷的準確性,對于輔助醫(yī)生進行疾病診斷具有重要意義。
【學位授予單位】:西安電子科技大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:R-05;TP181
【圖文】:

框架圖,小樣本,框架圖,分類方法


據(jù)擴增與分類同時進行,數(shù)據(jù)擴增中考慮分類,分類中進行數(shù)據(jù)擴增。基于此思想提出了兩種分類算法,圖 3.1 給出了本文方法的框架圖。圖3.1 小樣本臨床數(shù)據(jù)分類方法框架圖基于數(shù)據(jù)擴增的分類算法:首先為了解決臨床訓練數(shù)據(jù)樣本數(shù)量少的問題,通過基于高斯混合模型的數(shù)據(jù)擴增(DA)方法生成帶有類別標簽的擴增數(shù)據(jù),然后和訓練數(shù)

流程圖,流程圖,數(shù)據(jù),高斯混合模型


特征的離散化處理:針對臨床數(shù)據(jù)中的離散特征,對擴增得到的連續(xù)值進行離散化處理。圖 3.2 給出了數(shù)據(jù)擴增方法流程圖。圖3.2 數(shù)據(jù)擴增方法流程圖(1)擴增數(shù)量及類別標簽的獲取為了獲得帶有類別標簽的擴增數(shù)據(jù),需要對臨床訓練數(shù)據(jù)中的每一類數(shù)據(jù)進行高斯混合模型的參數(shù)估計生成帶有類別標簽的擴增數(shù)據(jù)。我們知道高斯混合模型是由多個高斯模型線性組成的,通過高斯混合模型隨機生成擴增數(shù)據(jù)的過程實際上就是隨機生成服從多個高斯分布數(shù)據(jù)的過程。如果要生成一定數(shù)量的服從高斯混合分布的擴增數(shù)據(jù),那么每一個高斯分布所占的樣本數(shù)量成為一個關(guān)鍵問題。由于在高斯混合模型中每一個高斯分布的權(quán)重系數(shù)都不相同,這個權(quán)重系數(shù)代表數(shù)據(jù)出現(xiàn)在這個高斯分布的可能性,即概率值。因此我們的擴增原則是按照數(shù)據(jù)可能出現(xiàn)在某個高斯分布的概率生成相應(yīng)的擴增數(shù)據(jù)。對于臨床訓練數(shù)據(jù)中的每個類別的臨床數(shù)據(jù),通過高斯混合分布生成一定數(shù)量的擴增數(shù)據(jù)的步驟如下所示:將臨床訓練數(shù)據(jù)D中的第i類數(shù)據(jù)記為( i)D ,標簽為 i 。( i)D 通過高斯混合模型參數(shù)的估計得到最新參數(shù)集new ( new , new , new)1 i i i i k

流程圖,分類算法,流程圖,數(shù)據(jù)


3.2.3 算法具體流程因此,基于數(shù)據(jù)擴增的分類算法具體流程如圖 3.3 所示:圖3.3 基于數(shù)據(jù)擴增的分類算法流程圖由圖 3.3 可知,該方法主要分為五個階段:第一階段:待擴增臨床數(shù)據(jù)集的劃分第二階段:通過高斯混合模型得到相關(guān)參數(shù)第三階段:擴增數(shù)量及類別標簽的獲取第四階段:離散特征的離散化第五階段:分類模型的訓練具體流程如下所示:輸入:臨床訓練數(shù)據(jù)1 2 1 2 2{ , ,..., , , ,..., }m m m mD+ +x x x x x x ,其中,前 m 個特征是連續(xù)變量,最后m 個特征是離散變量。假設(shè)該數(shù)據(jù)集共有g(shù) 類,即有g(shù) 個類別標簽。輸出:帶有類別標簽的擴增數(shù)據(jù)集過程:第一階段:待擴增臨床數(shù)據(jù)集的劃分Step1:對臨床訓練數(shù)據(jù) D 按照類別 g 進行劃分。將其劃分為 g 個子數(shù)據(jù)集,每一個子數(shù)據(jù)集稱為單類臨床數(shù)據(jù)集,作為下一步的輸入。因此共有g(shù) 個單類臨床數(shù)據(jù)集,其中第i 類臨床數(shù)據(jù)集

【相似文獻】

相關(guān)期刊論文 前10條

1 景慎旗;劉云;繆妹妹;張小亮;;基于臨床數(shù)據(jù)中心的醫(yī)院知識服務(wù)系統(tǒng)構(gòu)建[J];醫(yī)學信息學雜志;2017年02期

2 林琳;白波;王韜;;臨床數(shù)據(jù)中心的構(gòu)建與應(yīng)用[J];中國數(shù)字醫(yī)學;2016年08期

3 吳曉芬;王磊;王培軍;;基于電子病歷的臨床數(shù)據(jù)中心構(gòu)建[J];醫(yī)學信息學雜志;2016年10期

4 徐曉輝;;醫(yī)院臨床數(shù)據(jù)中心構(gòu)建探討[J];中國數(shù)字醫(yī)學;2015年02期

5 尹嶺;陳廣飛;蔣艷峰;成福春;杜鵬;應(yīng)俊;何史林;管淑麗;彭芳;劉勝男;周丹;;臨床數(shù)據(jù)資源整合與利用[J];中國數(shù)字醫(yī)學;2010年11期

6 左崇年;;臨床數(shù)據(jù)造假入刑并非小題大做[J];江淮法治;2017年08期

7 羅晶;李勁松;黃麗麗;周天舒;翁盛鑫;田宇;;臨床數(shù)據(jù)中心建設(shè)助力轉(zhuǎn)化醫(yī)學研究[J];轉(zhuǎn)化醫(yī)學雜志;2013年02期

8 孟繁榮;劉永蘭;王軍成;;醫(yī)院臨床數(shù)據(jù)中心建設(shè)問題分析[J];解放軍醫(yī)藥雜志;2012年12期

9 ;等待臨床數(shù)據(jù)導(dǎo)致“不應(yīng)有的死亡”[J];科學之友;2006年11期

10 樂穎;;臨床數(shù)據(jù)中心的構(gòu)建與應(yīng)用[J];中國衛(wèi)生產(chǎn)業(yè);2018年05期

相關(guān)會議論文 前10條

1 張華;張笑波;趙宏杰;林宇春;;證的量化與臨床數(shù)據(jù)的定性的方法學理論基礎(chǔ)[A];中國中西醫(yī)結(jié)合學會診斷專業(yè)委員會2009’年會論文集[C];2009年

2 張華;張笑波;趙宏杰;林宇春;;證的量化與臨床數(shù)據(jù)的定性的方法學理論基礎(chǔ)[A];2009全國時間生物醫(yī)學學術(shù)會議論文集[C];2009年

3 張華;張笑波;趙宏杰;;證的量化與臨床數(shù)據(jù)的定性的方法學理論基礎(chǔ)[A];中華中醫(yī)藥學會第二屆中醫(yī)方證基礎(chǔ)研究與臨床應(yīng)用學術(shù)研討會論文集[C];2008年

4 王禹毅;韓梅;陳妮妮;李青;劉建平;;從如何獲得高質(zhì)量臨床數(shù)據(jù)探討臨床試驗的數(shù)據(jù)管理[A];第七屆中醫(yī)/中西醫(yī)結(jié)合循證醫(yī)學方法研討會會議材料[C];2013年

5 李嶺;季星來;李妍;李春義;;生物信息學研究中臨床數(shù)據(jù)解讀方面可能存在的若干問題的探討[A];中國的遺傳學研究——中國遺傳學會第七次代表大會暨學術(shù)討論會論文摘要匯編[C];2003年

6 潘宏銘;;從臨床試驗到臨床實踐—?颂婺幄羝谂R床數(shù)據(jù)分析[A];2013年第六屆國家級分子靶點藥物治療新進展學習班暨浙江省腫瘤化療學術(shù)年會論文集[C];2013年

7 韓釗;臧秋玲;葉祖森;王蘋莉;樊愷;曹云剛;耿媛媛;張征;;卒中臨床數(shù)據(jù)登記系統(tǒng)的研究開發(fā)[A];醫(yī)學科研管理前沿與實務(wù)研討班論文集[C];2009年

8 陳松鶴;;基于CDR的醫(yī)院衛(wèi)生統(tǒng)計數(shù)據(jù)建設(shè)與應(yīng)用[A];第二十八屆中國醫(yī)院協(xié)會病案專業(yè)委員會學術(shù)會議論文集[C];2019年

9 陳松鶴;陳志文;;基于CDR的醫(yī)院衛(wèi)生統(tǒng)計數(shù)據(jù)建設(shè)與應(yīng)用[A];第二十七屆中國醫(yī)院協(xié)會病案管理專業(yè)委員會學術(shù)會議論文集[C];2018年

10 韓釗;臧秋玲;葉祖森;項崇雷;陳小麗;邵蓓;鄭榮遠;;《卒中臨床數(shù)據(jù)登記系統(tǒng)V1.0》軟件的開發(fā)與使用[A];2008年浙江省神經(jīng)病學學術(shù)年會論文匯編[C];2008年

相關(guān)重要報紙文章 前10條

1 本報記者 龍九尊;上市申請近4年未獲批 VTI披露ELAD臨床數(shù)據(jù)[N];科學時報;2011年

2 記者 姚倩;瑞德西韋臨床數(shù)據(jù)近期將公布[N];北京商報;2020年

3 晏揚;從“罰酒三杯”到死刑,藥物臨床數(shù)據(jù)還敢造假?[N];工人日報;2017年

4 伊一芳;臨床數(shù)據(jù)造假 應(yīng)該付出代價[N];人民法院報;2017年

5 左崇年;“臨床數(shù)據(jù)造假入刑”并非小題大做[N];中國商報;2017年

6 劉效仁;臨床數(shù)據(jù)造假入刑為生命安全鑄劍[N];證券時報;2017年

7 廣西 醫(yī)生 羅志華;臨床數(shù)據(jù)造假入刑是合理糾偏[N];長江日報;2017年

8 西南政法大學政治與公共管理學院副教授 和靜鈞;臨床造假入刑才是真正“零容忍”[N];深圳特區(qū)報;2017年

9 廖海金 江西省新余市渝水區(qū)政協(xié)委員;臨床數(shù)據(jù)造假,必須施以最嚴格的刑罰[N];人民政協(xié)報;2017年

10 本報記者 張藍飛;臨床數(shù)據(jù)成推動產(chǎn)業(yè)創(chuàng)新抓手[N];醫(yī)藥經(jīng)濟報;2017年

相關(guān)博士學位論文 前2條

1 周天舒;國際臨床數(shù)據(jù)交換關(guān)鍵技術(shù)研究及系統(tǒng)實現(xiàn)[D];浙江大學;2013年

2 馮奇;POMDP近似解法研究及在中醫(yī)診療方案優(yōu)化中的應(yīng)用[D];北京交通大學;2011年

相關(guān)碩士學位論文 前10條

1 郭峻凌;基于圖卷積網(wǎng)絡(luò)的癌癥生存期預(yù)測方法[D];哈爾濱工業(yè)大學;2019年

2 康越;小樣本臨床數(shù)據(jù)的擴增協(xié)同分類輔助診斷方法研究與應(yīng)用[D];西安電子科技大學;2019年

3 許帆;基于臨床數(shù)據(jù)的中醫(yī)處方推薦方法研究[D];北京交通大學;2019年

4 李雪梅;食管鱗癌臨床數(shù)據(jù)平臺構(gòu)建與處理分析[D];濟南大學;2019年

5 范旦;基于大數(shù)據(jù)分析法的腰痛古代文獻數(shù)據(jù)與現(xiàn)代臨床數(shù)據(jù)證藥對照研究[D];成都中醫(yī)藥大學;2018年

6 李雅娜;腦卒中臨床數(shù)據(jù)管理與疾病輔助預(yù)測系統(tǒng)[D];昆明理工大學;2018年

7 潘主強;基于中醫(yī)臨床數(shù)據(jù)的疾病分類關(guān)鍵方法研究[D];西南石油大學;2017年

8 王宏宇;基于大數(shù)據(jù)研究模式對重癥燒傷患者臨床數(shù)據(jù)的挖掘與分析[D];第三軍醫(yī)大學;2015年

9 孫亞林;臨床數(shù)據(jù)管理系統(tǒng)研究及其在數(shù)據(jù)規(guī)范化管理中的應(yīng)用[D];第二軍醫(yī)大學;2005年

10 劉一帆;基于電子病歷的科室臨床數(shù)據(jù)中心的實現(xiàn)[D];中山大學;2014年



本文編號:2786298

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/yixuelunwen/yiyuanguanlilunwen/2786298.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6f3d6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com