天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

數據驅動下的糖尿病并發(fā)癥預測方法研究與系統(tǒng)構建

發(fā)布時間:2021-07-06 17:57
  近年來隨著健康醫(yī)療信息化的發(fā)展,我國在醫(yī)療信息化建設方面取得了較大的進步,科學研究、健康醫(yī)療服務和管理實踐等使得信息化系統(tǒng)中積攢了大量的電子病歷數據。對于大部分醫(yī)院來說電子病歷系統(tǒng)更多的是一種管理工具,醫(yī)療數據資源沒有得到充分的利用。數據驅動下的挖掘方法在生物醫(yī)學中的應用需求,將所有可用信息智能地轉化為有價值的知識比以往任何時候都更加迫切。因此,對于電子病歷系統(tǒng)中龐大數據的挖掘已然成為醫(yī)療信息研究中的大趨勢。糖尿病為繼心血管疾病、惡性腫瘤后的第三大威脅人類健康的慢性病。糖尿病易引起并發(fā)癥,其中糖尿病腎病是糖尿病患者最重要的并發(fā)癥之一,并發(fā)癥具有早期不易發(fā)現,且并發(fā)后藥物難以根治的特點,因此對并發(fā)癥的預測成為研究熱點。課題選取了某醫(yī)院電子病歷中與糖尿病并發(fā)腎病相關數據源進行本文研究。對糖尿病并發(fā)癥的研究主要包含以下幾個方面:(1)數據處理。由于操作不當、機器故障等造成的噪聲、缺失值、異常值等數據質量問題,為了不影響實驗預測的結果,研究中對數據進行了整合、清洗等一系列預處理操作。(2)糖尿病并發(fā)癥預測模型構建。對預處理后的數據進行了多維分析,并結合算法的優(yōu)缺點選擇了隨機森林算法(Rando... 

【文章來源】:北京工業(yè)大學北京市 211工程院校

【文章頁數】:83 頁

【學位級別】:碩士

【部分圖文】:

數據驅動下的糖尿病并發(fā)癥預測方法研究與系統(tǒng)構建


患者基本信息Figure2-1Patientbasicinformation

檢驗信息


從圖2-2 抽取出的患者檢查檢驗信息存儲形式是按列進行存儲的。經過抽取得到的糖尿病數據包括病患基本信息 2435 條,檢驗檢查信息210809 條。2.2.3 數據集成將不同來源的數據中涉及到同一患者的數據整合成起來,這樣才能進行后續(xù)的工作具體數據整合的步驟如下 :(1)調研相關資料并與醫(yī)院的醫(yī)護人員確定患者做檢查檢驗的情況,根據數據的特點和后續(xù)實驗的需求制定數據整合的規(guī)則。(2)根據制定的規(guī)則設計程序將同一個患者的基本信息和檢查檢驗信息整合為一條可用的數據樣本。按照以上需求,通過與醫(yī)院相關人員溝通,數據的整合規(guī)則為:1.取住院日期三日內離住院日期最近的一次檢查為準。2.若住院日期三日內無數據則取門診檢查里離住院日期最近的一次檢查。3.利用以上 1 和 2 的規(guī)則通過病案號這唯一標識將各部分數據進行整合。根據以上規(guī)則設計程序,將病人的基本信息與檢查檢驗數據進行整合,整合后得到的數據包含病患的 65 項?

數據整合


圖 2-3 數據整合后的結果Figure 2-3 Results after data integration2.2.4 數據清洗將患者的基本信息和檢查檢驗信息整合后的數據如圖 2-3。通過上圖我們發(fā)現數據存在可讀性不強、部分體檢化驗數據缺失嚴重,部分數據存在異常值等問題。這其中包括醫(yī)師水平問題和對計算機使用不熟練而造成數據的錯誤錄入,以及電子病歷保存過程中服務器運行較慢或受到外來攻擊等造成的文件損壞或丟失問題[39]。因此要對數據進行預處理達到數據質量要求。具體處理內容如下:(1)清除無效特征、空值特征。通過對整合后的數據集分析,數據中存在作用相同的患者指標可刪除,如病人的姓名與病人住院號,對于病人的姓名來說在醫(yī)院的系統(tǒng)中可能存在相同數據,而病人的住院號是作為病人的唯一標識,所以刪除病人的姓名,而保留病人住院號。在病人的基本信息中,還包括電話、職業(yè)等信息,這樣的信息對于糖尿病預測來說屬于無關特征,對于這樣的特征本文直接刪除。

【參考文獻】:
期刊論文
[1]基于Logistic回歸和多層神經網絡的Ⅱ型糖尿病并發(fā)癥預測[J]. 王潔,喬藝璇,彭巖,陳曉.  高技術通訊. 2019(05)
[2]全球糖尿病治療藥物研發(fā)及市場態(tài)勢[J]. 李子艷,王春麗,高柳濱.  藥學進展. 2018(09)
[3]基于集成學習的上市公司財務信息異常識別[J]. 王榮欣.  中國物價. 2018(07)
[4]一種融合多種信息的Web文檔分類方法[J]. 段國侖,謝鈞,郭蕾蕾,王曉瑩.  信息技術與網絡安全. 2018(06)
[5]2型糖尿病患者中性粒細胞/淋巴細胞比值與尿白蛋白/肌酐比值的相關性研究[J]. 田伊茗,陸強,尹福在,李濤,顧洪媛,王蕊,劉俊茹,王銳.  醫(yī)學研究生學報. 2017(10)
[6]糖尿病慢性并發(fā)癥社區(qū)管理現況與探索[J]. 李帥,任菁菁.  中華全科醫(yī)師雜志. 2017 (08)
[7]基于特征頻繁度的勒索軟件檢測方法研究[J]. 龔琪,曹金璇,蘆天亮,李丁蓬.  計算機應用研究. 2018(08)
[8]基于miRNA-靶位點配對的序列特征研究[J]. 滕少華,夏飛迪,張巍,劉冬寧,王洋,鄒小勇.  分析測試學報. 2017(05)
[9]基于改進網格搜索算法的隨機森林參數優(yōu)化[J]. 溫博文,董文瀚,解武杰,馬駿.  計算機工程與應用. 2018(10)
[10]紅細胞分布寬度預測2型糖尿病患者對比劑腎病[J]. 劉曉剛,劉玉峰,顧曄,胡立群.  中國動脈硬化雜志. 2016(08)

碩士論文
[1]基于數據挖掘的陌生人社交APP用戶流失預測模型研究[D]. 鐘文鑫.首都經濟貿易大學 2018
[2]一維聲子晶體板的帶隙優(yōu)化研究[D]. 李杰.湖南大學 2018
[3]醫(yī)療數據挖掘可視化系統(tǒng)的研究與實現[D]. 吳春姍.北京郵電大學 2017
[4]隨機森林算法的優(yōu)化改進研究[D]. 馬驪.暨南大學 2016
[5]北京工業(yè)大學3D打印中心信息發(fā)布及管理系統(tǒng)的設計與實現[D]. 葉珍.北京工業(yè)大學 2016
[6]求解函數優(yōu)化問題的遺傳算法設計研究[D]. 涂井先.廣東工業(yè)大學 2012



本文編號:3268706

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3268706.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶df1f4***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com