基于數(shù)據(jù)挖掘的孕期高血壓研究
發(fā)布時間:2021-04-14 20:11
妊娠高血壓及其并發(fā)癥作為孕產(chǎn)婦死亡的第二大影響因素,給孕產(chǎn)婦和新生兒帶來嚴重威脅。該疾病多于妊娠20周后的高血壓、蛋白尿為顯著特征,同時損害身體中其它器官和系統(tǒng),不僅會影響胎兒母體內(nèi)生長發(fā)育,甚至會造成母嬰死亡,是導致孕產(chǎn)婦和胎兒死亡的主要原因之一。目前,業(yè)內(nèi)還沒有研究能夠完全明確其發(fā)病機制和影響因素。在這一背景下,本文采用數(shù)據(jù)挖掘的方法,對孕期高血壓展開研究。論文的內(nèi)容主要分為三個部分:(1)基于隨機森林和xgboost的妊娠高血壓研究第一部分首先對孕期高血壓數(shù)據(jù)進行預處理,包括數(shù)據(jù)清洗,去重,處理缺失數(shù)據(jù)和屬性規(guī)約等,最后進行數(shù)據(jù)轉換和建模分析。本章使用了隨機森林和Xgboost兩種機器學習模型對孕期高血壓數(shù)據(jù)進行建模分析并對特征進行了評分。實驗發(fā)現(xiàn)血壓和病人身高體重指數(shù)的特征分數(shù)比鈣元素,鈉元素,紅細胞數(shù)目和血紅蛋白的特征分數(shù)大,在疾病的預測中起到很大的作用。我們發(fā)現(xiàn)隨機森林模型準確率為82.5%,比XgBoost高約3個百分點,但是XgBoost訓練速度比隨機森林要快。(2)基于融合模型的妊娠高血壓分類預測鑒于傳統(tǒng)模型無法完全發(fā)現(xiàn)孕期高血壓數(shù)據(jù)潛在的規(guī)律,為了發(fā)揮各種模型的優(yōu)點...
【文章來源】:南京郵電大學江蘇省
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及研究意義
1.2 研究現(xiàn)狀
1.3 論文主要研究工作及安排
第二章 孕期高血壓及數(shù)據(jù)挖掘簡介
2.1 妊娠高血壓概述
2.1.1 妊娠高血壓發(fā)病機制探討
2.1.2 妊娠高血壓臨床表現(xiàn)
2.1.3 妊娠高血壓的診斷與治療
2.2 數(shù)據(jù)挖掘簡介
2.2.1 分類與回歸
2.2.2 關聯(lián)規(guī)則
2.2.3 聚類分析
2.3 數(shù)據(jù)挖掘流程
2.3.1 數(shù)據(jù)預處理
2.3.2 建模分析
2.3.3 模型評價
2.4 本章小結
第三章 孕期高血壓數(shù)據(jù)挖掘
3.1 數(shù)據(jù)集與預處理
3.1.1 數(shù)據(jù)來源
3.1.2 數(shù)據(jù)預處理
3.1.3 特征選擇
3.1.4 實驗環(huán)境簡介
3.2 隨機森林算法
3.2.1 隨機森林簡介
3.2.2 隨機森林建模流程
3.2.3 隨機森林模型參數(shù)
3.2.4 隨機森林模型性能分析
3.3 Xgboost算法
3.3.1 XGBoost原理簡介
3.3.2 XGBoost的優(yōu)點
3.3.3 XGBoost建模流程
3.3.4 XGBoost算法參數(shù)
3.3.5 XgBoost模型性能分析
3.4 本章小結
第四章 基于融合模型的孕期高血壓研究
4.1 集成學習概述
4.2 融合模型建模流程
4.3 融合模型的性能分析
4.4 本章小結
第五章 基于java web的孕期數(shù)據(jù)采集預測系統(tǒng)實現(xiàn)
5.1 Web開發(fā)簡介
5.2 開發(fā)工具及使用技術簡介
5.2.1 開發(fā)工具
5.2.2 前端頁面技術
5.2.3 服務器端技術簡介
5.3 系統(tǒng)的設計與實現(xiàn)
5.4 孕期數(shù)據(jù)采集系統(tǒng)功能展示
5.4.1 用戶注冊與登錄
5.4.2 查看任務列表
5.4.3 病人信息錄入與查看
5.4.4 管理員界面
5.5 本章小結
第六章 總結與展望
參考文獻
附錄1 攻讀碩士學位期間撰寫的論文
附錄2 攻讀碩士學位期間參加的科研項目
致謝
【參考文獻】:
期刊論文
[1]數(shù)據(jù)歸約效果評估方法研究[J]. 康睿智,郝文寧. 計算機工程與應用. 2016(15)
[2]隨機森林方法研究綜述[J]. 方匡南,吳見彬,朱建平,謝邦昌. 統(tǒng)計與信息論壇. 2011(03)
[3]360例妊娠期高血壓疾病及其并發(fā)癥妊娠結局分析[J]. 沈舒,王選華. 中國優(yōu)生與遺傳雜志. 2010(12)
[4]中國高血壓病流行病學及影響因素研究進展[J]. 種冠峰,相有章. 中國公共衛(wèi)生. 2010(03)
[5]基于2型糖尿病數(shù)據(jù)挖掘的中醫(yī)證候診斷標準模型建立研究[J]. 李建生,胡金亮,王永炎. 中國中醫(yī)基礎醫(yī)學雜志. 2008(05)
[6]甲型肝炎風險預測中Apriori關聯(lián)規(guī)則應用[J]. 關鵬,曲波,何苗,黃德生,周寶森. 中國公共衛(wèi)生. 2007(02)
[7]尿液中胎盤生長因子與先兆子癇的發(fā)病風險[J]. Levine R.J,Thadhani R,S.A. Karumanchi,寧亮. 世界核心醫(yī)學期刊文摘(婦產(chǎn)科學分冊). 2005(05)
[8]基于數(shù)據(jù)挖掘技術的骨腫瘤診斷知識的自動獲取[J]. 張輝,李軍,錢宗才,屈景輝,范清宇. 第四軍醫(yī)大學學報. 2004(07)
[9]一種基于模糊聚類分析的疾病電腦預測診斷方法[J]. 呂曉燕,郭建軍,李祥生. 電腦開發(fā)與應用. 2003(12)
[10]J2EE平臺上MVC設計模式的研究與實現(xiàn)[J]. 陸榮幸,郁洲,阮永良,王志強. 計算機應用研究. 2003(03)
本文編號:3137943
【文章來源】:南京郵電大學江蘇省
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及研究意義
1.2 研究現(xiàn)狀
1.3 論文主要研究工作及安排
第二章 孕期高血壓及數(shù)據(jù)挖掘簡介
2.1 妊娠高血壓概述
2.1.1 妊娠高血壓發(fā)病機制探討
2.1.2 妊娠高血壓臨床表現(xiàn)
2.1.3 妊娠高血壓的診斷與治療
2.2 數(shù)據(jù)挖掘簡介
2.2.1 分類與回歸
2.2.2 關聯(lián)規(guī)則
2.2.3 聚類分析
2.3 數(shù)據(jù)挖掘流程
2.3.1 數(shù)據(jù)預處理
2.3.2 建模分析
2.3.3 模型評價
2.4 本章小結
第三章 孕期高血壓數(shù)據(jù)挖掘
3.1 數(shù)據(jù)集與預處理
3.1.1 數(shù)據(jù)來源
3.1.2 數(shù)據(jù)預處理
3.1.3 特征選擇
3.1.4 實驗環(huán)境簡介
3.2 隨機森林算法
3.2.1 隨機森林簡介
3.2.2 隨機森林建模流程
3.2.3 隨機森林模型參數(shù)
3.2.4 隨機森林模型性能分析
3.3 Xgboost算法
3.3.1 XGBoost原理簡介
3.3.2 XGBoost的優(yōu)點
3.3.3 XGBoost建模流程
3.3.4 XGBoost算法參數(shù)
3.3.5 XgBoost模型性能分析
3.4 本章小結
第四章 基于融合模型的孕期高血壓研究
4.1 集成學習概述
4.2 融合模型建模流程
4.3 融合模型的性能分析
4.4 本章小結
第五章 基于java web的孕期數(shù)據(jù)采集預測系統(tǒng)實現(xiàn)
5.1 Web開發(fā)簡介
5.2 開發(fā)工具及使用技術簡介
5.2.1 開發(fā)工具
5.2.2 前端頁面技術
5.2.3 服務器端技術簡介
5.3 系統(tǒng)的設計與實現(xiàn)
5.4 孕期數(shù)據(jù)采集系統(tǒng)功能展示
5.4.1 用戶注冊與登錄
5.4.2 查看任務列表
5.4.3 病人信息錄入與查看
5.4.4 管理員界面
5.5 本章小結
第六章 總結與展望
參考文獻
附錄1 攻讀碩士學位期間撰寫的論文
附錄2 攻讀碩士學位期間參加的科研項目
致謝
【參考文獻】:
期刊論文
[1]數(shù)據(jù)歸約效果評估方法研究[J]. 康睿智,郝文寧. 計算機工程與應用. 2016(15)
[2]隨機森林方法研究綜述[J]. 方匡南,吳見彬,朱建平,謝邦昌. 統(tǒng)計與信息論壇. 2011(03)
[3]360例妊娠期高血壓疾病及其并發(fā)癥妊娠結局分析[J]. 沈舒,王選華. 中國優(yōu)生與遺傳雜志. 2010(12)
[4]中國高血壓病流行病學及影響因素研究進展[J]. 種冠峰,相有章. 中國公共衛(wèi)生. 2010(03)
[5]基于2型糖尿病數(shù)據(jù)挖掘的中醫(yī)證候診斷標準模型建立研究[J]. 李建生,胡金亮,王永炎. 中國中醫(yī)基礎醫(yī)學雜志. 2008(05)
[6]甲型肝炎風險預測中Apriori關聯(lián)規(guī)則應用[J]. 關鵬,曲波,何苗,黃德生,周寶森. 中國公共衛(wèi)生. 2007(02)
[7]尿液中胎盤生長因子與先兆子癇的發(fā)病風險[J]. Levine R.J,Thadhani R,S.A. Karumanchi,寧亮. 世界核心醫(yī)學期刊文摘(婦產(chǎn)科學分冊). 2005(05)
[8]基于數(shù)據(jù)挖掘技術的骨腫瘤診斷知識的自動獲取[J]. 張輝,李軍,錢宗才,屈景輝,范清宇. 第四軍醫(yī)大學學報. 2004(07)
[9]一種基于模糊聚類分析的疾病電腦預測診斷方法[J]. 呂曉燕,郭建軍,李祥生. 電腦開發(fā)與應用. 2003(12)
[10]J2EE平臺上MVC設計模式的研究與實現(xiàn)[J]. 陸榮幸,郁洲,阮永良,王志強. 計算機應用研究. 2003(03)
本文編號:3137943
本文鏈接:http://www.sikaile.net/yixuelunwen/fuchankeerkelunwen/3137943.html
最近更新
教材專著