基于數(shù)據(jù)挖掘的缺血性腦卒中風(fēng)險預(yù)測模型及其應(yīng)用研究
發(fā)布時間:2021-01-26 17:19
腦卒中,具有“四高一多”等特征以及發(fā)病人群年輕化趨勢,不可逆轉(zhuǎn),嚴(yán)重威脅著人類的生命和健康。其中,缺血性腦卒中占卒中總?cè)藬?shù)的60%-70%。因此,提前篩查缺血性腦卒中高危個體至關(guān)重要。本文基于數(shù)據(jù)挖掘分類算法及其評估等相關(guān)理論,構(gòu)建缺血性腦卒中風(fēng)險預(yù)測模型,篩查高危人群,并進(jìn)行健康管理。首先,通過合作醫(yī)院獲取樣本,利用相關(guān)的數(shù)據(jù)處理技術(shù)對收集的樣本數(shù)據(jù)進(jìn)行預(yù)處理,同時采用Logistic回歸算法精簡缺血性腦卒中風(fēng)險預(yù)測的指標(biāo)集。其次,為提升模型的可操作性與實用性,在精簡的指標(biāo)集上分別從簡單個人水平與復(fù)雜臨床水平建立不同水平的缺血性腦卒中風(fēng)險預(yù)測模型,以篩查不同水平腦卒中高危人群。第三,為規(guī)避單一分類器的局限性,本文綜合比較多個分類器(決策樹和支持向量機(jī))的優(yōu)劣,同時運用多種模型評估方法對已構(gòu)建的缺血性腦卒中風(fēng)險預(yù)測模型的性能進(jìn)行評價。最后,為了實現(xiàn)腦卒中高危人群篩查的高精度、高準(zhǔn)確率的要求,本文采用網(wǎng)格搜索算法分別優(yōu)化支持向量機(jī)算法與集成決策樹的隨機(jī)森林算法,并將優(yōu)化的算法與單一算法進(jìn)行對比,最終尋求建立各方面最佳的風(fēng)險預(yù)測模型。同時將預(yù)測模型應(yīng)用于缺血性腦卒中健康管理系統(tǒng)中。本文構(gòu)建...
【文章來源】:燕山大學(xué)河北省
【文章頁數(shù)】:92 頁
【學(xué)位級別】:碩士
【部分圖文】:
技術(shù)路線圖
第2章相關(guān)理論基礎(chǔ)-13-(2)健康評估:健康評估是推動健康管理的專業(yè)技術(shù),它根據(jù)采集的健康信息,確定個體或群體現(xiàn)處于的健康狀態(tài),同時通過數(shù)學(xué)或計算機(jī)等方式構(gòu)建疾病患病風(fēng)險預(yù)測模型,對個人或群體的患病風(fēng)險進(jìn)行預(yù)測。(3)健康分析:在健康評估的基礎(chǔ)上,對預(yù)測結(jié)果進(jìn)行分析,找出可干預(yù)的危險因素,幫助個人全面認(rèn)識自我健康風(fēng)險并制定健康管理計劃。(4)健康干預(yù):健康管理循環(huán)的最終目標(biāo),它是在之前步驟的基礎(chǔ)下,根據(jù)制定的健康管理個性化服務(wù)方案糾正不良生活作息。疾病發(fā)病的危險因素日趨復(fù)雜,要調(diào)節(jié)我國增長的健康需求與短缺的醫(yī)療資源之間的平衡,最高效的方法就是進(jìn)行科學(xué)的健康管理。目前,健康管理的方法如圖2-1所示,方法1表明通過醫(yī)療干預(yù)可以減弱危險因素對健康的影響[47];方法2與方法3表明,通過健康管理可以調(diào)節(jié)危險因素對健康的影響[48];方法4為醫(yī)療干預(yù)對健康管理的反潰通過圖2-1可以發(fā)現(xiàn),健康管理在危險因素與醫(yī)療干預(yù)之間起到調(diào)控與緩沖作用。一方面,通過健康管理達(dá)到疾病預(yù)防或者早發(fā)現(xiàn)、早診斷、早治療,從而減少醫(yī)療資源的需求;另一方面,可以優(yōu)化醫(yī)療資源配置,實現(xiàn)效益最大。圖2-1健康管理與危險因素、醫(yī)療干預(yù)之間的關(guān)系2.2數(shù)據(jù)挖掘及其算法概述2.2.1數(shù)據(jù)挖掘的基本概念1989年在第11屆國際聯(lián)合人工智能學(xué)術(shù)會議中首次提出數(shù)據(jù)挖掘。它是指復(fù)雜
第2章相關(guān)理論基礎(chǔ)-23-的發(fā)生,錯誤率最低。圖2-2隨機(jī)驗證法原理2.3.2一致性檢驗一致性檢驗用于判斷分類器結(jié)果與實際結(jié)果是否具有一致性,不同模型結(jié)果是否具有一致性和不同方法之間是否具有一致性。Kappa系數(shù)是用來評價一致性的指標(biāo)值,用來檢驗分類結(jié)果與實際結(jié)果一樣的計數(shù)與那些僅為偶然結(jié)果的期望是否存在不同。參照表2-1,加權(quán)Kappa系數(shù)等于簡單Kappa系數(shù)。具體公式如下:0eeP-PKappa=1-P(2-26)式中,0TP+TNP=P+N,e2(TP+FN)(TP+FP)+(FP+TN)(FN+TN)P=(P+N),0P為實際一致率,eP為理論一致率。一般認(rèn)為,Kappa>0構(gòu)建的模型才具有實際意義,Kappa值越大,一致性越好。若0<Kappa<0.4,說明一致性差;若0.4<Kappa<0.75,一致性一般;若0.75<Kappa<1,一致性好。Kappa=1,說明結(jié)果完全一致,Kappa=0表示結(jié)果不存在一致性。2.3.3ROC曲線受試者工作特征曲線(ROC曲線),是一種比較模型分類效果坐標(biāo)圖的可視化工具,用來展示靈敏度和特異度之間的相互關(guān)系。1960年開始,ROC分析被應(yīng)用于醫(yī)療領(lǐng)域[51]。ROC曲線以靈敏度為縱坐標(biāo),(1-特異度)為橫坐標(biāo),通過設(shè)定出多個不同的臨界值,得出每個點對應(yīng)的坐標(biāo),并繪制曲線,通過曲線下面積值(AUC值)用
【參考文獻(xiàn)】:
期刊論文
[1]淺談大數(shù)據(jù)在醫(yī)療行業(yè)的應(yīng)用[J]. 曹景禹. 通訊世界. 2019(04)
[2]《中國心血管病報告2018》概要[J]. 胡盛壽,高潤霖,劉力生,朱曼璐,王文,王擁軍,吳兆蘇,李惠君,顧東風(fēng),楊躍進(jìn),鄭哲,陳偉偉. 中國循環(huán)雜志. 2019(03)
[3]基于動態(tài)采樣和遷移學(xué)習(xí)的疾病預(yù)測模型[J]. 胡滿滿,陳旭,孫毓忠,沈曦,王曉青,余天洋,梅御東,肖立,程偉,楊杰,楊焱. 計算機(jī)學(xué)報. 2019(10)
[4]我國腦卒中防治仍面臨巨大挑戰(zhàn)——《中國腦卒中防治報告2018》概要[J]. 王隴德,劉建民,楊弋,彭斌,王伊龍. 中國循環(huán)雜志. 2019(02)
[5]C5.0決策樹與RBF神經(jīng)網(wǎng)絡(luò)模型用于急性缺血性腦卒中出血性轉(zhuǎn)化的風(fēng)險預(yù)測性能比較[J]. 王海東,張璐,王潔,李晶,周瑩,王國立,汪可可,彭延波,武建輝. 中華疾病控制雜志. 2019(02)
[6]大理居民腦卒中患者危險因素的Logistic回歸分析[J]. 徐弘揚(yáng),杜小珊,楊錫彤,馬蓉,王光明. 大理大學(xué)學(xué)報. 2018(08)
[7]進(jìn)展性缺血性腦卒中的相關(guān)因素分析[J]. 徐榮薇. 中國實用神經(jīng)疾病雜志. 2018(11)
[8]醫(yī)療大數(shù)據(jù)在腫瘤疾病中的應(yīng)用研究[J]. 宋波,朱甜甜,于旭,馮云霞,張中. 中國數(shù)字醫(yī)學(xué). 2017(08)
[9]基于灰色關(guān)聯(lián)分析與隨機(jī)森林回歸模型的短期負(fù)荷預(yù)測[J]. 張冰,周步祥,石敏,魏金蕭. 水電能源科學(xué). 2017(04)
[10]臨床醫(yī)療大數(shù)據(jù)研究現(xiàn)狀與展望[J]. 陸易,黃正行,俞思偉,段會龍. 醫(yī)療衛(wèi)生裝備. 2017(03)
博士論文
[1]分類方法在中醫(yī)辨證診斷應(yīng)用中的比較研究[D]. 陳淑慧.廣州中醫(yī)藥大學(xué) 2008
碩士論文
[1]面向糖尿病的臨床大數(shù)據(jù)分析研究與應(yīng)用[D]. 陳瀲.東華大學(xué) 2016
[2]大數(shù)據(jù)背景下的醫(yī)療保險費用挖掘[D]. 關(guān)成敏.西安電子科技大學(xué) 2014
本文編號:3001518
【文章來源】:燕山大學(xué)河北省
【文章頁數(shù)】:92 頁
【學(xué)位級別】:碩士
【部分圖文】:
技術(shù)路線圖
第2章相關(guān)理論基礎(chǔ)-13-(2)健康評估:健康評估是推動健康管理的專業(yè)技術(shù),它根據(jù)采集的健康信息,確定個體或群體現(xiàn)處于的健康狀態(tài),同時通過數(shù)學(xué)或計算機(jī)等方式構(gòu)建疾病患病風(fēng)險預(yù)測模型,對個人或群體的患病風(fēng)險進(jìn)行預(yù)測。(3)健康分析:在健康評估的基礎(chǔ)上,對預(yù)測結(jié)果進(jìn)行分析,找出可干預(yù)的危險因素,幫助個人全面認(rèn)識自我健康風(fēng)險并制定健康管理計劃。(4)健康干預(yù):健康管理循環(huán)的最終目標(biāo),它是在之前步驟的基礎(chǔ)下,根據(jù)制定的健康管理個性化服務(wù)方案糾正不良生活作息。疾病發(fā)病的危險因素日趨復(fù)雜,要調(diào)節(jié)我國增長的健康需求與短缺的醫(yī)療資源之間的平衡,最高效的方法就是進(jìn)行科學(xué)的健康管理。目前,健康管理的方法如圖2-1所示,方法1表明通過醫(yī)療干預(yù)可以減弱危險因素對健康的影響[47];方法2與方法3表明,通過健康管理可以調(diào)節(jié)危險因素對健康的影響[48];方法4為醫(yī)療干預(yù)對健康管理的反潰通過圖2-1可以發(fā)現(xiàn),健康管理在危險因素與醫(yī)療干預(yù)之間起到調(diào)控與緩沖作用。一方面,通過健康管理達(dá)到疾病預(yù)防或者早發(fā)現(xiàn)、早診斷、早治療,從而減少醫(yī)療資源的需求;另一方面,可以優(yōu)化醫(yī)療資源配置,實現(xiàn)效益最大。圖2-1健康管理與危險因素、醫(yī)療干預(yù)之間的關(guān)系2.2數(shù)據(jù)挖掘及其算法概述2.2.1數(shù)據(jù)挖掘的基本概念1989年在第11屆國際聯(lián)合人工智能學(xué)術(shù)會議中首次提出數(shù)據(jù)挖掘。它是指復(fù)雜
第2章相關(guān)理論基礎(chǔ)-23-的發(fā)生,錯誤率最低。圖2-2隨機(jī)驗證法原理2.3.2一致性檢驗一致性檢驗用于判斷分類器結(jié)果與實際結(jié)果是否具有一致性,不同模型結(jié)果是否具有一致性和不同方法之間是否具有一致性。Kappa系數(shù)是用來評價一致性的指標(biāo)值,用來檢驗分類結(jié)果與實際結(jié)果一樣的計數(shù)與那些僅為偶然結(jié)果的期望是否存在不同。參照表2-1,加權(quán)Kappa系數(shù)等于簡單Kappa系數(shù)。具體公式如下:0eeP-PKappa=1-P(2-26)式中,0TP+TNP=P+N,e2(TP+FN)(TP+FP)+(FP+TN)(FN+TN)P=(P+N),0P為實際一致率,eP為理論一致率。一般認(rèn)為,Kappa>0構(gòu)建的模型才具有實際意義,Kappa值越大,一致性越好。若0<Kappa<0.4,說明一致性差;若0.4<Kappa<0.75,一致性一般;若0.75<Kappa<1,一致性好。Kappa=1,說明結(jié)果完全一致,Kappa=0表示結(jié)果不存在一致性。2.3.3ROC曲線受試者工作特征曲線(ROC曲線),是一種比較模型分類效果坐標(biāo)圖的可視化工具,用來展示靈敏度和特異度之間的相互關(guān)系。1960年開始,ROC分析被應(yīng)用于醫(yī)療領(lǐng)域[51]。ROC曲線以靈敏度為縱坐標(biāo),(1-特異度)為橫坐標(biāo),通過設(shè)定出多個不同的臨界值,得出每個點對應(yīng)的坐標(biāo),并繪制曲線,通過曲線下面積值(AUC值)用
【參考文獻(xiàn)】:
期刊論文
[1]淺談大數(shù)據(jù)在醫(yī)療行業(yè)的應(yīng)用[J]. 曹景禹. 通訊世界. 2019(04)
[2]《中國心血管病報告2018》概要[J]. 胡盛壽,高潤霖,劉力生,朱曼璐,王文,王擁軍,吳兆蘇,李惠君,顧東風(fēng),楊躍進(jìn),鄭哲,陳偉偉. 中國循環(huán)雜志. 2019(03)
[3]基于動態(tài)采樣和遷移學(xué)習(xí)的疾病預(yù)測模型[J]. 胡滿滿,陳旭,孫毓忠,沈曦,王曉青,余天洋,梅御東,肖立,程偉,楊杰,楊焱. 計算機(jī)學(xué)報. 2019(10)
[4]我國腦卒中防治仍面臨巨大挑戰(zhàn)——《中國腦卒中防治報告2018》概要[J]. 王隴德,劉建民,楊弋,彭斌,王伊龍. 中國循環(huán)雜志. 2019(02)
[5]C5.0決策樹與RBF神經(jīng)網(wǎng)絡(luò)模型用于急性缺血性腦卒中出血性轉(zhuǎn)化的風(fēng)險預(yù)測性能比較[J]. 王海東,張璐,王潔,李晶,周瑩,王國立,汪可可,彭延波,武建輝. 中華疾病控制雜志. 2019(02)
[6]大理居民腦卒中患者危險因素的Logistic回歸分析[J]. 徐弘揚(yáng),杜小珊,楊錫彤,馬蓉,王光明. 大理大學(xué)學(xué)報. 2018(08)
[7]進(jìn)展性缺血性腦卒中的相關(guān)因素分析[J]. 徐榮薇. 中國實用神經(jīng)疾病雜志. 2018(11)
[8]醫(yī)療大數(shù)據(jù)在腫瘤疾病中的應(yīng)用研究[J]. 宋波,朱甜甜,于旭,馮云霞,張中. 中國數(shù)字醫(yī)學(xué). 2017(08)
[9]基于灰色關(guān)聯(lián)分析與隨機(jī)森林回歸模型的短期負(fù)荷預(yù)測[J]. 張冰,周步祥,石敏,魏金蕭. 水電能源科學(xué). 2017(04)
[10]臨床醫(yī)療大數(shù)據(jù)研究現(xiàn)狀與展望[J]. 陸易,黃正行,俞思偉,段會龍. 醫(yī)療衛(wèi)生裝備. 2017(03)
博士論文
[1]分類方法在中醫(yī)辨證診斷應(yīng)用中的比較研究[D]. 陳淑慧.廣州中醫(yī)藥大學(xué) 2008
碩士論文
[1]面向糖尿病的臨床大數(shù)據(jù)分析研究與應(yīng)用[D]. 陳瀲.東華大學(xué) 2016
[2]大數(shù)據(jù)背景下的醫(yī)療保險費用挖掘[D]. 關(guān)成敏.西安電子科技大學(xué) 2014
本文編號:3001518
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3001518.html
最近更新
教材專著