面向電子健康檔案不完備混合數(shù)據(jù)的決策模型研究
發(fā)布時間:2021-01-25 02:34
電子健康檔案是人們在從事與醫(yī)療健康相關(guān)的活動時形成的,具有保存?zhèn)洳閮r值的電子化歷史記錄。經(jīng)過十幾年的發(fā)展,我國已在電子健康檔案領(lǐng)域積累了大量的數(shù)據(jù)信息。利用機器學(xué)習(xí)方法從豐富的電子健康檔案數(shù)據(jù)信息中自動發(fā)現(xiàn)潛藏的醫(yī)學(xué)規(guī)律,對于疾病的預(yù)防、控制和治療具有重要作用。然而電子健康檔案的特殊性,即高度不完備性和取值模糊性,限制了傳統(tǒng)機器學(xué)習(xí)方法的應(yīng)用。因此,拓展針對電子健康檔案特點的機器學(xué)習(xí)方法,并將其應(yīng)用于電子健康檔案的決策模型已經(jīng)是十分必要的。本論文首先提出了一種新的基于面積的模糊變量間距離的度量方法。該方法與最大-最小貼近度距離度量保持一致,但其計算更加簡單。隨后在這種度量方法的基礎(chǔ)上,將k-NN填補算法的應(yīng)用范圍由清晰型數(shù)據(jù)拓展至模糊型數(shù)據(jù),以至清晰模糊混合數(shù)據(jù)。具體來說就是,采用新提出的模糊變量間距離度量方法來尋找含有缺失值信息的模糊型樣例、以及清晰模糊混合樣例的“近鄰”,之后再利用k個“近鄰”的信息對其進行填補。然后將模糊變量簡約的概念引入模糊型數(shù)據(jù)決策模型研究,建立了針對模糊型數(shù)據(jù)的極速學(xué)習(xí)機決策模型。該模型首先利用幾個不同的模糊變量簡約值,將模糊型數(shù)據(jù)集轉(zhuǎn)化為多個清晰型數(shù)據(jù)集,...
【文章來源】:河北大學(xué)河北省
【文章頁數(shù)】:139 頁
【學(xué)位級別】:博士
【部分圖文】:
論文研究的技術(shù)路線圖
圖 2-1 三角型模糊變量的可能性分布 圖 2-2 梯形模糊變量的可能性分布模糊變量相似性度量方法文以 k-NN 填補算法為基礎(chǔ),擴展其適用范圍到模糊的情形,因需尋息樣例的 k 個最“相似”樣例,故要用到模糊變量間的相似性度量。糊變量之間相似度的工具有貼近度和距離,其中貼近度表示的是兩個度,而距離表示兩個模糊變量之間的區(qū)別程度。它們表示同一事物的兩,但一般而言,兩者之和為 1。下面介紹幾種常見的模糊變量貼近度和最大-最小貼近度[136] , 為兩個取離散值 1 2, , ,nx x x的模糊變量,其可能性分布分別為則 , 之間的最大-最小貼近度為: 1( ) ( ), .ni iix xN
圖 2-1 三角型模糊變量的可能性分布 圖 2-2 梯形模糊變量的可能性分布模糊變量相似性度量方法文以 k-NN 填補算法為基礎(chǔ),擴展其適用范圍到模糊的情形,因需尋息樣例的 k 個最“相似”樣例,故要用到模糊變量間的相似性度量。糊變量之間相似度的工具有貼近度和距離,其中貼近度表示的是兩個度,而距離表示兩個模糊變量之間的區(qū)別程度。它們表示同一事物的兩,但一般而言,兩者之和為 1。下面介紹幾種常見的模糊變量貼近度和最大-最小貼近度[136] , 為兩個取離散值 1 2, , ,nx x x的模糊變量,其可能性分布分別為則 , 之間的最大-最小貼近度為: 1( ) ( ), .ni iix xN
【參考文獻】:
期刊論文
[1]數(shù)據(jù)缺失及其處理方法綜述[J]. 曄沙. 電子測試. 2017(18)
[2]電子健康檔案數(shù)據(jù)挖掘與整合技術(shù)新進展[J]. 張宇,李姣. 中國數(shù)字醫(yī)學(xué). 2017(09)
[3]一種基于極限學(xué)習(xí)機的缺失數(shù)據(jù)填充方法[J]. 楊毅,盧誠波. 計算機應(yīng)用與軟件. 2016(10)
[4]基于大數(shù)據(jù)的精準(zhǔn)醫(yī)療服務(wù)體系研究[J]. 范美玉,陳敏. 中國醫(yī)院管理. 2016(01)
[5]綠色數(shù)據(jù)中心不完備能耗大數(shù)據(jù)填補及分類算法研究[J]. 袁景凌,鐘珞,楊光,陳旻騁,顧駿程,李濤. 計算機學(xué)報. 2015(12)
[6]不完整大數(shù)據(jù)的分布式聚類填充算法[J]. 冷泳林,陳志奎,張清辰,魯富宇. 計算機工程. 2015(05)
[7]海產(chǎn)品安全預(yù)警系統(tǒng)缺失數(shù)據(jù)填補方法[J]. 鄂旭,林爽,金璐璐. 計算機工程與應(yīng)用. 2015(11)
[8]醫(yī)療健康大數(shù)據(jù)研究綜述[J]. 顏延,秦興彬,樊建平,王磊. 科研信息化技術(shù)與應(yīng)用. 2014(06)
[9]基于Map-Reduce的大數(shù)據(jù)缺失值填充算法[J]. 金連,王宏志,黃沈濱,高宏. 計算機研究與發(fā)展. 2013(S1)
[10]葆宮止血顆粒促進產(chǎn)后子宮復(fù)舊的臨床療效觀察[J]. 李霞,張利宏,黃俊霞,李真. 重慶醫(yī)學(xué). 2013(03)
博士論文
[1]幾類模糊多屬性決策方法及其應(yīng)用研究[D]. 張惠民.上海大學(xué) 2013
[2]混合數(shù)據(jù)知識發(fā)現(xiàn)的粗糙計算模型和算法[D]. 胡清華.哈爾濱工業(yè)大學(xué) 2008
[3]論現(xiàn)代成本管理模式[D]. 石新武.中國社會科學(xué)院研究生院 2001
碩士論文
[1]面向轉(zhuǎn)化醫(yī)學(xué)的EHR數(shù)據(jù)接口與糖尿病數(shù)據(jù)挖掘研究[D]. 朱寒陽.浙江大學(xué) 2015
[2]海量醫(yī)療數(shù)據(jù)挖掘平臺的研究與設(shè)計[D]. 閆茜.武漢理工大學(xué) 2014
[3]電子健康檔案中糖尿病相關(guān)因素的數(shù)據(jù)挖掘研究[D]. 覃艷.電子科技大學(xué) 2013
[4]基于電子檔案的決策支持系統(tǒng)設(shè)計與實現(xiàn)[D]. 靖偉峰.華中科技大學(xué) 2008
[5]多元線性回歸模型中缺失數(shù)據(jù)填補方法的效果比較[D]. 袁中萸.中南大學(xué) 2008
本文編號:2998388
【文章來源】:河北大學(xué)河北省
【文章頁數(shù)】:139 頁
【學(xué)位級別】:博士
【部分圖文】:
論文研究的技術(shù)路線圖
圖 2-1 三角型模糊變量的可能性分布 圖 2-2 梯形模糊變量的可能性分布模糊變量相似性度量方法文以 k-NN 填補算法為基礎(chǔ),擴展其適用范圍到模糊的情形,因需尋息樣例的 k 個最“相似”樣例,故要用到模糊變量間的相似性度量。糊變量之間相似度的工具有貼近度和距離,其中貼近度表示的是兩個度,而距離表示兩個模糊變量之間的區(qū)別程度。它們表示同一事物的兩,但一般而言,兩者之和為 1。下面介紹幾種常見的模糊變量貼近度和最大-最小貼近度[136] , 為兩個取離散值 1 2, , ,nx x x的模糊變量,其可能性分布分別為則 , 之間的最大-最小貼近度為: 1( ) ( ), .ni iix xN
圖 2-1 三角型模糊變量的可能性分布 圖 2-2 梯形模糊變量的可能性分布模糊變量相似性度量方法文以 k-NN 填補算法為基礎(chǔ),擴展其適用范圍到模糊的情形,因需尋息樣例的 k 個最“相似”樣例,故要用到模糊變量間的相似性度量。糊變量之間相似度的工具有貼近度和距離,其中貼近度表示的是兩個度,而距離表示兩個模糊變量之間的區(qū)別程度。它們表示同一事物的兩,但一般而言,兩者之和為 1。下面介紹幾種常見的模糊變量貼近度和最大-最小貼近度[136] , 為兩個取離散值 1 2, , ,nx x x的模糊變量,其可能性分布分別為則 , 之間的最大-最小貼近度為: 1( ) ( ), .ni iix xN
【參考文獻】:
期刊論文
[1]數(shù)據(jù)缺失及其處理方法綜述[J]. 曄沙. 電子測試. 2017(18)
[2]電子健康檔案數(shù)據(jù)挖掘與整合技術(shù)新進展[J]. 張宇,李姣. 中國數(shù)字醫(yī)學(xué). 2017(09)
[3]一種基于極限學(xué)習(xí)機的缺失數(shù)據(jù)填充方法[J]. 楊毅,盧誠波. 計算機應(yīng)用與軟件. 2016(10)
[4]基于大數(shù)據(jù)的精準(zhǔn)醫(yī)療服務(wù)體系研究[J]. 范美玉,陳敏. 中國醫(yī)院管理. 2016(01)
[5]綠色數(shù)據(jù)中心不完備能耗大數(shù)據(jù)填補及分類算法研究[J]. 袁景凌,鐘珞,楊光,陳旻騁,顧駿程,李濤. 計算機學(xué)報. 2015(12)
[6]不完整大數(shù)據(jù)的分布式聚類填充算法[J]. 冷泳林,陳志奎,張清辰,魯富宇. 計算機工程. 2015(05)
[7]海產(chǎn)品安全預(yù)警系統(tǒng)缺失數(shù)據(jù)填補方法[J]. 鄂旭,林爽,金璐璐. 計算機工程與應(yīng)用. 2015(11)
[8]醫(yī)療健康大數(shù)據(jù)研究綜述[J]. 顏延,秦興彬,樊建平,王磊. 科研信息化技術(shù)與應(yīng)用. 2014(06)
[9]基于Map-Reduce的大數(shù)據(jù)缺失值填充算法[J]. 金連,王宏志,黃沈濱,高宏. 計算機研究與發(fā)展. 2013(S1)
[10]葆宮止血顆粒促進產(chǎn)后子宮復(fù)舊的臨床療效觀察[J]. 李霞,張利宏,黃俊霞,李真. 重慶醫(yī)學(xué). 2013(03)
博士論文
[1]幾類模糊多屬性決策方法及其應(yīng)用研究[D]. 張惠民.上海大學(xué) 2013
[2]混合數(shù)據(jù)知識發(fā)現(xiàn)的粗糙計算模型和算法[D]. 胡清華.哈爾濱工業(yè)大學(xué) 2008
[3]論現(xiàn)代成本管理模式[D]. 石新武.中國社會科學(xué)院研究生院 2001
碩士論文
[1]面向轉(zhuǎn)化醫(yī)學(xué)的EHR數(shù)據(jù)接口與糖尿病數(shù)據(jù)挖掘研究[D]. 朱寒陽.浙江大學(xué) 2015
[2]海量醫(yī)療數(shù)據(jù)挖掘平臺的研究與設(shè)計[D]. 閆茜.武漢理工大學(xué) 2014
[3]電子健康檔案中糖尿病相關(guān)因素的數(shù)據(jù)挖掘研究[D]. 覃艷.電子科技大學(xué) 2013
[4]基于電子檔案的決策支持系統(tǒng)設(shè)計與實現(xiàn)[D]. 靖偉峰.華中科技大學(xué) 2008
[5]多元線性回歸模型中缺失數(shù)據(jù)填補方法的效果比較[D]. 袁中萸.中南大學(xué) 2008
本文編號:2998388
本文鏈接:http://www.sikaile.net/yixuelunwen/yiyuanguanlilunwen/2998388.html
最近更新
教材專著