天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于模糊決策樹的醫(yī)學(xué)數(shù)據(jù)分類研究

發(fā)布時(shí)間:2020-11-04 17:49
   隨著信息技術(shù)的快速發(fā)展,醫(yī)院信息系統(tǒng)和醫(yī)療數(shù)字化設(shè)備的廣泛應(yīng)用,醫(yī)學(xué)數(shù)據(jù)庫(kù)中有關(guān)病人的案例、檢驗(yàn)、診斷和治療的信息大量積累,人們對(duì)于發(fā)掘醫(yī)學(xué)數(shù)據(jù)中所蘊(yùn)含知識(shí)的需求日益迫切。借助數(shù)據(jù)挖掘技術(shù)對(duì)這些寶貴的醫(yī)學(xué)數(shù)據(jù)資源進(jìn)行分析和處理發(fā)現(xiàn)有價(jià)值的信息,從而可以為疾病的診斷和治療提供科學(xué)的決策。模糊決策樹將模糊理論與決策樹算法相結(jié)合,可以對(duì)醫(yī)學(xué)數(shù)據(jù)中存在的模糊性和不確定性進(jìn)行處理,增強(qiáng)決策樹算法的適用性,實(shí)現(xiàn)更加準(zhǔn)確有效的醫(yī)學(xué)數(shù)據(jù)分類。本文主要開展了以下工作:(1)對(duì)模糊決策樹的兩種算法——模糊ID3算法和最小分類不確定性算法進(jìn)行研究,在模糊數(shù)據(jù)集上完成模糊決策樹的構(gòu)建和規(guī)則提取,并利用模糊規(guī)則對(duì)新實(shí)例進(jìn)行分類預(yù)測(cè)?偨Y(jié)清晰決策樹與模糊決策樹的區(qū)別。(2)對(duì)于醫(yī)學(xué)數(shù)據(jù)集中的連續(xù)值屬性,使用Kohonen特征映射算法和三角隸屬度函數(shù)完成數(shù)據(jù)的模糊化處理,實(shí)現(xiàn)連續(xù)值屬性的平滑劃分,更自然合理地描述數(shù)據(jù)集屬性的特征。(3)通過(guò)MATLAB實(shí)現(xiàn)模糊ID3算法和最小分類不確定性算法,并結(jié)合已有的C4.5和CART算法,在公開可用醫(yī)學(xué)數(shù)據(jù)集上構(gòu)建相應(yīng)的分類模型。比較四種決策樹算法生成模型的分類準(zhǔn)確率以及規(guī)則數(shù)量的不同。模糊ID3算法在四組醫(yī)學(xué)數(shù)據(jù)集上都獲得了較高的分類準(zhǔn)確率,且生成的規(guī)則數(shù)量適中,體現(xiàn)出模糊決策樹算法在處理醫(yī)學(xué)數(shù)據(jù)連續(xù)值屬性上的優(yōu)勢(shì)且能對(duì)數(shù)據(jù)中存在的模糊性進(jìn)行處理。(4)針對(duì)模糊決策樹算法中的關(guān)鍵參數(shù)通常是依據(jù)經(jīng)驗(yàn)設(shè)定的問(wèn)題,本文提出使用改進(jìn)粒子群算法對(duì)參數(shù)組合進(jìn)行智能尋優(yōu)從而改善模糊決策樹性能。適應(yīng)度函數(shù)綜合考慮訓(xùn)練準(zhǔn)確率、測(cè)試準(zhǔn)確率、概括能力以及生成樹的規(guī)模。使用優(yōu)化的模糊決策樹算法在公開可用醫(yī)學(xué)數(shù)據(jù)集上構(gòu)建分類模型,證明應(yīng)用該方法進(jìn)行醫(yī)學(xué)數(shù)據(jù)分類的必要性與有效性。該方法既能夠產(chǎn)生較為準(zhǔn)確的預(yù)測(cè)結(jié)果,還能夠以決策樹的形式提供預(yù)測(cè)的理由。
【學(xué)位單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:R-05
【部分圖文】:

思路,決策樹,模糊決策樹,醫(yī)學(xué)數(shù)據(jù)


并在分類準(zhǔn)確率方面與其他文獻(xiàn)中提出的分類方法進(jìn)行比較,說(shuō)明本文方法的??可行性和有效性??本文的研究思路如圖1-2所示。??I基于模糊決策樹的醫(yī)學(xué)數(shù)據(jù)分類研宄1?/......…………-,?,??、?J?研究問(wèn)題、??'…—.............^???——乂??m?t、?〈〔相關(guān)理論?>??改進(jìn)的^?^模糊??L子群算法?理論J??IT??f?^?N??模糊決策樹研究與兩種算法實(shí)現(xiàn)???\???^?v>??模糊決策樹在醫(yī)學(xué)數(shù)據(jù)?^??分類中的應(yīng)用效果??f ̄ ̄ ̄ ̄* ̄:?*\??結(jié)合&進(jìn)的粒子群算^?.??提出基于模糊決策樹的混合模型|?y.-,,,,,,方法優(yōu)化>???\?[???實(shí)現(xiàn)改進(jìn)粒子群算法??與模糊決策樹的集成???zzzzzzzzzr??f混合模型在醫(yī)¥數(shù)據(jù)分類中的效果評(píng)估^>??V?應(yīng)用‘%果驗(yàn)證?)?\?1、.雙采1■卜1f

醫(yī)學(xué)數(shù)據(jù),分類過(guò)程


醫(yī)學(xué)非圖像數(shù)據(jù)進(jìn)行研宄,通過(guò)數(shù)據(jù)分類技術(shù)發(fā)現(xiàn)醫(yī)學(xué)數(shù)據(jù)中相關(guān)疾病指標(biāo)與患??病情況之間對(duì)應(yīng)的知識(shí),從而為醫(yī)療診斷提供支持。??醫(yī)學(xué)數(shù)據(jù)分類的一般過(guò)程如圖2-1所示:首先對(duì)醫(yī)學(xué)數(shù)據(jù)進(jìn)行預(yù)處理,通過(guò)數(shù)??據(jù)降維提取關(guān)鍵特征,再按照一定的比例將處理好的醫(yī)學(xué)數(shù)據(jù)集分為兩部分:訓(xùn)練??數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。接下來(lái)分類器對(duì)訓(xùn)練數(shù)據(jù)集的己知類別信息進(jìn)行學(xué)習(xí),學(xué)習(xí)??不同類別標(biāo)記數(shù)據(jù)的不同特征和分類依據(jù)的模式。學(xué)習(xí)完成后,使用訓(xùn)練好的分類??器對(duì)測(cè)試數(shù)據(jù)集中的醫(yī)學(xué)數(shù)據(jù)進(jìn)行分類,從而可以得到分類準(zhǔn)確率等指標(biāo),通過(guò)指??標(biāo)對(duì)分類方法進(jìn)行評(píng)估。??p?訓(xùn)練數(shù)據(jù)集一?訓(xùn)練分類模型?<—類標(biāo)簽信息??醫(yī)學(xué)數(shù)據(jù)集-?數(shù)據(jù)預(yù)處理數(shù)據(jù)降維——?????????????????-?測(cè)試數(shù)據(jù)集一?測(cè)試分類模型??圖2-1醫(yī)學(xué)數(shù)據(jù)分類過(guò)程??Fig.?2-1?Flowchart?of?medical?data?classification??11??

決策樹歸納,剪枝技術(shù),過(guò)度擬合,復(fù)雜結(jié)構(gòu)


它通常會(huì)被分成兩部分,一部分用來(lái)進(jìn)行決策樹的構(gòu)建,稱為訓(xùn)練數(shù)據(jù)集,??另一部分用來(lái)驗(yàn)證構(gòu)建的決策樹的性能,稱為測(cè)試數(shù)據(jù)集。決策樹歸納沒(méi)有參數(shù)假??設(shè),它通過(guò)逐漸選擇分割屬性來(lái)進(jìn)行樹的擴(kuò)展完成決策樹的構(gòu)建,流程如圖2-2所??示。在構(gòu)建過(guò)程中有兩個(gè)關(guān)鍵問(wèn)題,一個(gè)是分割屬性選擇的標(biāo)準(zhǔn),即選擇哪個(gè)屬性??去劃分樣例集,常用的屬性選擇標(biāo)準(zhǔn)有信息增益[35]、信息增益率[37]、Gini指數(shù)[38]??等;另一個(gè)是確定生成葉結(jié)點(diǎn)的條件,通常采用一定的算法對(duì)樹進(jìn)行剪枝。??現(xiàn)實(shí)世界的數(shù)據(jù)一般不可能是完美的,可能會(huì)有數(shù)據(jù)不準(zhǔn)確、含有噪聲或訓(xùn)練??樣本過(guò)少等情況。此時(shí)在基本的決策樹構(gòu)造過(guò)程中,有可能會(huì)出現(xiàn)過(guò)度擬合的問(wèn)題,??即分類模型可以與訓(xùn)練數(shù)據(jù)較好的擬合但對(duì)測(cè)試數(shù)據(jù)的分類預(yù)測(cè)性能較低。??另外,如果不對(duì)決策樹的規(guī)模進(jìn)行控制,而生成的決策樹復(fù)雜程度又很高時(shí),??模型的可讀性就差,不容易被理解和接受。同時(shí)考慮到存儲(chǔ)決策樹所消耗的成本,??決策樹的規(guī)模也是越小越好。因此
【參考文獻(xiàn)】

相關(guān)期刊論文 前3條

1 祝曉燕;張金會(huì);付士鵬;朱霄珣;;基于改進(jìn)PSO的SVM參數(shù)優(yōu)化及其在風(fēng)速預(yù)測(cè)中的應(yīng)用[J];中國(guó)電力;2013年11期

2 孫娟;王熙照;;規(guī)則簡(jiǎn)化與模糊決策樹剪枝的比較[J];計(jì)算機(jī)工程;2006年12期

3 王熙照;謝凱;;基于聚類的數(shù)據(jù)預(yù)處理對(duì)模糊決策樹產(chǎn)生的影響[J];計(jì)算機(jī)工程與應(yīng)用;2006年01期


相關(guān)博士學(xué)位論文 前2條

1 馮興華;基于公理模糊集的模糊決策樹算法研究[D];大連理工大學(xué);2013年

2 郭晉;神經(jīng)網(wǎng)絡(luò)模型在預(yù)測(cè)急性心肌梗死中的應(yīng)用及模型預(yù)測(cè)能力的比較研究[D];北京協(xié)和醫(yī)學(xué)院;2013年


相關(guān)碩士學(xué)位論文 前10條

1 魏存超;基于卷積神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像分類的研究[D];哈爾濱工業(yè)大學(xué);2017年

2 胡凌;支持向量機(jī)在糖尿病數(shù)據(jù)中的應(yīng)用研究[D];北京郵電大學(xué);2017年

3 翁勇強(qiáng);支持向量機(jī)在醫(yī)學(xué)數(shù)據(jù)中的應(yīng)用研究[D];北京郵電大學(xué);2017年

4 鄔楊;基于機(jī)器學(xué)習(xí)的卵巢腫瘤預(yù)測(cè)與分析研究[D];吉林大學(xué);2016年

5 田曉春;SVM在醫(yī)學(xué)數(shù)據(jù)分類中的建模研究[D];太原理工大學(xué);2015年

6 高麗君;面向缺失數(shù)據(jù)的變精度粗糙集決策樹分類算法研究[D];大連海事大學(xué);2013年

7 黃雯;數(shù)據(jù)挖掘算法及其應(yīng)用研究[D];南京郵電大學(xué);2013年

8 黎鑫;關(guān)于生物醫(yī)學(xué)數(shù)據(jù)的聚類與分類算法研究及應(yīng)用[D];武漢科技大學(xué);2012年

9 林玲玲;基于C4.5算法的高血壓分類規(guī)則提取的研究[D];太原理工大學(xué);2012年

10 張?jiān)?支持向量機(jī)在醫(yī)學(xué)數(shù)據(jù)分析中的應(yīng)用[D];大連理工大學(xué);2008年



本文編號(hào):2870409

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/yixuelunwen/yiyuanguanlilunwen/2870409.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4206a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com