基于模糊決策樹的醫(yī)學(xué)數(shù)據(jù)分類研究
【學(xué)位單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:R-05
【部分圖文】:
并在分類準(zhǔn)確率方面與其他文獻(xiàn)中提出的分類方法進(jìn)行比較,說(shuō)明本文方法的??可行性和有效性??本文的研究思路如圖1-2所示。??I基于模糊決策樹的醫(yī)學(xué)數(shù)據(jù)分類研宄1?/......…………-,?,??、?J?研究問(wèn)題、??'…—.............^???——乂??m?t、?〈〔相關(guān)理論?>??改進(jìn)的^?^模糊??L子群算法?理論J??IT??f?^?N??模糊決策樹研究與兩種算法實(shí)現(xiàn)???\???^?v>??模糊決策樹在醫(yī)學(xué)數(shù)據(jù)?^??分類中的應(yīng)用效果??f ̄ ̄ ̄ ̄* ̄:?*\??結(jié)合&進(jìn)的粒子群算^?.??提出基于模糊決策樹的混合模型|?y.-,,,,,,方法優(yōu)化>???\?[???實(shí)現(xiàn)改進(jìn)粒子群算法??與模糊決策樹的集成???zzzzzzzzzr??f混合模型在醫(yī)¥數(shù)據(jù)分類中的效果評(píng)估^>??V?應(yīng)用‘%果驗(yàn)證?)?\?1、.雙采1■卜1f
醫(yī)學(xué)非圖像數(shù)據(jù)進(jìn)行研宄,通過(guò)數(shù)據(jù)分類技術(shù)發(fā)現(xiàn)醫(yī)學(xué)數(shù)據(jù)中相關(guān)疾病指標(biāo)與患??病情況之間對(duì)應(yīng)的知識(shí),從而為醫(yī)療診斷提供支持。??醫(yī)學(xué)數(shù)據(jù)分類的一般過(guò)程如圖2-1所示:首先對(duì)醫(yī)學(xué)數(shù)據(jù)進(jìn)行預(yù)處理,通過(guò)數(shù)??據(jù)降維提取關(guān)鍵特征,再按照一定的比例將處理好的醫(yī)學(xué)數(shù)據(jù)集分為兩部分:訓(xùn)練??數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。接下來(lái)分類器對(duì)訓(xùn)練數(shù)據(jù)集的己知類別信息進(jìn)行學(xué)習(xí),學(xué)習(xí)??不同類別標(biāo)記數(shù)據(jù)的不同特征和分類依據(jù)的模式。學(xué)習(xí)完成后,使用訓(xùn)練好的分類??器對(duì)測(cè)試數(shù)據(jù)集中的醫(yī)學(xué)數(shù)據(jù)進(jìn)行分類,從而可以得到分類準(zhǔn)確率等指標(biāo),通過(guò)指??標(biāo)對(duì)分類方法進(jìn)行評(píng)估。??p?訓(xùn)練數(shù)據(jù)集一?訓(xùn)練分類模型?<—類標(biāo)簽信息??醫(yī)學(xué)數(shù)據(jù)集-?數(shù)據(jù)預(yù)處理數(shù)據(jù)降維——?????????????????-?測(cè)試數(shù)據(jù)集一?測(cè)試分類模型??圖2-1醫(yī)學(xué)數(shù)據(jù)分類過(guò)程??Fig.?2-1?Flowchart?of?medical?data?classification??11??
它通常會(huì)被分成兩部分,一部分用來(lái)進(jìn)行決策樹的構(gòu)建,稱為訓(xùn)練數(shù)據(jù)集,??另一部分用來(lái)驗(yàn)證構(gòu)建的決策樹的性能,稱為測(cè)試數(shù)據(jù)集。決策樹歸納沒(méi)有參數(shù)假??設(shè),它通過(guò)逐漸選擇分割屬性來(lái)進(jìn)行樹的擴(kuò)展完成決策樹的構(gòu)建,流程如圖2-2所??示。在構(gòu)建過(guò)程中有兩個(gè)關(guān)鍵問(wèn)題,一個(gè)是分割屬性選擇的標(biāo)準(zhǔn),即選擇哪個(gè)屬性??去劃分樣例集,常用的屬性選擇標(biāo)準(zhǔn)有信息增益[35]、信息增益率[37]、Gini指數(shù)[38]??等;另一個(gè)是確定生成葉結(jié)點(diǎn)的條件,通常采用一定的算法對(duì)樹進(jìn)行剪枝。??現(xiàn)實(shí)世界的數(shù)據(jù)一般不可能是完美的,可能會(huì)有數(shù)據(jù)不準(zhǔn)確、含有噪聲或訓(xùn)練??樣本過(guò)少等情況。此時(shí)在基本的決策樹構(gòu)造過(guò)程中,有可能會(huì)出現(xiàn)過(guò)度擬合的問(wèn)題,??即分類模型可以與訓(xùn)練數(shù)據(jù)較好的擬合但對(duì)測(cè)試數(shù)據(jù)的分類預(yù)測(cè)性能較低。??另外,如果不對(duì)決策樹的規(guī)模進(jìn)行控制,而生成的決策樹復(fù)雜程度又很高時(shí),??模型的可讀性就差,不容易被理解和接受。同時(shí)考慮到存儲(chǔ)決策樹所消耗的成本,??決策樹的規(guī)模也是越小越好。因此
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 祝曉燕;張金會(huì);付士鵬;朱霄珣;;基于改進(jìn)PSO的SVM參數(shù)優(yōu)化及其在風(fēng)速預(yù)測(cè)中的應(yīng)用[J];中國(guó)電力;2013年11期
2 孫娟;王熙照;;規(guī)則簡(jiǎn)化與模糊決策樹剪枝的比較[J];計(jì)算機(jī)工程;2006年12期
3 王熙照;謝凱;;基于聚類的數(shù)據(jù)預(yù)處理對(duì)模糊決策樹產(chǎn)生的影響[J];計(jì)算機(jī)工程與應(yīng)用;2006年01期
相關(guān)博士學(xué)位論文 前2條
1 馮興華;基于公理模糊集的模糊決策樹算法研究[D];大連理工大學(xué);2013年
2 郭晉;神經(jīng)網(wǎng)絡(luò)模型在預(yù)測(cè)急性心肌梗死中的應(yīng)用及模型預(yù)測(cè)能力的比較研究[D];北京協(xié)和醫(yī)學(xué)院;2013年
相關(guān)碩士學(xué)位論文 前10條
1 魏存超;基于卷積神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像分類的研究[D];哈爾濱工業(yè)大學(xué);2017年
2 胡凌;支持向量機(jī)在糖尿病數(shù)據(jù)中的應(yīng)用研究[D];北京郵電大學(xué);2017年
3 翁勇強(qiáng);支持向量機(jī)在醫(yī)學(xué)數(shù)據(jù)中的應(yīng)用研究[D];北京郵電大學(xué);2017年
4 鄔楊;基于機(jī)器學(xué)習(xí)的卵巢腫瘤預(yù)測(cè)與分析研究[D];吉林大學(xué);2016年
5 田曉春;SVM在醫(yī)學(xué)數(shù)據(jù)分類中的建模研究[D];太原理工大學(xué);2015年
6 高麗君;面向缺失數(shù)據(jù)的變精度粗糙集決策樹分類算法研究[D];大連海事大學(xué);2013年
7 黃雯;數(shù)據(jù)挖掘算法及其應(yīng)用研究[D];南京郵電大學(xué);2013年
8 黎鑫;關(guān)于生物醫(yī)學(xué)數(shù)據(jù)的聚類與分類算法研究及應(yīng)用[D];武漢科技大學(xué);2012年
9 林玲玲;基于C4.5算法的高血壓分類規(guī)則提取的研究[D];太原理工大學(xué);2012年
10 張?jiān)?支持向量機(jī)在醫(yī)學(xué)數(shù)據(jù)分析中的應(yīng)用[D];大連理工大學(xué);2008年
本文編號(hào):2870409
本文鏈接:http://www.sikaile.net/yixuelunwen/yiyuanguanlilunwen/2870409.html