【摘要】:研究目的在糖尿病腎病的計(jì)算機(jī)輔助辨證研究背景下,基于復(fù)雜網(wǎng)絡(luò)理論解決以下建模工作中存在的實(shí)際問題:1.提出并分析糖尿病腎病數(shù)據(jù)的多標(biāo)簽屬性特點(diǎn),探索糖尿病腎病多標(biāo)簽數(shù)據(jù)的處理方法,解決以往單純采用單標(biāo)簽學(xué)習(xí)所導(dǎo)致的證型分類結(jié)果偏離實(shí)際的問題。2.建立適合糖尿病腎病的多標(biāo)簽數(shù)據(jù)特征選擇方法,解決建模過程中數(shù)據(jù)維度高而稀疏、缺乏典型特征組合對模型性能造成嚴(yán)重影響的問題。3.建立糖尿病腎病的多標(biāo)簽辨證模型,完善糖尿病腎病的多證型及兼夾證型的診斷問題。研究方法1.針對糖尿病腎病數(shù)據(jù)的多標(biāo)簽屬性,在廣泛文獻(xiàn)調(diào)研的基礎(chǔ)上,利用復(fù)雜網(wǎng)絡(luò)理論構(gòu)建糖尿病腎病辨證網(wǎng)(DNBZN),對糖尿病腎病多標(biāo)簽數(shù)據(jù)進(jìn)行合理、有效的表征。2.針對中醫(yī)藥數(shù)據(jù)維度高而稀疏的特點(diǎn),首先提出一種新的特征選擇方法對糖尿病腎病數(shù)據(jù)進(jìn)行預(yù)處理。該特征選擇方法建立在復(fù)雜網(wǎng)絡(luò)廣義社會合作網(wǎng)的理論基礎(chǔ)上,利用重疊社區(qū)發(fā)現(xiàn)Bitector算法對網(wǎng)絡(luò)進(jìn)行重疊社區(qū)發(fā)現(xiàn),進(jìn)而選擇出對證型分類代表性強(qiáng)且區(qū)分度高的典型特征組合。然后在網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)結(jié)果的研究基礎(chǔ)上,建立糖尿病腎病多標(biāo)簽特征數(shù)據(jù)集,并將數(shù)據(jù)集結(jié)構(gòu)化處理,為下一步多標(biāo)簽分類模型研究提供數(shù)據(jù)基礎(chǔ)。3.針對糖尿病腎病的多證型分類問題,探索和使用多種建模策略,利用SVM、 AdaBoost、ANN和KNN最近鄰等多種機(jī)器學(xué)習(xí)方法進(jìn)行建模,并嘗試使用多種不同的基礎(chǔ)分類器組合形成不同的多標(biāo)簽分類器,依據(jù)訓(xùn)練結(jié)果學(xué)習(xí)和調(diào)整模型參數(shù),尋找適合糖尿病腎病的多證型辨證模型。4.針對辨證模型的分類性能評估問題,調(diào)用Hamming Loss、Ranking Loss、One-error、 Coverage、Average Precision等5種公認(rèn)的多標(biāo)簽學(xué)習(xí)評價(jià)指標(biāo)對每種多標(biāo)簽辨證模型的性能進(jìn)行綜合評價(jià)。研究結(jié)果1.經(jīng)過文獻(xiàn)調(diào)研,共收集來自256篇文獻(xiàn)中的113個(gè)癥狀(特征)和15個(gè)證型(標(biāo)簽),每個(gè)癥狀至少屬于1個(gè)證型,至多屬于6個(gè)證型。建立的DNBZN具有113個(gè)癥狀節(jié)點(diǎn)和15個(gè)證型節(jié)點(diǎn),邊代表癥狀節(jié)點(diǎn)對相應(yīng)證型節(jié)點(diǎn)的特異度,邊權(quán)由基尼指數(shù)量化表示。使用二分網(wǎng)絡(luò)Bitector算法對DNBZN進(jìn)行重疊社區(qū)發(fā)現(xiàn)后,發(fā)現(xiàn)了肝腎陰虛、氣陰兩虛的重疊社區(qū)和脾腎氣虛、脾腎陽虛、陰陽兩虛重疊社區(qū),以及其余10個(gè)非重疊社區(qū)。每個(gè)社區(qū)內(nèi)部的節(jié)點(diǎn)是對該證型標(biāo)簽區(qū)分度高及代表性強(qiáng)的特征組合,其余未進(jìn)入該社區(qū)的節(jié)點(diǎn)被視為該證型的冗余或不相關(guān)特征刪除,有效降低了特征維數(shù)。結(jié)合中醫(yī)理論對特征選擇結(jié)果進(jìn)行驗(yàn)證,結(jié)果表明基于重疊社區(qū)發(fā)現(xiàn)的特征選擇方法選擇出的癥狀特征合理有效,符合中醫(yī)理論和臨床實(shí)際。2.依據(jù)文獻(xiàn)調(diào)研和網(wǎng)絡(luò)構(gòu)建結(jié)果,建立了一個(gè)擁有113個(gè)特征和15個(gè)類別標(biāo)簽的糖尿病腎病多標(biāo)簽特征數(shù)據(jù)集。在數(shù)據(jù)集中構(gòu)建特征及特征組合與證型標(biāo)簽之間的映射關(guān)系。單個(gè)癥狀與其所歸屬的證型標(biāo)簽之間的映射關(guān)系為189條,在此基礎(chǔ)上結(jié)合社區(qū)發(fā)現(xiàn)結(jié)果,擴(kuò)展特征組合與證型標(biāo)簽之間的映射關(guān)系。最后建立的特征數(shù)據(jù)集中共擁有1759條映射關(guān)系,作為后續(xù)多標(biāo)簽辨證建模工作的數(shù)據(jù)來源。3.在“轉(zhuǎn)化問題”和“算法適應(yīng)”兩種多標(biāo)簽學(xué)習(xí)的建模策略下完成建模工作。在“轉(zhuǎn)化問題”策略下使用SVM和AdaBoost建立多個(gè)二分類基礎(chǔ)分類器對糖尿病腎病特征數(shù)據(jù)集進(jìn)行多標(biāo)簽分類建模;并分別選擇線性核函數(shù)、二次方程核函數(shù)、多項(xiàng)式核函數(shù)、徑向基核函數(shù)和多層感知核函數(shù)等5種核函數(shù)作為支持向量機(jī)的核函數(shù)進(jìn)行建模,評估模型的分類效果,發(fā)現(xiàn)模型對每個(gè)證型二分類準(zhǔn)確率達(dá)到97%以上;分別使用Real AdaBoost, Gentle AdaBoost和Modest AdaBoost算法作為AdaBoost的基礎(chǔ)二分類分類器進(jìn)行多標(biāo)簽建模,發(fā)現(xiàn)模型對每個(gè)證型的二分類準(zhǔn)確率接近98%。在“算法適應(yīng)”策略下,使用ANN和KNN直接在特征數(shù)據(jù)集上進(jìn)行多標(biāo)簽分類,優(yōu)化參數(shù)后,ANN模型整體分類準(zhǔn)確率達(dá)到96.2%;KNN模型整體分類準(zhǔn)確率達(dá)到94.67%。4.使用10折交叉驗(yàn)證方法,計(jì)算Hamming Loss、Ranking Loss、One-error、Coverage、 Average Precision等5個(gè)指標(biāo)的平均值,對SVM、Adaboost、ANN和KNN模型的性能進(jìn)行綜合比較,結(jié)果表明這四種模型都達(dá)到了令人滿意的分類精度,具有良好的性能。相比較之下SVM的綜合性能最佳,其次是AdaBoost和ANN,KNN的綜合性能相對較弱。研究結(jié)論1.多標(biāo)簽學(xué)習(xí)更符合中醫(yī)臨床實(shí)際,多標(biāo)簽數(shù)據(jù)處理方法和多標(biāo)簽機(jī)器學(xué)習(xí)策略可以提高糖尿病腎病計(jì)算機(jī)輔助辨證的準(zhǔn)確性、完善多證型及兼夾證型的診斷,進(jìn)一步為臨床遣方用藥提供參考。2.本文提出的基于復(fù)雜網(wǎng)絡(luò)重疊社區(qū)發(fā)現(xiàn)算法的特征選擇能有效提取出對證型代表性強(qiáng)且區(qū)分度高的典型特征組合,顯著提高分類器的分類性能,是糖尿病腎病數(shù)據(jù)特征選擇的一種新的有效方法。3.本文使用的多種建模策略能夠勝任糖尿病腎病多證型分類任務(wù),分類性能令人滿意;同時(shí)模型也適用于中醫(yī)藥領(lǐng)域具有高維度、稀疏性和非線性特點(diǎn)的其他數(shù)據(jù)和類似問題的建模研究。
[Abstract]:......
【學(xué)位授予單位】:北京中醫(yī)藥大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:R259
【相似文獻(xiàn)】
相關(guān)期刊論文 前5條
1 裴曉梅;鄭崇勛;;基于Adaboost技術(shù)的大腦運(yùn)動意識任務(wù)分類[J];北京生物醫(yī)學(xué)工程;2008年05期
2 田銀;李沛洋;徐鵬;;基于AdaBoost的腦機(jī)接口分類算法研究[J];電子科技大學(xué)學(xué)報(bào);2013年05期
3 柳秋云;;改進(jìn)的樸素貝葉斯分類器在醫(yī)療診斷中的應(yīng)用[J];科技創(chuàng)新導(dǎo)報(bào);2008年31期
4 綦宏志;許敏鵬;明東;萬柏坤;劉志朋;殷濤;;P300 Speller中基于AdaBoost SVM的導(dǎo)聯(lián)篩選研究[J];儀器儀表學(xué)報(bào);2012年05期
5 ;[J];;年期
相關(guān)會議論文 前10條
1 Wen Feng;;A Novel Lips Detection Method Combined Adaboost Algorithm and Camshift Algorithm[A];2012年計(jì)算機(jī)應(yīng)用與系統(tǒng)建模國際會議論文集[C];2012年
2 張超;苗振江;;基于AdaBoost的面部信息感知[A];第十三屆全國信號處理學(xué)術(shù)年會(CCSP-2007)論文集[C];2007年
3 郭翌;汪源源;;基于Adaboost算法的頸動脈粥樣硬化判別方法[A];中國儀器儀表學(xué)會第十一屆青年學(xué)術(shù)會議論文集[C];2009年
4 張紅梅;高海華;王行愚;;抑制樣本噪聲的AdaBoost算法及其在入侵檢測中的應(yīng)用[A];2007年中國智能自動化會議論文集[C];2007年
5 陸文聰;鈕冰;金雨歡;;基于AdaBoost算法的亞細(xì)胞位置預(yù)測[A];中國化學(xué)會第26屆學(xué)術(shù)年會化學(xué)信息學(xué)與化學(xué)計(jì)量學(xué)分會場論文集[C];2008年
6 陳宏偉;劉建偉;費(fèi)向東;;一種半監(jiān)督環(huán)境下的Adaboost算法[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年
7 唐曉丹;苗振江;;基于AdaBoost和粒子濾波的目標(biāo)跟蹤[A];第十四屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2008年
8 張彬;金連文;;基于AdaBoost的手寫體漢字相似字符識別[A];第二十六屆中國控制會議論文集[C];2007年
9 ;Using Skin Color and HAD-AdaBoost Algorithm for Face Detection in Color Images[A];Information Technology and Computer Science—Proceedings of 2012 National Conference on Information Technology and Computer Science[C];2012年
10 肖磊;李麗;肖佳文;;基于AdaBoost-SVM的上市公司信用風(fēng)險(xiǎn)評估[A];2012管理創(chuàng)新、智能科技與經(jīng)濟(jì)發(fā)展研討會論文集[C];2012年
相關(guān)博士學(xué)位論文 前4條
1 佟旭;基于復(fù)雜網(wǎng)絡(luò)理論的糖尿病腎病辨證建模研究[D];北京中醫(yī)藥大學(xué);2016年
2 劉沖;模擬電路故障診斷AdaBoost集成學(xué)習(xí)方法研究[D];大連海事大學(xué);2011年
3 張?zhí)珜?人眼注視點(diǎn)估計(jì)方法的研究[D];南開大學(xué);2013年
4 趙培英;基于智能計(jì)算的膜蛋白結(jié)構(gòu)與相互作用預(yù)測研究[D];東華大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 宋雨;基于視覺圖片的腦—機(jī)接口控制研究[D];天津理工大學(xué);2015年
2 林欣;基于改進(jìn)膚色模型的AdaBoost人臉檢測算法研究[D];陜西科技大學(xué);2015年
3 袁浩杰;Adaboost算法的并行化及其在目標(biāo)分類中的應(yīng)用[D];華南理工大學(xué);2015年
4 張恒;基于近紅外圖像的疲勞駕駛檢測研究與系統(tǒng)實(shí)現(xiàn)[D];長安大學(xué);2015年
5 朱弘揚(yáng);多規(guī)則Adaboost算法及其應(yīng)用研究[D];大連海事大學(xué);2016年
6 梁振華;基于Adaboost與光流法的嘴唇動作獲取系統(tǒng)的實(shí)現(xiàn)[D];南京大學(xué);2014年
7 韋洪喜;司機(jī)防疲勞駕駛系統(tǒng)研究[D];安徽理工大學(xué);2016年
8 龍伶敏;基于Adaboost的人臉檢測方法及眼睛定位算法研究[D];電子科技大學(xué);2008年
9 劉藝;基于改進(jìn)Adaboost算法的目標(biāo)檢測和追蹤技術(shù)[D];重慶大學(xué);2008年
10 陳曉賓;基于膚色和AdaBoost算法的人臉檢測方法研究[D];大連理工大學(xué);2009年
,
本文編號:
2357019
本文鏈接:http://www.sikaile.net/zhongyixuelunwen/2357019.html