天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于集成學習的傳染性肝病輔助診斷系統(tǒng)的研究與實現(xiàn)

發(fā)布時間:2020-04-04 19:50
【摘要】:傳染性肝病是一類分布極為廣泛的傳染病,其傳染性高且傳播途徑多樣,對社會有巨大的影響。傳染性肝病通常根據(jù)標志物指標進行診斷,但是當疾病處于非急性期時,標志物指標的不顯著與不穩(wěn)定為診斷帶來很大困難。因此利用機器學習的方法,發(fā)掘大量特征與疾病之間隱含的聯(lián)系,是傳染性肝病診斷研究的主要方向之一。本研究以傳染性肝病的診斷為主要研究對象,探討診斷模型訓練過程中的特征選擇方法與分類模型的設計。本文首先使用改進的集成特征選擇方法對數(shù)據(jù)進行特征選擇,然后采用集成學習方法構建分類模型并進行集成剪枝,最后完成分布式傳染性肝病的輔助診斷系統(tǒng)的設計與實現(xiàn)。本文具體工作如下:(1)提出一種新的集成特征選擇方法CB-EFS。CB-EFS方法首先對多種特征選擇器得到的特征子集進行聚類,得到更具差異性的子集來增強集成性能,接著對這些子集進行投票集成,選擇排名較高的特征。該方法主要有兩點創(chuàng)新:其一,針對進行聚類的特征子集較少,使用傳統(tǒng)的基于漂移均值聚類方法時難以確定聚類中窗口半徑從而無法得到最優(yōu)的聚類結果的問題進行改進。首先多次使用不同窗口半徑進行聚類得到多個簇心組,對得到的所有簇心再次聚類,得出簇心分布規(guī)律,從而選出簇心組中具有代表性且差異性較大者作為聚類結果,得到更優(yōu)聚類表現(xiàn)。其二,對特征子集進行集成時,原始的波達投票方法雖可以很好的選出被大多數(shù)選擇器認可的特征,但其簡單的根據(jù)位次線性加權的方法會導致部分在少數(shù)子集中表現(xiàn)好的特征無法獲得較高的最終排名,對此本文采用改進的非線性加權方法,使此類特征獲得更高權重與更大的被選中概率,并且能更直觀看出所有特征的重要性程度。實驗結果表明,使用CB-EFS方法分類的準確度相比于使用其他特征選擇方法平均提升0.998%,且具有較好的敏感性和穩(wěn)定性。(2)集成分類模型通過集成多個基分類器來得到更好的分類性能,但是使用過多的分類器會降低集成模型的泛化能力和分類速度,并且會出現(xiàn)由于部分基分類器冗余而造成計算資源浪費的情況。因此,通過集成剪枝從集成中去除部分分類器可以提高集成性能、節(jié)省計算資源。本文對帕累托集成剪枝方法進行改進,提出三目標優(yōu)化集成剪枝方法,在原有的最大化分類準確度和最小化集成規(guī)模兩個優(yōu)化目標的基礎上,加入最大化基分類器差異度目標,以解決原方法存在的過擬合問題。同時,針對滿足這三個目標的帕累托最優(yōu)解稀少的情況,將算法求解方式進行優(yōu)化。實驗結果表明,使用該剪枝方法的集成分類模型準確度相比使用原方法平均提升0.67%,且模型過擬合程度明顯降低。(3)在上述研究的基礎上,完成基于Hadoop的分布式傳染性肝病輔助診斷系統(tǒng)的設計與實現(xiàn),實現(xiàn)對傳染性肝病的智能診斷并對疾病的傳播趨勢等情況進行統(tǒng)計與可視化展示。
【圖文】:

組件關系,集成學習,預測性能


圖2.3邋Hadoop組件關系圖逡逑

聚類,樣本點組,樣本集,特征子集


6.邐更新特征集R邋=邋[p>,R]逡逑7.邐在S中去除次特征:F邋=逡逑加入SVM-RFE方法后本章采用的集成特征選擇基本流程如圖3.1所示:逡逑/邋原始特征邋^逡逑過濾&特征邐過濾5特征邐過濾1特征邐SVM-r7f4寺征逡逑選擇方法1邐選擇方法2邐選擇方法7邐選擇方法逡逑/邋mi邋^7邋/邋特;^7邐/邋特;^7邋/邋特;^7逡逑/邋子-集1邐/邐/邋子-集2邐/邐…/邐子-集7邐/邐/邋子-集8邐/逡逑投票集成逡逑/^最終、寺征^7逡逑/邋—邋/逡逑圖3.1集成特征選擇方法基本流程逡逑3.1.2聚類及均值漂移聚類逡逑在增加集成差異度第二個方面一一增加特征選擇后特征子集的差異度,本章逡逑對七種過濾式特征選擇器得到的特征子集進行基于均值漂移聚類,自動從某些相逡逑似的特征子集中選出一個具有代表性的特征子集,從而避免這些相似子集在集成逡逑中占據(jù)過高權重,側面增加了集成的差異度。使用聚類的集成特征選擇方法流程逡逑如圖3.2所示:逡逑聚類是一種非常常用的機器學習方法。聚類(Clustering)根據(jù)某個標準將一逡逑個樣本集分割為不同的簇(Cluster),使得在同一個簇中的樣本的相似性盡可能逡逑大,,且不在同一個簇中的樣本的差異性盡可能大[35]。逡逑聚類是一種無監(jiān)督學習方法,在進行聚類時不需要關心得到的聚類是什么或逡逑需要加上什么標簽
【學位授予單位】:江蘇大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:R512.6;TP181

【相似文獻】

相關期刊論文 前10條

1 徐繼偉;楊云;;集成學習方法:研究綜述[J];云南大學學報(自然科學版);2018年06期

2 武玉英;嚴勇;蔣國瑞;;基于動態(tài)選擇性集成學習的供應鏈產(chǎn)銷協(xié)商優(yōu)化策略[J];計算機工程;2017年05期

3 張滄生;崔麗娟;楊剛;倪志宏;;集成學習算法的比較研究[J];河北大學學報(自然科學版);2007年05期

4 郭福亮;周鋼;;集成學習中預測精度的影響因素分析[J];兵工自動化;2019年01期

5 曾一平;;基于集成學習的小麥識別研究[J];現(xiàn)代商貿(mào)工業(yè);2019年17期

6 米碩;孫瑞彬;李欣;明曉;;集成學習在文本分類問題中的應用[J];中國新通信;2018年09期

7 李曄;劉勝利;張兆林;;基于漂移檢測和集成學習的木馬檢測模型[J];信息工程大學學報;2017年06期

8 徐桂云;陳躍;張曉光;劉云楷;;基于選擇性集成學習的焊接缺陷識別研究[J];中國礦業(yè)大學學報;2011年06期

9 張春霞;張講社;;選擇性集成學習算法綜述[J];計算機學報;2011年08期

10 饒峰;;核機器集成學習算法的誤差分析[J];重慶文理學院學報(自然科學版);2010年04期

相關會議論文 前10條

1 關鵬洲;王夢毫;李倩;;基于集成學習和深度學習的短期降雨預測模型[A];2017年(第五屆)全國大學生統(tǒng)計建模大賽獲獎論文選[C];2017年

2 杜方鍵;楊宏暉;;K均值聚類優(yōu)化集成學習[A];2011'中國西部聲學學術交流會論文集[C];2011年

3 倪志偉;張琛;倪麗萍;;基于螢火蟲群優(yōu)化算法的選擇性集成霾天氣預報方法[A];中國系統(tǒng)工程學會第十八屆學術年會論文集——A12系統(tǒng)科學與系統(tǒng)工程理論在各個領域中的應用研究[C];2014年

4 李燁;蔡云澤;許曉鳴;;基于支持向量機集成的故障診斷[A];第16屆中國過程控制學術年會暨第4屆全國故障診斷與安全性學術會議論文集[C];2005年

5 吳龍飛;孫浩;計科峰;;基于集成映射的半監(jiān)督圖像分類方法[A];第八屆全國信號和智能信息處理與應用學術會議會刊[C];2014年

6 邱誠;倪子偉;陳珂;蘇旋;鄒權;;基于聚類方法的基分類器選擇策略研究[A];第29屆中國數(shù)據(jù)庫學術會議論文集(B輯)(NDBC2012)[C];2012年

7 張紅梅;;基于粗糙集特征約簡的SVM集成入侵檢測模型[A];2009中國控制與決策會議論文集(3)[C];2009年

8 程麗麗;張健沛;楊靜;馬駿;;一種提高支持向量機集成差異性的學習方法[A];第二十五屆中國數(shù)據(jù)庫學術會議論文集(一)[C];2008年

9 劉錕;邢延;蔡延光;;一種針對交互式學習系統(tǒng)日志數(shù)據(jù)的輕型化挖掘方法[A];2011年中國智能自動化學術會議論文集(第一分冊)[C];2011年

10 劉伍穎;王挺;;一種多過濾器集成學習垃圾郵件過濾方法[A];第三屆全國信息檢索與內(nèi)容安全學術會議論文集[C];2007年

相關重要報紙文章 前1條

1 本報記者 張曄;人腦比電腦更重要[N];科技日報;2008年

相關博士學位論文 前10條

1 李艷秋;基于集成學習的人臉識別研究[D];合肥工業(yè)大學;2018年

2 趙鶴;面向高維大數(shù)據(jù)的子空間集成學習方法研究[D];中國科學院大學(中國科學院深圳先進技術研究院);2017年

3 劉天羽;基于特征選擇技術的集成學習方法及其應用研究[D];上海大學;2007年

4 侯勇;特征提取與集成學習算法的研究及應用[D];北京科技大學;2015年

5 孫永宣;集成學習下的圖像分析關鍵問題研究[D];合肥工業(yè)大學;2013年

6 尹華;面向高維和不平衡數(shù)據(jù)分類的集成學習研究[D];武漢大學;2012年

7 阿里木·賽買提(Alim.Samat);基于集成學習的全極化SAR圖像分類研究[D];南京大學;2015年

8 劉沖;模擬電路故障診斷AdaBoost集成學習方法研究[D];大連海事大學;2011年

9 鈕冰;基于集成學習算法的若干生物信息學問題研究[D];上海大學;2009年

10 程麗麗;支持向量機集成學習算法研究[D];哈爾濱工程大學;2009年

相關碩士學位論文 前10條

1 呂克敵;基于集成學習與進化算法的停車位預測算法研究[D];吉林大學;2019年

2 沈先寶;基于集成學習的分類系統(tǒng)的研究及實現(xiàn)[D];江蘇大學;2019年

3 董鳳偉;基于集成學習的傳染性肝病輔助診斷系統(tǒng)的研究與實現(xiàn)[D];江蘇大學;2019年

4 常建芳;基于集成學習和卷積神經(jīng)網(wǎng)絡的太陽能輻照度預測方法[D];天津大學;2018年

5 葉明;基于集成學習的疾病輔助診斷關鍵技術研究與實現(xiàn)[D];鄭州大學;2019年

6 邸研哲;基于相似性方法的藥物—疾病相互作用關系預測[D];安徽大學;2019年

7 雍振煌;基于評論極性與集成學習的微博謠言檢測研究[D];武漢理工大學;2018年

8 朱俊;選擇性集成學習及其應用研究[D];華東交通大學;2016年

9 鄭麗容;基于聚類和動態(tài)更新的啟發(fā)式選擇性集成學習算法[D];廈門大學;2017年

10 李輝華;基于集成學習的出租車預計到達時間預測[D];廈門大學;2018年



本文編號:2614005

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/yixuelunwen/chuanranbingxuelunwen/2614005.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶9ccc0***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com