基于深度學(xué)習(xí)的白血細胞分類識別方法研究
發(fā)布時間:2020-05-07 13:31
【摘要】:目前白血細胞類型的識別多用三分類血液檢測儀或五分類血液檢測儀,而這些儀器也并不能做到識別分類的高精準化。這些儀器只能識別和統(tǒng)計常規(guī)的三分類或五分類白血細胞類型,不能詳細精準地統(tǒng)計擁有40種之多的全部白血細胞類型。如果能更加智能化、精準化和全面化地識別白血細胞的具體所屬類型,而不是粗略劃分的三分類或五分類,將給醫(yī)生對于白血病患者診療起到非常好的輔助作用。針對上述問題,本文基于深度學(xué)習(xí)的理論對構(gòu)建40種白血細胞進行分類識別的神經(jīng)網(wǎng)絡(luò)和提高分類準確率做了重點研究。論文的主要工作如下:本研究首先設(shè)計了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)和殘差算法的白血細胞分類方法。對于不同種類的白血細胞的識別,其實質(zhì)就是一種視覺圖像的分類處理。而卷積神經(jīng)網(wǎng)絡(luò)(CNN)在對圖像的局部特征的提取有著得天獨厚的優(yōu)勢,其強大之處主要表現(xiàn)在三大特性:局部感知,參數(shù)共享以及多核卷積。這些特征讓其訓(xùn)練參數(shù)大為縮減,并且使得特征的提取更加高效方便;诖苏J知,本文通過大量的實驗實踐設(shè)計出一個深度有33層的卷積神經(jīng)網(wǎng)絡(luò)分類器,并且通過大量圖像樣本訓(xùn)練之后可以提取具有82%分類準確率的網(wǎng)絡(luò)模型。該模型對40種白血細胞的識別分類可以用于臨床診斷。由于血細胞領(lǐng)域的限制,我們所獲得的白血細胞數(shù)據(jù)集中各類別數(shù)量是極其不均勻,某些類別的樣本稀少。像對于通常血檢所獲得的白血細胞三種類別(大細胞群、中細胞群、小細胞群)的圖像較為容易獲取且資源較多,而對于更為詳細的40分類的白血細胞圖像資源較為稀少。針對這樣的問題,本文又提出一種基于遷移學(xué)習(xí)的白血細胞分類識別方法。首先本文設(shè)計出一種具有三分類的能夠自動提取白血細胞圖像顯著特征的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu),再用充足的三分類訓(xùn)練樣本擬合網(wǎng)絡(luò)參數(shù),然后提取出效果較好的三分類模型。其次再設(shè)計一種具有40分類的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)(CNN),而該架構(gòu)的特征提取層與三分類特征提取層結(jié)構(gòu)相同,故可將三分類模型的特征提取層參數(shù)遷移至40分類CNN架構(gòu)中去,然后利用相對不充足的40分類數(shù)據(jù)集來訓(xùn)練該40分類架構(gòu),最終可以獲得具有89%分類準確率的網(wǎng)絡(luò)模型。最后本文經(jīng)大量的實驗表明本文所提出的基于遷移學(xué)習(xí)的方法要優(yōu)于單純使用CNN或傳統(tǒng)的白血細胞自動分類的方法,證明了該方法的可行性與有效性。
【圖文】:
圖 2.1 白血細胞自動分類處理展示對于白血細胞的分類研究而言,,常常都是先進行樣本數(shù)據(jù)的特征提取,合適的分類器來做擬合參數(shù)的訓(xùn)練。下面介紹一些常用的分類器算法。KNN(K Nearest Neighbors)算法[17]或稱為 K 最近鄰分類算法!発 最鄰思義,即如果要表示一個樣本值就可以利用 k 個距離上最接近該值的樣達。該種算法的主要思想是,若是一個數(shù)據(jù)點在特征空間上有 k 個與其的數(shù)據(jù)點并且這 k 個數(shù)據(jù)點大部分是某一種類型,那么這個數(shù)據(jù)點也應(yīng)型。這種算法在判定某個數(shù)據(jù)點所屬種類時需要獲知其最相鄰的多個數(shù)類。正是因為 KNN 算法在判定樣本類別依靠的是分布在樣本周圍的環(huán)境通過樣本本身所具有的一些特點信息,所以這種方法在處理某些類別間區(qū)域較多的問題時效果十分顯著。但是如果不同類別的數(shù)據(jù)對分布十分那么該方法則難以應(yīng)對。當(dāng)其中某一類或幾類樣本數(shù)量較多,而其他的,則會使得在預(yù)測新樣本所屬類別時,算法偏向于采用樣本最近的 k 個量占比最多的那一類類別。因此這種分類算法僅在處理數(shù)據(jù)量大并且較數(shù)據(jù)集時效果會很不錯。
杭州電子科技大學(xué)碩士學(xué)位論文層次結(jié)構(gòu)組合的網(wǎng)絡(luò),它的層次結(jié)構(gòu)類似于生物神經(jīng)系統(tǒng),并的信號做出一些列反應(yīng)。在自然生物神經(jīng)系統(tǒng)中,神經(jīng)元是其每個神經(jīng)元與其他神經(jīng)元相連,當(dāng)一個神經(jīng)元變興奮時便會向神經(jīng)元傳遞信號,從而后面神經(jīng)元的電位發(fā)生變化;若該神經(jīng)值”(threshold)則會被激活并繼續(xù)向下面的神經(jīng)元傳遞信號。圖 2.2 是一個簡單的神經(jīng)元模型:
【學(xué)位授予單位】:杭州電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:R446.1;TP18
本文編號:2653048
【圖文】:
圖 2.1 白血細胞自動分類處理展示對于白血細胞的分類研究而言,,常常都是先進行樣本數(shù)據(jù)的特征提取,合適的分類器來做擬合參數(shù)的訓(xùn)練。下面介紹一些常用的分類器算法。KNN(K Nearest Neighbors)算法[17]或稱為 K 最近鄰分類算法!発 最鄰思義,即如果要表示一個樣本值就可以利用 k 個距離上最接近該值的樣達。該種算法的主要思想是,若是一個數(shù)據(jù)點在特征空間上有 k 個與其的數(shù)據(jù)點并且這 k 個數(shù)據(jù)點大部分是某一種類型,那么這個數(shù)據(jù)點也應(yīng)型。這種算法在判定某個數(shù)據(jù)點所屬種類時需要獲知其最相鄰的多個數(shù)類。正是因為 KNN 算法在判定樣本類別依靠的是分布在樣本周圍的環(huán)境通過樣本本身所具有的一些特點信息,所以這種方法在處理某些類別間區(qū)域較多的問題時效果十分顯著。但是如果不同類別的數(shù)據(jù)對分布十分那么該方法則難以應(yīng)對。當(dāng)其中某一類或幾類樣本數(shù)量較多,而其他的,則會使得在預(yù)測新樣本所屬類別時,算法偏向于采用樣本最近的 k 個量占比最多的那一類類別。因此這種分類算法僅在處理數(shù)據(jù)量大并且較數(shù)據(jù)集時效果會很不錯。
杭州電子科技大學(xué)碩士學(xué)位論文層次結(jié)構(gòu)組合的網(wǎng)絡(luò),它的層次結(jié)構(gòu)類似于生物神經(jīng)系統(tǒng),并的信號做出一些列反應(yīng)。在自然生物神經(jīng)系統(tǒng)中,神經(jīng)元是其每個神經(jīng)元與其他神經(jīng)元相連,當(dāng)一個神經(jīng)元變興奮時便會向神經(jīng)元傳遞信號,從而后面神經(jīng)元的電位發(fā)生變化;若該神經(jīng)值”(threshold)則會被激活并繼續(xù)向下面的神經(jīng)元傳遞信號。圖 2.2 是一個簡單的神經(jīng)元模型:
【學(xué)位授予單位】:杭州電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:R446.1;TP18
【相似文獻】
相關(guān)期刊論文 前1條
1 郭揚;宋裕如;陳波;王舒;;“白血”釋義及臨床應(yīng)用[J];四川中醫(yī);2017年10期
相關(guān)碩士學(xué)位論文 前1條
1 程柳;基于深度學(xué)習(xí)的白血細胞分類識別方法研究[D];杭州電子科技大學(xué);2018年
本文編號:2653048
本文鏈接:http://www.sikaile.net/linchuangyixuelunwen/2653048.html
最近更新
教材專著