基于改進(jìn)的svm的基因微陣列數(shù)據(jù)疾病預(yù)報
發(fā)布時間:2022-05-08 15:22
DNA微陣列又稱DNA芯片,是上個世紀(jì)生物領(lǐng)域重要的發(fā)明之一。他使同時監(jiān)控成千上萬個基因的表達(dá)成為了可能。隨著現(xiàn)代生活的發(fā)展,疾病診斷成為了醫(yī)學(xué)很重要的一部分。本文研究利用DNA微陣列技術(shù)來做疾病診斷預(yù)測。DNA微陣列數(shù)據(jù)集有低樣本,高維度,高冗余,高噪音的特點,不能直接利用機(jī)器學(xué)習(xí)的算法進(jìn)行分類。本文首先對數(shù)據(jù)集進(jìn)行了預(yù)處理,然后利用gs,cho’s,svm-rfe等方法進(jìn)行特征提取,將基因打分,得出特征基因的排序。利用選出的基因再結(jié)合數(shù)據(jù)的特點,本文選擇了使用改進(jìn)的支持向量機(jī),最小二乘向量機(jī)進(jìn)行模型的訓(xùn)練。模型有兩個重要參數(shù),參數(shù)的選擇對分類器的好壞有至關(guān)重要的影響。本文使用了遺傳算法對參數(shù)優(yōu)化,提高了模型的預(yù)報能力。在白血病,膠質(zhì)癌,彌漫性大b淋巴癌的數(shù)據(jù)集上進(jìn)行了預(yù)報測試。在白血病的數(shù)據(jù)中,取得了只用4個基因,預(yù)報準(zhǔn)確率100%的結(jié)果,優(yōu)于其他方法。本文最后還指出DNA微陣列的特征提取的現(xiàn)實意義,特征提取對生物學(xué)和醫(yī)學(xué)的病理上的研究有一定的指導(dǎo)作用。
【文章頁數(shù)】:35 頁
【學(xué)位級別】:碩士
【文章目錄】:
致謝
摘要
Abstract
1. 緒論
1.1 引言
1.2 DNA微陣列介紹
1.2.1 DNA微陣列
1.2.2 DNA微陣列的數(shù)據(jù)特點以及應(yīng)用
1.3 疾病預(yù)報以及國內(nèi)外的研究現(xiàn)狀
1.4 本文結(jié)構(gòu)與安排
2. 數(shù)據(jù)集和特征提取的方法
2.1 數(shù)據(jù)集介紹
2.2 特征提取
3. 分類器的介紹
3.1 引言
3.2 SVM算法介紹
3.3 KNN算法介紹
4. 智能算法參數(shù)尋優(yōu)
4.1 引言
4.2 遺傳算法參數(shù)法優(yōu)化
4.3 小結(jié)與討論
5. 總結(jié)與展望
5.1 案例學(xué)習(xí)
5.2 全文研究展望
參考文獻(xiàn)
【參考文獻(xiàn)】:
博士論文
[1]基于DNA微陣列數(shù)據(jù)的癌癥分類技術(shù)研究[D]. 于化龍.哈爾濱工程大學(xué) 2010
本文編號:3651900
【文章頁數(shù)】:35 頁
【學(xué)位級別】:碩士
【文章目錄】:
致謝
摘要
Abstract
1. 緒論
1.1 引言
1.2 DNA微陣列介紹
1.2.1 DNA微陣列
1.2.2 DNA微陣列的數(shù)據(jù)特點以及應(yīng)用
1.3 疾病預(yù)報以及國內(nèi)外的研究現(xiàn)狀
1.4 本文結(jié)構(gòu)與安排
2. 數(shù)據(jù)集和特征提取的方法
2.1 數(shù)據(jù)集介紹
2.2 特征提取
3. 分類器的介紹
3.1 引言
3.2 SVM算法介紹
3.3 KNN算法介紹
4. 智能算法參數(shù)尋優(yōu)
4.1 引言
4.2 遺傳算法參數(shù)法優(yōu)化
4.3 小結(jié)與討論
5. 總結(jié)與展望
5.1 案例學(xué)習(xí)
5.2 全文研究展望
參考文獻(xiàn)
【參考文獻(xiàn)】:
博士論文
[1]基于DNA微陣列數(shù)據(jù)的癌癥分類技術(shù)研究[D]. 于化龍.哈爾濱工程大學(xué) 2010
本文編號:3651900
本文鏈接:http://www.sikaile.net/xiyixuelunwen/3651900.html
最近更新
教材專著