基于深度學習的復雜疾病致病基因識別算法研究
發(fā)布時間:2021-05-05 22:12
復雜疾病是一類遺傳機制復雜,由多基因共同影響導致的疾病,同時與外部環(huán)境因素也有一定的關系,是基因與環(huán)境共同作用的結果。鑒定復雜疾病的生物標志物是研究其發(fā)病機制、診斷與治療的關鍵。近年來,深度學習得到快速地發(fā)展,在復雜數(shù)據(jù)集上表現(xiàn)出優(yōu)異的性能,為在生物醫(yī)學領域尋找復雜疾病生物標志物的方法研究提供了可能。本文嘗試探索一種基于深度學習的針對復雜疾病致病基因的篩選方法,以雙相情感障礙和Ⅱ型糖尿病這兩種復雜疾病為例開展研究工作。1.基于卷積神經網(wǎng)絡的復雜疾病的疾病分類研究。針對卷積神經網(wǎng)絡對于輸入訓練數(shù)據(jù)的要求,將下載獲取的樣本SNP位點數(shù)據(jù)經過GWAS篩選和編碼轉換處理為BMP圖像數(shù)據(jù),以樣本為單位組織為Case-Control數(shù)據(jù)集。針對兩種疾病搭建各自的卷積神經網(wǎng)絡,分別進行多次訓練,不斷調整超參數(shù)直到獲得較優(yōu)的模型。最終訓練得到的雙相情感障礙疾病分類模型的精度是94.5%,Ⅱ型糖尿病疾病分類模型的精度是97.81%。2.使用Grad-CAM(Gradient-weighted Class Activation Mapping)對訓練得到的模型進行解釋性研究。分別針對兩種疾病的分類模型進行...
【文章來源】:重慶郵電大學重慶市
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
注釋表
第1章 緒論
1.1 復雜疾病概述
1.1.1 復雜疾病與人類健康
1.1.2 雙相情感障礙
1.1.3 Ⅱ型糖尿病
1.2 深度學習概述
1.2.1 卷積神經網(wǎng)絡
1.2.2 卷積神經網(wǎng)絡的可視化方法Grad-CAM
1.3 深度學習與疾病研究
1.3.1 深度學習在疾病研究領域的應用與發(fā)展
1.3.2 存在的挑戰(zhàn)
1.4 本文的主要研究內容
1.5 論文結構安排
第2章 構建深度學習訓練數(shù)據(jù)集
2.1 數(shù)據(jù)來源
2.2 數(shù)據(jù)處理的主要流程
2.3 通過GWAS進行SNP位點篩選
2.3.1 雙相情感障礙SNP位點篩選
2.3.2 Ⅱ型糖尿病SNP位點篩選
2.4 數(shù)據(jù)轉換
2.4.1 雙相情感障礙數(shù)據(jù)轉換結果
2.4.2 Ⅱ型糖尿病數(shù)據(jù)轉換結果
2.5 劃分數(shù)據(jù)集
2.5.1 雙相情感障礙Case-Control數(shù)據(jù)集的劃分
2.5.2 Ⅱ型糖尿病Case-Control數(shù)據(jù)集的劃分
2.6 本章小結
第3章 基于卷積神經網(wǎng)絡的復雜疾病分類研究
3.1 卷積神經網(wǎng)絡參數(shù)簡介
3.1.1 激活函數(shù)
3.1.2 抑制過擬合的Dropout方法
3.1.3 Alex Net的網(wǎng)絡結構
3.2 基于卷積神經網(wǎng)絡的疾病分類模型研究的主要流程
3.2.1 主要流程及方法
3.2.2 軟件環(huán)境及硬件配置
3.3 雙相情感障礙疾病分類模型的訓練
3.4 Ⅱ型糖尿病疾病分類模型的訓練
3.5 本章小結
第4章 基于Grad-CAM的風險基因篩選研究
4.1 基因富集分析工具Metascape
4.2 風險基因的篩選流程
4.3 雙相情感障礙的風險基因篩選研究
4.3.1 計算雙相情感障礙疾病分類模型的Grad-CAM
4.3.2 統(tǒng)計篩選風險基因
4.3.3 使用Metascape進行分析
4.4 Ⅱ型糖尿病的風險基因篩選研究
4.4.1 計算Ⅱ型糖尿病疾病分類模型的Grad-CAM
4.4.2 統(tǒng)計篩選風險基因
4.4.3 使用Metascape進行分析
4.4.4 使用OMIM數(shù)據(jù)庫進行檢索對比
4.5 本章小結
第5章 總結與展望
5.1 主要成果與創(chuàng)新點
5.1.1 主要成果
5.1.2 創(chuàng)新點
5.2 課題展望
參考文獻
致謝
攻讀碩士學位期間從事的科研工作及取得的成果
【參考文獻】:
期刊論文
[1]雙相抑郁的特點、危害及藥物治療研究進展[J]. 袁銘,李素敏,王雪芹,李素霞,陸林. 中國全科醫(yī)學. 2016(10)
[2]雙相情感障礙:綜述[J]. 周淑新,李雯. 中國全科醫(yī)學. 2013(06)
博士論文
[1]雙相情感障礙與重性抑郁障礙在抑郁發(fā)作階段腦白質網(wǎng)絡的比較研究[D]. 殷志洋.中國醫(yī)科大學 2019
本文編號:3170674
【文章來源】:重慶郵電大學重慶市
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
注釋表
第1章 緒論
1.1 復雜疾病概述
1.1.1 復雜疾病與人類健康
1.1.2 雙相情感障礙
1.1.3 Ⅱ型糖尿病
1.2 深度學習概述
1.2.1 卷積神經網(wǎng)絡
1.2.2 卷積神經網(wǎng)絡的可視化方法Grad-CAM
1.3 深度學習與疾病研究
1.3.1 深度學習在疾病研究領域的應用與發(fā)展
1.3.2 存在的挑戰(zhàn)
1.4 本文的主要研究內容
1.5 論文結構安排
第2章 構建深度學習訓練數(shù)據(jù)集
2.1 數(shù)據(jù)來源
2.2 數(shù)據(jù)處理的主要流程
2.3 通過GWAS進行SNP位點篩選
2.3.1 雙相情感障礙SNP位點篩選
2.3.2 Ⅱ型糖尿病SNP位點篩選
2.4 數(shù)據(jù)轉換
2.4.1 雙相情感障礙數(shù)據(jù)轉換結果
2.4.2 Ⅱ型糖尿病數(shù)據(jù)轉換結果
2.5 劃分數(shù)據(jù)集
2.5.1 雙相情感障礙Case-Control數(shù)據(jù)集的劃分
2.5.2 Ⅱ型糖尿病Case-Control數(shù)據(jù)集的劃分
2.6 本章小結
第3章 基于卷積神經網(wǎng)絡的復雜疾病分類研究
3.1 卷積神經網(wǎng)絡參數(shù)簡介
3.1.1 激活函數(shù)
3.1.2 抑制過擬合的Dropout方法
3.1.3 Alex Net的網(wǎng)絡結構
3.2 基于卷積神經網(wǎng)絡的疾病分類模型研究的主要流程
3.2.1 主要流程及方法
3.2.2 軟件環(huán)境及硬件配置
3.3 雙相情感障礙疾病分類模型的訓練
3.4 Ⅱ型糖尿病疾病分類模型的訓練
3.5 本章小結
第4章 基于Grad-CAM的風險基因篩選研究
4.1 基因富集分析工具Metascape
4.2 風險基因的篩選流程
4.3 雙相情感障礙的風險基因篩選研究
4.3.1 計算雙相情感障礙疾病分類模型的Grad-CAM
4.3.2 統(tǒng)計篩選風險基因
4.3.3 使用Metascape進行分析
4.4 Ⅱ型糖尿病的風險基因篩選研究
4.4.1 計算Ⅱ型糖尿病疾病分類模型的Grad-CAM
4.4.2 統(tǒng)計篩選風險基因
4.4.3 使用Metascape進行分析
4.4.4 使用OMIM數(shù)據(jù)庫進行檢索對比
4.5 本章小結
第5章 總結與展望
5.1 主要成果與創(chuàng)新點
5.1.1 主要成果
5.1.2 創(chuàng)新點
5.2 課題展望
參考文獻
致謝
攻讀碩士學位期間從事的科研工作及取得的成果
【參考文獻】:
期刊論文
[1]雙相抑郁的特點、危害及藥物治療研究進展[J]. 袁銘,李素敏,王雪芹,李素霞,陸林. 中國全科醫(yī)學. 2016(10)
[2]雙相情感障礙:綜述[J]. 周淑新,李雯. 中國全科醫(yī)學. 2013(06)
博士論文
[1]雙相情感障礙與重性抑郁障礙在抑郁發(fā)作階段腦白質網(wǎng)絡的比較研究[D]. 殷志洋.中國醫(yī)科大學 2019
本文編號:3170674
本文鏈接:http://www.sikaile.net/kejilunwen/jiyingongcheng/3170674.html
最近更新
教材專著