全基因組關(guān)聯(lián)分析中SNP數(shù)據(jù)補(bǔ)缺算法研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2023-04-26 22:54
2005年全基因組關(guān)聯(lián)分析(GWAS)的成果首次發(fā)表,在過(guò)去的10年中隨著SNP(Single Nucleotide Polymorphism)測(cè)序技術(shù)的快速發(fā)展,全基因組關(guān)聯(lián)分析已逐步在物種重要經(jīng)濟(jì)性狀、植物育種、基因改良以及人類復(fù)雜疾病等方面有所建樹,成為一種重要的研究手段。目前已有許多方法可用于SNP檢測(cè),但是由于相關(guān)技術(shù)的約束,無(wú)論用哪種檢測(cè)方法所測(cè)出的SNP數(shù)據(jù)均是帶有缺失值的,重新檢測(cè)則會(huì)耗費(fèi)大量的時(shí)間與成本,若對(duì)這些缺失值置之不理則會(huì)影響后面的GWAS工作。隱馬爾可夫模型(HMM)在生物信息學(xué)中應(yīng)用的范圍越來(lái)越廣泛,和其它模型相比,HMM具有應(yīng)用彈性大、適用范圍廣、參數(shù)往往具有現(xiàn)實(shí)意義的特點(diǎn),本文中的算法所建立的模型就是應(yīng)用上述特點(diǎn)所改進(jìn)過(guò)的HMM,是一種非齊次的HMM,即狀態(tài)的轉(zhuǎn)移概率不僅和前一時(shí)刻的狀態(tài)有關(guān)還與具體的時(shí)刻有關(guān),所以對(duì)相應(yīng)算法,前向-后向算法,Viterbi算法進(jìn)行了合理且必要的調(diào)整以適應(yīng)改進(jìn)后的模型。本文通過(guò)對(duì)HMM的研究以及對(duì)現(xiàn)有補(bǔ)缺算法的分析,提出了一種基于HMM的高效、快速的補(bǔ)缺方法。本算法的特點(diǎn)是補(bǔ)缺時(shí)所需的生物學(xué)信息少,運(yùn)行速度快,適合對(duì)動(dòng)、...
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 高通量測(cè)序的研究現(xiàn)狀
1.2.2 基因芯片的研究現(xiàn)狀
1.2.3 補(bǔ)缺算法的研究現(xiàn)狀
1.3 本文主要工作
1.4 本文的組織結(jié)構(gòu)
第2章 相關(guān)知識(shí)及技術(shù)
2.1 全基因組關(guān)聯(lián)分析(GWAS)
2.1.1 基于芯片的GWAS
2.1.2 基于高通量測(cè)序的GWAS
2.2 DNA與SNP
2.3 基因型和單體型
2.4 連鎖不平衡
2.5 隱馬爾可夫模型
2.5.1 HMM的定義
2.5.2 HMM的三個(gè)基本問(wèn)題
2.6 本章小結(jié)
第3章 利用參考數(shù)據(jù)的補(bǔ)缺算法
3.1 補(bǔ)缺對(duì)象的確定
3.2 補(bǔ)缺問(wèn)題的定義
3.3 算法的生物學(xué)依據(jù)
3.4 建立補(bǔ)缺問(wèn)題與隱馬模型的映射
3.4.1 對(duì)傳統(tǒng)隱馬模型的改進(jìn)
3.4.2 相應(yīng)的算法的調(diào)整
3.5 確定隱馬模型參數(shù)
3.6 計(jì)算最佳狀態(tài)轉(zhuǎn)移序列(路徑)
3.7 實(shí)驗(yàn)結(jié)果
3.8 本章小結(jié)
第4章 無(wú)參考數(shù)據(jù)的補(bǔ)缺算法
4.1 補(bǔ)缺問(wèn)題的定義
4.2 算法的生物學(xué)依據(jù)
4.3 基于單體型頻率的無(wú)參考補(bǔ)缺算法
4.4 實(shí)驗(yàn)結(jié)果
4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3802348
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 高通量測(cè)序的研究現(xiàn)狀
1.2.2 基因芯片的研究現(xiàn)狀
1.2.3 補(bǔ)缺算法的研究現(xiàn)狀
1.3 本文主要工作
1.4 本文的組織結(jié)構(gòu)
第2章 相關(guān)知識(shí)及技術(shù)
2.1 全基因組關(guān)聯(lián)分析(GWAS)
2.1.1 基于芯片的GWAS
2.1.2 基于高通量測(cè)序的GWAS
2.2 DNA與SNP
2.3 基因型和單體型
2.4 連鎖不平衡
2.5 隱馬爾可夫模型
2.5.1 HMM的定義
2.5.2 HMM的三個(gè)基本問(wèn)題
2.6 本章小結(jié)
第3章 利用參考數(shù)據(jù)的補(bǔ)缺算法
3.1 補(bǔ)缺對(duì)象的確定
3.2 補(bǔ)缺問(wèn)題的定義
3.3 算法的生物學(xué)依據(jù)
3.4 建立補(bǔ)缺問(wèn)題與隱馬模型的映射
3.4.1 對(duì)傳統(tǒng)隱馬模型的改進(jìn)
3.4.2 相應(yīng)的算法的調(diào)整
3.5 確定隱馬模型參數(shù)
3.6 計(jì)算最佳狀態(tài)轉(zhuǎn)移序列(路徑)
3.7 實(shí)驗(yàn)結(jié)果
3.8 本章小結(jié)
第4章 無(wú)參考數(shù)據(jù)的補(bǔ)缺算法
4.1 補(bǔ)缺問(wèn)題的定義
4.2 算法的生物學(xué)依據(jù)
4.3 基于單體型頻率的無(wú)參考補(bǔ)缺算法
4.4 實(shí)驗(yàn)結(jié)果
4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3802348
本文鏈接:http://www.sikaile.net/kejilunwen/yysx/3802348.html
最近更新
教材專著