基于相關(guān)個體拷貝數(shù)變異數(shù)據(jù)的趨勢檢驗及在孤獨癥數(shù)據(jù)中的應(yīng)用
發(fā)布時間:2021-12-09 22:31
拷貝數(shù)變異是人類基因組遺傳多樣性的重要組成部分,是當(dāng)前的研究熱點.然而相應(yīng)的關(guān)聯(lián)研究方法不多,尤其是個體有血緣關(guān)系時.本文基于相關(guān)個體,在Cochran-Armitage趨勢檢驗的基礎(chǔ)上,針對拷貝數(shù)變異數(shù)據(jù)是可基因分型和不可基因分型兩種情形,推導(dǎo)出檢驗方法 MTT.隨機模擬結(jié)果表明:MTT方法具有良好的功效表現(xiàn),適用范圍更廣.同時,本文比較了不同數(shù)據(jù)采集方案對MTT功效的影響,結(jié)果表明相關(guān)病例不相關(guān)對照具有較高的性價比.運用MTT分析孤獨癥真實數(shù)據(jù),檢測出與疾病顯著相關(guān)的拷貝數(shù)變異位點和相關(guān)基因,基因功能富集分析和文獻檢索說明了結(jié)果的可靠性,這為后續(xù)研究提供了指引.
【文章來源】:復(fù)旦學(xué)報(自然科學(xué)版). 2020,59(06)北大核心CSCD
【文章頁數(shù)】:12 頁
【部分圖文】:
家系數(shù)據(jù)和(b)相關(guān)病例不相關(guān)對照數(shù)據(jù)中,零假設(shè)下MTT的P值與均勻分布的Q-Q圖
隨機模擬3:傳統(tǒng)家系數(shù)據(jù)的研究方法聚焦于一對父母和患病小孩,例如傳遞不平衡檢驗(Transmission Disequilibrium Test,TDT)[21],FBAT(Family-Based Association Test)[22]等.這些家系中若存在健康小孩(Sibling)的信息,則通常會忽略.而使用MTT可以利用家系中健康小孩的信息來提升檢驗功效.為此,我們比較如下3種數(shù)據(jù)收集方案對功效的影響,方案Ⅰ:每個家庭包含一對健康父母加一個患病小孩;方案Ⅱ:每個家庭在方案Ⅰ基礎(chǔ)上加一個健康小孩;方案Ⅲ:每個家庭在方案Ⅰ基礎(chǔ)上加一個健康人群對照.家庭數(shù)量定為500個(方案Ⅰ包含1 500個個體,方案Ⅱ包含2 000個個體,方案Ⅲ包含2 000個個體).圖3 相關(guān)病例不相關(guān)對照數(shù)據(jù)中,CATT和MTT方法在3種疾病模型下的功效
圖2 家系數(shù)據(jù)中,CATT、GE和MTT方法在3種疾病模型下的功效從模擬結(jié)果圖4中可以看出,方案Ⅲ表現(xiàn)最佳,而方案Ⅱ與方案Ⅰ相比,在功效表現(xiàn)上并沒有多少提升,這個結(jié)果有些出乎預(yù)料.其原因可能是未患病小孩的遺傳信息和兩位健康父母接近(這也是有研究方法用未患病小孩信息來估計缺失的父母信息的原因之一),因而并不能為統(tǒng)計量提供更多的額外信息.
【參考文獻】:
期刊論文
[1]新一代測序的拷貝數(shù)變異檢測算法研究與設(shè)計[J]. 李燕,李垚垚. 生物信息學(xué). 2015(03)
[2]基因組拷貝數(shù)變異及其突變機理與人類疾病[J]. 杜仁騫,金力,張鋒. 遺傳. 2011(08)
本文編號:3531425
【文章來源】:復(fù)旦學(xué)報(自然科學(xué)版). 2020,59(06)北大核心CSCD
【文章頁數(shù)】:12 頁
【部分圖文】:
家系數(shù)據(jù)和(b)相關(guān)病例不相關(guān)對照數(shù)據(jù)中,零假設(shè)下MTT的P值與均勻分布的Q-Q圖
隨機模擬3:傳統(tǒng)家系數(shù)據(jù)的研究方法聚焦于一對父母和患病小孩,例如傳遞不平衡檢驗(Transmission Disequilibrium Test,TDT)[21],FBAT(Family-Based Association Test)[22]等.這些家系中若存在健康小孩(Sibling)的信息,則通常會忽略.而使用MTT可以利用家系中健康小孩的信息來提升檢驗功效.為此,我們比較如下3種數(shù)據(jù)收集方案對功效的影響,方案Ⅰ:每個家庭包含一對健康父母加一個患病小孩;方案Ⅱ:每個家庭在方案Ⅰ基礎(chǔ)上加一個健康小孩;方案Ⅲ:每個家庭在方案Ⅰ基礎(chǔ)上加一個健康人群對照.家庭數(shù)量定為500個(方案Ⅰ包含1 500個個體,方案Ⅱ包含2 000個個體,方案Ⅲ包含2 000個個體).圖3 相關(guān)病例不相關(guān)對照數(shù)據(jù)中,CATT和MTT方法在3種疾病模型下的功效
圖2 家系數(shù)據(jù)中,CATT、GE和MTT方法在3種疾病模型下的功效從模擬結(jié)果圖4中可以看出,方案Ⅲ表現(xiàn)最佳,而方案Ⅱ與方案Ⅰ相比,在功效表現(xiàn)上并沒有多少提升,這個結(jié)果有些出乎預(yù)料.其原因可能是未患病小孩的遺傳信息和兩位健康父母接近(這也是有研究方法用未患病小孩信息來估計缺失的父母信息的原因之一),因而并不能為統(tǒng)計量提供更多的額外信息.
【參考文獻】:
期刊論文
[1]新一代測序的拷貝數(shù)變異檢測算法研究與設(shè)計[J]. 李燕,李垚垚. 生物信息學(xué). 2015(03)
[2]基因組拷貝數(shù)變異及其突變機理與人類疾病[J]. 杜仁騫,金力,張鋒. 遺傳. 2011(08)
本文編號:3531425
本文鏈接:http://www.sikaile.net/yixuelunwen/jsb/3531425.html
最近更新
教材專著