X染色體標(biāo)記位點(diǎn)上Hardy-Weinberg平衡律的似然比檢驗(yàn)及印記效應(yīng)的檢驗(yàn)
發(fā)布時(shí)間:2017-09-06 14:53
本文關(guān)鍵詞:X染色體標(biāo)記位點(diǎn)上Hardy-Weinberg平衡律的似然比檢驗(yàn)及印記效應(yīng)的檢驗(yàn)
更多相關(guān)文章: X染色體 似然比檢驗(yàn) 標(biāo)記位點(diǎn) 近交系數(shù) 質(zhì)量性狀 印記效應(yīng)
【摘要】:背景:關(guān)聯(lián)分析是一種通過(guò)標(biāo)記位點(diǎn)來(lái)定位疾病位點(diǎn)的有用工具,在病例對(duì)照數(shù)據(jù)與家系數(shù)據(jù)中都有廣泛的應(yīng)用。它利用標(biāo)記位點(diǎn)與疾病位點(diǎn)間的關(guān)系來(lái)定位變異基因。如果標(biāo)記位點(diǎn)離疾病位點(diǎn)很近,這樣會(huì)導(dǎo)致連鎖不平衡,那么兩位點(diǎn)同時(shí)被傳遞的可能性很大。于是,患病人群中該標(biāo)記等位基因頻率要高于或低于正常人群。所以,關(guān)聯(lián)分析通過(guò)標(biāo)記位點(diǎn)定位了疾病位點(diǎn)。常染色體上基于病例對(duì)照研究的關(guān)聯(lián)分析通常需要Hardy-Weinberg平衡律(Hardy-Weinberg equilibrium)的假設(shè)。如果Hardy-Weinberg平衡律不成立時(shí),基于病例對(duì)照數(shù)據(jù)的關(guān)聯(lián)分析方法的第一類(lèi)錯(cuò)誤率可能會(huì)偏大。而今,X染色體上標(biāo)記位點(diǎn)與疾病位點(diǎn)間關(guān)聯(lián)性的檢驗(yàn)方法研究以及Hardy-Weinberg平衡律對(duì)關(guān)聯(lián)分析的影響研究越來(lái)越受到重視。然而,在X染色體上,有兩個(gè)問(wèn)題需要被關(guān)注:(1)對(duì)于同一個(gè)位點(diǎn)上的同一等位基因,男性與女性的等位基因頻率是否相等;(2)女性群體中的近交系數(shù)是否為0。因此,男、女性間的等位基因頻率是否有顯著差異和女性中的Hardy-Weinberg平衡律是否成立經(jīng)常用來(lái)篩選X染色體上連鎖的變異基因。對(duì)于(1)和(2),已經(jīng)有學(xué)者提出了相應(yīng)的方法分別對(duì)其進(jìn)行檢驗(yàn)。然而,這些方法的第一類(lèi)錯(cuò)誤率和檢驗(yàn)效能還沒(méi)有被探討與研究。另外,目前尚未見(jiàn)文獻(xiàn)報(bào)導(dǎo)同時(shí)檢驗(yàn)(1)與(2)的方法。印記效應(yīng)(imprinting effects),也稱(chēng)親源效應(yīng)(parent-of-origin effects),是一種有關(guān)親代基因的表達(dá)與否的后生現(xiàn)象,對(duì)研究基因?qū)Ρ硇偷挠绊懹兄浅V匾饔谩;蛴∮浭且环N非孟德?tīng)栠z傳現(xiàn)象。如果后代來(lái)自父親的等位基因沒(méi)有被表達(dá),而來(lái)自母親的等位基因被表達(dá),此現(xiàn)象稱(chēng)為父系印記;反過(guò)來(lái),如果只有來(lái)自父親的基因被表達(dá)而來(lái)自母親的基因沒(méi)有被表達(dá),即為母系印記。存在印記效應(yīng)時(shí),兩種有序雜合子基因型的外顯率可能是不同的。常染色體上常見(jiàn)的與印記相關(guān)的疾病有:Angelman綜合征、Beckwith-Wiedemann綜合征、Prader-Willi綜合征、肥胖癥、糖尿病等。而X染色體上與印記效應(yīng)相關(guān)的疾病有Turner綜合征。Turner綜合征只在女性個(gè)體中存在,可能是由其中一整條X染色體的缺失或者部分缺失引起。所以,印記效應(yīng)的檢驗(yàn)在研究遺傳疾病方面有重要意義。常染色體上已經(jīng)有很多檢驗(yàn)印記效應(yīng)的方法,但這些方法都不適用于X染色體。到目前為止,我們尚未發(fā)現(xiàn)X染色體上印記效應(yīng)的檢驗(yàn)方法。需要注意的是,X染色體在男、女性間的遺傳是不對(duì)稱(chēng)的。女性有兩條X染色體,一條是父系的,一條是母系的;而男性只有一條母系的X染色體。這種不對(duì)稱(chēng)性使得研究X染色體上印記效應(yīng)檢驗(yàn)的方法更加困難。另一方面,目前已經(jīng)有很多基于家系或病例對(duì)照數(shù)據(jù)的X染色體上關(guān)聯(lián)分析方法。但是,在關(guān)聯(lián)存在的情況下,尚未有方法用于檢驗(yàn)X染色體上的印記效應(yīng)。本文的研究目的主要有以下兩點(diǎn):(1)基于X染色體上的標(biāo)記位點(diǎn),提出檢驗(yàn)Hardy-Weinberg平衡律的似然比方法;(2)針對(duì)不同的核心家庭結(jié)構(gòu),提出檢驗(yàn)印記效應(yīng)的非參數(shù)方法。方法:(1)首先,基于X染色體上收集的樣本,通過(guò)合并Zheng等人提出的兩個(gè)檢驗(yàn)統(tǒng)計(jì)量(檢驗(yàn)?zāi)、女性間的等位基因頻率是否相等(Z1)以及女性群體中的近交系數(shù)是否為0(Z2)),提出Z0統(tǒng)計(jì)量來(lái)同時(shí)檢驗(yàn)(1)男性等位基因頻率等于女性等位基因頻率和(2)女性群體中的近交系數(shù)為0。為了提高此方法的檢驗(yàn)效能,我們進(jìn)一步提出一種新的似然比檢驗(yàn)方法。對(duì)于X染色體上的某一個(gè)位點(diǎn),首先分別寫(xiě)出原假設(shè)和備擇假設(shè)下的似然函數(shù)。然后,用EM算法得到未知參數(shù)的最大似然估計(jì)值并且構(gòu)建LRTo統(tǒng)計(jì)量來(lái)同時(shí)檢驗(yàn)(1)和(2)。如果原假設(shè)被拒絕,則進(jìn)一步構(gòu)造兩個(gè)假設(shè)檢驗(yàn)來(lái)找到原假設(shè)被拒絕的原因。于是,提出另外兩個(gè)似然比檢驗(yàn)統(tǒng)計(jì)量,LRT1(檢驗(yàn)?zāi)信缘牡任换蝾l率是否相等)和LRT2(檢驗(yàn)女性中近交系數(shù)是否為0)。值得注意的是,從模擬結(jié)果可以看出,LRTo和LRT2的第一類(lèi)錯(cuò)誤率偏保守。因此,我們用參數(shù)的bootstrap方法來(lái)評(píng)價(jià)LRTo和LRT2的有效性及其表現(xiàn),分別記為L(zhǎng)R-Tob和LRT2b。而且,我們還探討了群體分層對(duì)新提出方法的影響。另外,我們用均方根誤和偏差來(lái)評(píng)估未知參數(shù)的最大似然估計(jì)值的估計(jì)準(zhǔn)確性。最后,我們使用了來(lái)自北美的類(lèi)風(fēng)濕關(guān)節(jié)炎基因數(shù)據(jù)對(duì)新提出方法加以實(shí)例驗(yàn)證。(2)考慮在關(guān)聯(lián)存在的前提下,提出x染色體上質(zhì)量性狀的印記效應(yīng)檢驗(yàn)方法。首先,針對(duì)父母和患病女兒組成的三聯(lián)體家庭,用統(tǒng)計(jì)量XPAT (parental-asymmetry test on X chromosome)來(lái)檢驗(yàn)X染色體上的印記效應(yīng)。然后,基于兩人家庭(父親-女兒對(duì)或母親-女兒對(duì)),提出檢驗(yàn)統(tǒng)計(jì)量1-XPAT。通過(guò)同時(shí)考慮三聯(lián)體和兩人家庭,構(gòu)造統(tǒng)計(jì)量C-XPAT來(lái)檢驗(yàn)印記效應(yīng)。更進(jìn)一步地,我們把這三種方法拓展到可以納入多個(gè)小孩且其中至少有一個(gè)患病女兒的完整家庭(家庭成員的基因信息是完整的)和不完整核心家庭(父代中父親或母親的基因信息缺失)。值得注意的是,因?yàn)?-XPAT統(tǒng)計(jì)量中需要用到等位基因頻率,我們用三種方式加以處理:用真實(shí)的等位基因頻率,相應(yīng)的統(tǒng)計(jì)量記為1-XPATt;用母親等位基因頻率的估計(jì)值,相應(yīng)的統(tǒng)計(jì)量記為1-XPATm;用父親等位基因頻率的估計(jì)值,相應(yīng)的統(tǒng)計(jì)量記為1-XPATfo最后,我們使用了來(lái)自北美的類(lèi)風(fēng)濕關(guān)節(jié)炎基因數(shù)據(jù)對(duì)新提出方法加以實(shí)例驗(yàn)證。結(jié)果:(1)模擬結(jié)果表明,LRT0和LRT2的第一類(lèi)錯(cuò)誤率均偏保守,LRT1的第一類(lèi)錯(cuò)誤率接近顯著性水平。而LRT0和LRT2經(jīng)過(guò)參數(shù)的bootstrap方法校正后(LRTob和LRT2b)能很好地控制犯第一類(lèi)錯(cuò)誤的概率。Z0,Z1和Z2也能很好地控制第一類(lèi)錯(cuò)誤率。通過(guò)不同的參數(shù)設(shè)置來(lái)比較這幾個(gè)統(tǒng)計(jì)量的檢驗(yàn)效能,LRTob的檢驗(yàn)效能比LRTo與Z0的都要高,而LRTo和Zo的檢驗(yàn)效能很接近;LRT1和Z1的檢驗(yàn)效能也很接近;當(dāng)近交系數(shù)大于0時(shí),LRT2b的檢驗(yàn)效能比LRT2與Z2的都要高,且LRT2比Z2的檢驗(yàn)效能稍微小一點(diǎn)。對(duì)于男性等位基因頻率的估計(jì)值,不管用EM算法估計(jì)或Zheng等人的方法估計(jì),值是一樣的;對(duì)于女性等位基因頻率和合并等位基因頻率的估計(jì)值,不管是用EM算法估計(jì)或Zheng等人的方法估計(jì),其均方根誤和偏差都很接近。而對(duì)于近交系數(shù)的估計(jì)值,在某些情況下,雖然基于EM算法的偏差比Zheng等人的稍大,但是在所有情況下,基于EM算法的均方根誤都比Zheng等人的要小。另外,群體分層模型確實(shí)會(huì)導(dǎo)致近交系數(shù)不為0,這跟Overall和Nichols的結(jié)論是一致的。此時(shí)基于EM算法的近交系數(shù)估計(jì)值的均數(shù)比Zheng等人的估計(jì)值稍大,但相應(yīng)的標(biāo)準(zhǔn)差要小。另外,類(lèi)風(fēng)濕關(guān)節(jié)炎數(shù)據(jù)的分析結(jié)果表明,雖然沒(méi)有找到有統(tǒng)計(jì)學(xué)意義的位點(diǎn),但證實(shí)了新提出方法的實(shí)用性。(2)在不同的參數(shù)設(shè)置情況下,對(duì)新提出方法的第一類(lèi)錯(cuò)誤率和檢驗(yàn)效能進(jìn)行了模擬。模擬結(jié)果表明,XPAT在各種參數(shù)設(shè)置下的第一類(lèi)錯(cuò)誤率都在顯著性水平附近;1-XPATt和1-XPATm的第一類(lèi)錯(cuò)誤率保持在顯著性水平附近,但1-XPATf嚴(yán)重偏大。因此,在后續(xù)的模擬研究中,我們僅用母親等位基因頻率的估計(jì)值計(jì)算1-XPAT的值。通過(guò)納入不完整核心家庭,C-XPAT的檢驗(yàn)效能比只納入完整核心家庭的XPAT明顯要高很多。另外,不管女性群體中的近交系數(shù)是否為0,新提出方法的第一類(lèi)錯(cuò)誤率一直保持在顯著性水平附近。類(lèi)風(fēng)濕關(guān)節(jié)炎數(shù)據(jù)的分析結(jié)果表明,雖然沒(méi)有找到與印記相關(guān)的有統(tǒng)計(jì)學(xué)意義的位點(diǎn),但證實(shí)了新提出方法的實(shí)用性。結(jié)論:(1)為了提高檢驗(yàn)X染色體上Hardy-Weinberg平衡律的檢驗(yàn)效能,提出了三種似然比檢驗(yàn)方法。但由于其中有兩個(gè)統(tǒng)計(jì)量的第一類(lèi)錯(cuò)誤率偏保守,所以我們采用參數(shù)的bootstrap方法尋找其分布的臨界值。模擬結(jié)果表明,基于bootstrap方法的LRTob和LRT2b,LRT1,Zo和之前的Z1和Z2的第一類(lèi)錯(cuò)誤率在各自的原假設(shè)下都能控制在顯著性水平的附近。通過(guò)檢驗(yàn)效能的比較,LRTob的檢驗(yàn)效能比LRT0和Z0都高。在近交系數(shù)大于0的情況下,LRT2b的檢驗(yàn)效能比LRT2和Z2高很多,然而LRT2比Z2的檢驗(yàn)效能稍微小一點(diǎn)。另外,在男性等位基因頻率不等于女性等位基因頻率的情況下,LRT1和Z1的檢驗(yàn)效能很接近。(2)在X染色體上的標(biāo)記位點(diǎn)與疾病位點(diǎn)存在關(guān)聯(lián)的情況下,針對(duì)質(zhì)量性狀,提出檢驗(yàn)印記效應(yīng)的方法。首先,基于由父母和他們患病的女兒組成的三聯(lián)體家庭,構(gòu)建X染色體上的親代不對(duì)稱(chēng)檢驗(yàn)XPAT。然后,我們用1-XPAT來(lái)處理兩人家庭(父女對(duì)或母女對(duì))。通過(guò)同時(shí)考慮三聯(lián)體家庭和兩人家庭,我們用C-XPAT來(lái)檢驗(yàn)印記效應(yīng)。更進(jìn)一步地,我們把這三種方法拓展到可以處理完整和不完整核心家庭,這兩種核心家庭中可以包含多個(gè)女兒,但至少有一個(gè)女兒是患病的。在不同的參數(shù)設(shè)置下,我們通過(guò)模擬研究來(lái)評(píng)估新提出方法的第一類(lèi)錯(cuò)誤率和檢驗(yàn)效能。模擬中的樣本主要考慮三種不同家庭結(jié)構(gòu),這樣比只考慮一種結(jié)構(gòu)更加合理。模擬結(jié)果表明,在不同的參數(shù)設(shè)置下,新提出方法的第一類(lèi)錯(cuò)誤率被控制得很好。通過(guò)檢驗(yàn)效能的比較,不論用真實(shí)等位基因頻率或母親的基因型估計(jì)的等位基因頻率,C-XPAT的檢驗(yàn)效能都比XPAT高。在此研究中,不需要女性群體中Hardy-Weinberg平衡律成立的假設(shè),這一點(diǎn)已經(jīng)在理論推斷和模擬研究中被證實(shí)。
【關(guān)鍵詞】:X染色體 似然比檢驗(yàn) 標(biāo)記位點(diǎn) 近交系數(shù) 質(zhì)量性狀 印記效應(yīng)
【學(xué)位授予單位】:南方醫(yī)科大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:R394
【目錄】:
- 摘要3-8
- ABSTRACT8-15
- 第一章 前言15-21
- 1.1 基本概念15-17
- 1.2 印記效應(yīng)17
- 1.3 關(guān)聯(lián)分析17-18
- 1.4 論文組成部分18-19
- 1.5 參考文獻(xiàn)19-21
- 第二章 X染色體標(biāo)記位點(diǎn)上Hardy-Weinberg平衡律的似然比檢驗(yàn)21-73
- 2.1 引言21-22
- 2.2 方法22-28
- 2.3 結(jié)果28-40
- 2.4 討論40-44
- 2.5 附錄44-70
- 2.6 參考文獻(xiàn)70-73
- 第三章 X染色體上基于質(zhì)量性狀和核心家庭的遺傳印記效應(yīng)檢驗(yàn)方法73-111
- 3.1 引言73-74
- 3.2 方法74-79
- 3.3 結(jié)果79-90
- 3.4 討論90-93
- 3.5 附錄93-109
- 3.6 參考文獻(xiàn)109-111
- 第四章 研究展望111-112
- 碩士論文發(fā)表情況112-113
- 致謝113-115
- 基金115-116
本文編號(hào):803785
本文鏈接:http://www.sikaile.net/yixuelunwen/binglixuelunwen/803785.html
最近更新
教材專(zhuān)著