短序列增強(qiáng)子和Alu重復(fù)序列影響基因表達(dá)的實(shí)驗(yàn)研究和生物信息學(xué)分析
發(fā)布時(shí)間:2018-06-20 19:05
本文選題:增強(qiáng)子 + 生物信息學(xué) ; 參考:《河北醫(yī)科大學(xué)》2015年博士論文
【摘要】:目的:順式作用元件是位于DNA分子中調(diào)節(jié)基因表達(dá)的序列,對(duì)基因表達(dá)調(diào)節(jié)有重要的作用,但是這些順式作用元件的功能及調(diào)節(jié)基因表達(dá)的作用機(jī)制大部分仍然未被闡明。研究順式作用元件調(diào)控影響基因表達(dá)的作用機(jī)制,對(duì)于研究生物表觀遺傳、分化、衰老和腫瘤發(fā)生等生物學(xué)現(xiàn)象具有重要的意義。增強(qiáng)子是一種活化基因的順式作用元件,能夠增強(qiáng)基因表達(dá),在調(diào)節(jié)基因表達(dá)過(guò)程中發(fā)揮著重要作用;虮磉_(dá)調(diào)節(jié)是當(dāng)前生物學(xué)中的一個(gè)焦點(diǎn)問(wèn)題,與衰老,分化,腫瘤發(fā)生等多種生物學(xué)現(xiàn)象相關(guān)。為了更深地理解這些生物學(xué)現(xiàn)象,必須闡明基因表達(dá)調(diào)節(jié)的機(jī)制。雖然基因表達(dá)調(diào)節(jié)機(jī)制非常復(fù)雜,但是可以用簡(jiǎn)化的系統(tǒng)進(jìn)行研究。為了研究短序列增強(qiáng)子活化基因的作用機(jī)制,我們?cè)谇捌诠ぷ髦薪⒘艘粋(gè)簡(jiǎn)化的研究系統(tǒng):利用Alu元件抑制GFP報(bào)告基因表達(dá),用綠色熒光蛋白表達(dá)系統(tǒng)研究短序列DNA及其衍生序列的增強(qiáng)子活性。本研究室在前期工作中,由14個(gè)拷貝的Alu同向串聯(lián)(Alu×14)插入到p EGFP-C1質(zhì)粒中GFP報(bào)告基因的下游,從而構(gòu)建C1-Alu×14質(zhì)粒。我們發(fā)現(xiàn)將C1-Alu×14質(zhì)粒瞬時(shí)轉(zhuǎn)染He La細(xì)胞后,Alu×14序列對(duì)GFP報(bào)告基因表達(dá)具有顯著抑制作用;短序列AA(5′-GTGAAATAAATGCAAATAAAGT)插入C1-Alu×14質(zhì)粒中GFP基因和Alu×14序列之間構(gòu)建的C1-AA×2-Alu×14質(zhì)粒瞬時(shí)轉(zhuǎn)染He La細(xì)胞后,短序列AA可以部分解除Alu×14序列對(duì)GFP報(bào)告基因表達(dá)的抑制作用,表現(xiàn)出一定的增強(qiáng)子活性。在本研究中,我們重點(diǎn)研究的是AA序列及其突變序列調(diào)節(jié)GFP報(bào)告基因表達(dá)的作用機(jī)制及增強(qiáng)子序列的結(jié)構(gòu)對(duì)基因表達(dá)所產(chǎn)生的影響。Alu元件是人的主要短散布核元件(SINE),有一百多萬(wàn)拷貝,大約占全部人類基因組的十分之一,在生物進(jìn)化過(guò)程中SINE一直是強(qiáng)制存在,因此多數(shù)學(xué)者認(rèn)為SINE具有重要的生物學(xué)功能。然而,至今為止多數(shù)Alu元件的生物學(xué)功能仍未闡明。許多證據(jù)表明Alu元件屬于沉默子,其可以抑制基因表達(dá)。在細(xì)胞核中Alu RNA作為轉(zhuǎn)錄協(xié)同抑制物,是反義轉(zhuǎn)錄組中最多的部分,具有以順式作用或者反式作用的方式下調(diào)正義表達(dá)的可能性。我們的前期研究表明Alu元件通過(guò)觸發(fā)染色質(zhì)緊密包裝抑制GFP報(bào)告基因表達(dá)。雖然認(rèn)為Alu元件屬于沉默子,但是在看家基因和高表達(dá)染色體中,Alu元件含量卻十分豐富,這個(gè)矛盾現(xiàn)象長(zhǎng)期困擾著生物學(xué)家。為了研究基因組中Alu元件的生物學(xué)意義,我們做了一些關(guān)于Alu元件的實(shí)驗(yàn)研究和生物信息學(xué)分析。方法:1 DNA模板及引物的合成。委托北京賽百盛基因技術(shù)有限公司合成攜帶適當(dāng)?shù)暮怂醿?nèi)切酶識(shí)別位點(diǎn)的引物及DNA模板。本論文中所用到的引物及DNA模板的名稱和具體序列參見(jiàn)論文的附表。2表達(dá)載體的構(gòu)建。2.1 AA及其衍生序列相關(guān)表達(dá)載體的構(gòu)建。設(shè)計(jì)帶有合適的2個(gè)限制性內(nèi)切酶(Ecor I/Xba I或Kpn I/Nhe I)酶切位點(diǎn)引物,以AA及其衍生序列為模板進(jìn)行PCR擴(kuò)增出攜有4個(gè)限制性內(nèi)切酶Ecor I/Xba I和Kpn I/Nhe I酶切位點(diǎn)的DNA序列。利用限制性內(nèi)切酶Ecor I/Kpn I分別雙酶切AA及其衍生序列PCR產(chǎn)物和C1-Alu14質(zhì)粒,隨后用T4 DNA Ligase連接同時(shí)帶有相同粘性末端的AA及其衍生序列小片段和C1-Alu14表達(dá)載體大片段,隨即通過(guò)表達(dá)載體轉(zhuǎn)化、質(zhì)粒提取等步驟獲得構(gòu)建插入一個(gè)AA及其衍生序列的表達(dá)載體。分別用HindⅢ/NheⅠ和HindⅢ/XbaⅠ雙酶切含有一個(gè)AA及其衍生序列的表達(dá)載體,獲取AA及其衍生序列的目的基因小片段和C1-AA-Alu14表達(dá)載體大片段,通過(guò)T4 DNA Ligase連接以上AA及其衍生序列的目的基因小片段和C1-AA-Alu14表達(dá)載體大片段,從而獲得含有兩個(gè)AA及其衍生序列的表達(dá)載體。2.2 Alu相關(guān)表達(dá)載體的構(gòu)建。Alu序列為通過(guò)PCR擴(kuò)增含有人染色體Xq13.1中的Alu序列的RP11-29107克隆模板獲得;Lac Z序列(J01636.1)擴(kuò)增自大腸桿菌;4TMI(5′-GTGAAATAAATGCTTTTTTTGT)是我們?cè)谇捌谘芯恐邪l(fā)現(xiàn)的一個(gè)具有較高增強(qiáng)子活性的22nt寡核苷酸序列;CMV啟動(dòng)子擴(kuò)增自質(zhì)粒pc DNA3.1+(1-882bp),其包含完整的CMV啟動(dòng)子。質(zhì)粒的構(gòu)建方法同前,所構(gòu)建的表達(dá)載體均通過(guò)酶切和基因測(cè)序(委托北京諾賽基因組研究中心有限公司完成)進(jìn)行鑒定。3細(xì)胞轉(zhuǎn)染包括瞬時(shí)轉(zhuǎn)染和穩(wěn)定轉(zhuǎn)染。用脂質(zhì)體轉(zhuǎn)染試劑LipofectamineTM2000瞬時(shí)轉(zhuǎn)染處于對(duì)數(shù)生長(zhǎng)期的He La細(xì)胞,利用G418試劑篩選獲得穩(wěn)定轉(zhuǎn)染的He La細(xì)胞,詳細(xì)方法見(jiàn)論文正文。4熒光顯微鏡觀察將重組質(zhì)粒表達(dá)載體轉(zhuǎn)染Hela細(xì)胞后,在熒光顯微鏡下觀察計(jì)數(shù)GFP熒光陽(yáng)性細(xì)胞數(shù)。首先用熒光顯微鏡在紫外光照射下計(jì)數(shù)視野中GFP陽(yáng)性細(xì)胞數(shù),然后再在白光照射下記錄相同視野中的細(xì)胞總數(shù),每個(gè)樣本至少記錄500個(gè)細(xì)胞,計(jì)算GFP細(xì)胞陽(yáng)性率。實(shí)驗(yàn)數(shù)據(jù)結(jié)果用均數(shù)±標(biāo)準(zhǔn)差(x±SD)表示。GFP熒光細(xì)胞陽(yáng)性率=(GFP熒光陽(yáng)性細(xì)胞個(gè)數(shù)/相同視野中細(xì)胞總數(shù))×100%5 RT-PCR利用Trizol法從He La細(xì)胞中提取總RNA,用DNase I將總RNA中的DNA降解后,通過(guò)9-nt隨機(jī)引物和逆轉(zhuǎn)錄酶等構(gòu)成的逆轉(zhuǎn)錄體系將RNA逆轉(zhuǎn)錄為c DNA,然后以逆轉(zhuǎn)錄產(chǎn)物為模板,進(jìn)行PCR擴(kuò)增GFP基因。6聚丙烯酰胺凝膠電泳(PAGE)通過(guò)PAGE觀察22nt寡核苷酸構(gòu)象。為確定AA序列是否通過(guò)非典型堿基互補(bǔ)形成二級(jí)結(jié)構(gòu),我們委托基因合成公司合成了七個(gè)長(zhǎng)度為22nt的DNA單鏈,用PAGE和銀染法觀察這七個(gè)DNA單鏈的構(gòu)象,本實(shí)驗(yàn)采用含T堿基豐富的序列作為PAGE的marker。在20%的聚丙烯酰胺凝膠中進(jìn)行不同溫度、不同離子強(qiáng)度、變性膠和非變性膠條件下的PAGE,銀染后,觀察DNA單鏈在不同條件下的電泳遷移率,通過(guò)DNA單鏈的電泳遷移率,推測(cè)其是否具有形成不同二級(jí)結(jié)構(gòu)的能力,從而推測(cè)基因空間構(gòu)象和基因生物學(xué)功能之間的關(guān)系。7流式細(xì)胞儀檢測(cè)通過(guò)流式細(xì)胞儀檢測(cè)轉(zhuǎn)染質(zhì)粒后的He La細(xì)胞中GFP的表達(dá)情況,此項(xiàng)工作委托河北醫(yī)科大學(xué)第四醫(yī)院科研中心完成。熒光表達(dá)強(qiáng)度用GFP標(biāo)記量表示。GFP標(biāo)記量等于陽(yáng)性細(xì)胞均道值乘以陽(yáng)性細(xì)胞百分率(超過(guò)門值的陽(yáng)性細(xì)胞百分?jǐn)?shù)),再乘以100。GFP標(biāo)記量=XM×Gated%×1008生物信息學(xué)分析獲取五個(gè)不同物種(人、狗、貓、大鼠、小鼠)的α珠蛋白基因簇及其側(cè)翼序列的基因序列,這些序列來(lái)源于以下數(shù)據(jù)庫(kù):Homo sapiens(assembly GRCh38)(http://www.ncbi.nlm.nih.gov/genome/?term=hu man);Canis lupus familiaris(assembly Can Fam3.1)(http://www.ncbi.nlm.nih.gov/genome/?term=dog);Felis catus(assembly Felis_catus-6.2)(http://www.ncbi.nlm.nih.gov/genome/?term=cat);Rattus norvegicus(assembly Rnor_6.0)(http://www.ncbi.nlm.nih.gov/genome/?term=rat);Mus musculus(assembly GRCm38.p2)(http://www.ncbi.nlm.nih.gov/genome/?term=mouse。利用重復(fù)序列遮蔽服務(wù)器(Repeat Masker server)(http://www.repeatmasker.org)檢測(cè)α珠蛋白基因簇及其側(cè)翼序列中的重復(fù)序列。人類α珠蛋白基因簇及其側(cè)翼序列突變會(huì)導(dǎo)致血紅蛋白病,因此我們從以下數(shù)據(jù)庫(kù)獲取了人血紅蛋白病患者的α珠蛋白基因簇及其側(cè)翼序列的基因突變數(shù)據(jù):Hb Var database(http://globin.bx.psu.edu/hbvar/menu.html)。結(jié)果1質(zhì)粒表達(dá)載體的構(gòu)建及鑒定通過(guò)酶切和基因測(cè)序兩種檢測(cè)手段鑒定本文實(shí)驗(yàn)中所用的質(zhì)粒表達(dá)載體均正確。2 AA及其衍生序列對(duì)GFP基因表達(dá)的影響質(zhì)粒轉(zhuǎn)染He La細(xì)胞后,在熒光顯微鏡下觀察計(jì)數(shù),通過(guò)比較熒光陽(yáng)性細(xì)胞率,我們發(fā)現(xiàn)22R,4TMI,AA可以活化GFP報(bào)告基因,而4T,TT,7Pie A和7Pie T不能活化GFP報(bào)告基因,結(jié)果具有統(tǒng)計(jì)學(xué)意義。AA序列中的T堿基逐一突變?yōu)锳,G,C而衍生的15個(gè)序列均具有增強(qiáng)子活性,其中大部分突變序列的增強(qiáng)子活性略低于AA序列,結(jié)果具有統(tǒng)計(jì)學(xué)意義。3 AA序列在轉(zhuǎn)錄水平增強(qiáng)GFP報(bào)告基因表達(dá)AA序列活化GFP報(bào)告基因能力強(qiáng)于7pie A序列,為了研究AA序列活化GFP報(bào)告基因的機(jī)制,我們利用RT-PCR方法檢測(cè)GFP RNA表達(dá)水平。為增加實(shí)驗(yàn)的準(zhǔn)確性,我們采用三對(duì)引物擴(kuò)增不同位置的GFP RNA。研究發(fā)現(xiàn)AA序列比7pie A和Alu14序列能夠誘導(dǎo)更多的GFP RNA。這些結(jié)果與GFP蛋白檢測(cè)結(jié)果一致,從而說(shuō)明質(zhì)粒中插入AA序列可以增加細(xì)胞內(nèi)GFP RNA含量。由于基因的轉(zhuǎn)錄增加或者RNA降解減慢都可能造成細(xì)胞內(nèi)RNA含量增加,即GFP RNA含量增加可能發(fā)生在轉(zhuǎn)錄水平,也可能發(fā)生在RNA降解水平。為了研究這個(gè)問(wèn)題,我們利用放線菌素D抑制RNA生成,再采用RT-PCR檢測(cè)GFP RNA含量。在相同實(shí)驗(yàn)條件下,假設(shè)細(xì)胞中的RNA降解速率相同,實(shí)驗(yàn)發(fā)現(xiàn)質(zhì)粒中插入AA序列的GFP RNA含量要高于質(zhì)粒中插入7pie A序列的GFP RNA含量,這些結(jié)果表明,AA序列誘導(dǎo)更多GFP報(bào)告基因蛋白表達(dá)是GFP報(bào)告基因轉(zhuǎn)錄增加的結(jié)果,即AA序列增強(qiáng)GFP報(bào)告基因表達(dá)發(fā)生在轉(zhuǎn)錄水平。4利用PAGE觀察DNA寡核苷酸構(gòu)象在室溫條件的PAGE中,利用20%變性膠PAGE我們發(fā)現(xiàn)AA等7個(gè)22 nt寡核苷酸序列的電泳遷移率不同,從快到慢依次為7pie AAA22R4T4TMITT7pie T。7pie A,AA,22R,4T,4TMI,TT,7pie T序列中A堿基的數(shù)目分別為14,12,8,7,6,2,0。通過(guò)相關(guān)性分析我們發(fā)現(xiàn)A堿基的數(shù)目多少與電泳遷移率快慢成正比關(guān)系。由此表明含A堿基較多的序列比含T堿基較多的序列的電泳遷移率要快。然而,在1×TBE和低溫條件的PAGE中,4T序列的電泳遷移率最快,其遷移速度快于15 nt marker的遷移速度;在1×TB-10 m M Mg Cl2和室溫條件的PAGE中,22R,4T,AA,7pie A和4TMI的電泳遷移率介于22 nt markers和19 nt markers之間;在1×TB-10 m M Mg Cl2和低溫條件的PAGE中,22R,4T,AA,7pie A和4TMI的電泳遷移率介于19 nt markers和15 nt markers之間。5表達(dá)載體中正義Alu和反義Alu組合活化GFP報(bào)告基因?qū)⒈磉_(dá)載體C1-4TMI-Alu×14-CMV-Alu×2(4TMI-Alu-sense-sense),C1-4TMI-Alu×14-CMV-Alu×2as(4TMI-Alu-sense-antisense)穩(wěn)定轉(zhuǎn)染He La細(xì)胞后,經(jīng)流式細(xì)胞儀檢測(cè)發(fā)現(xiàn)轉(zhuǎn)染4TMI-Alu-sense-antisense質(zhì)粒的GFP標(biāo)記量是轉(zhuǎn)染4TMI-Alu-sense-sense質(zhì)粒GFP標(biāo)記量的4倍,其中轉(zhuǎn)染4TMI-Alu-sense-antisense質(zhì)粒所產(chǎn)生的GFP標(biāo)記量最高,這表明正義Alu和反義Alu組合可以活化GFP報(bào)告基因,促進(jìn)GFP報(bào)告基因表達(dá)。6正義Alu和反義Alu組合活化GFP報(bào)告基因具有細(xì)胞種屬來(lái)源依賴性將表達(dá)載體C1-4TMI-Alu×14-CMV-Alu×2(4TMI-Alu-sense-sense),C1-4TMI-Alu×14-CMV-Alu×2as(4TMI-Alu-sense-antisense)穩(wěn)定轉(zhuǎn)染He La細(xì)胞后,經(jīng)流式檢測(cè)可見(jiàn)4TMI-Alu-sense-antisense明顯活化GFP報(bào)告基因,而以上質(zhì)粒轉(zhuǎn)染BHK21細(xì)胞,卻沒(méi)有見(jiàn)到明顯的基因活化作用。7正義Alu和反義Alu活化GFP報(bào)告基因具有增強(qiáng)子依賴性無(wú)增強(qiáng)子、1個(gè)增強(qiáng)子、2個(gè)增強(qiáng)子表達(dá)載體轉(zhuǎn)染He La細(xì)胞誘導(dǎo)的GFP標(biāo)記量之間的比率為1:3.3:12.7,此結(jié)果表明表達(dá)載體誘導(dǎo)GFP標(biāo)記量隨著增強(qiáng)子數(shù)目增加而上升。8正義Alu與反義Alu適當(dāng)搭配活化GFP報(bào)告基因需要足夠多的Alu拷貝數(shù)當(dāng)5’端Alu上游與3’端Alu上游均存在增強(qiáng)子時(shí),Alu-sense-antisense表達(dá)載體隨著3’端Alu拷貝數(shù)的增加,表達(dá)載體誘導(dǎo)的GFP標(biāo)記量上升。由此可以看出正義Alu與反義Alu適當(dāng)組合活化GFP報(bào)告基因需要足夠多的Alu拷貝數(shù)。9正義和反義Alu組合在穩(wěn)定轉(zhuǎn)染條件下才能夠活化GFP報(bào)告基因Alu-sense-sense和Alu-sense-antisense表達(dá)載體在瞬時(shí)轉(zhuǎn)染He La細(xì)胞48小時(shí)時(shí)GFP標(biāo)記量達(dá)到最高峰,兩組表達(dá)載體所誘導(dǎo)的GFP標(biāo)記量之間沒(méi)有明顯的差異。然而Alu-sense-antisense表達(dá)載體穩(wěn)定轉(zhuǎn)染He La細(xì)胞24天后開(kāi)始表現(xiàn)出明顯的活化GFP報(bào)告基因能力,說(shuō)明正義和反義Alu適當(dāng)組合活化GFP報(bào)告基因必須在穩(wěn)定轉(zhuǎn)染條件下才能夠?qū)崿F(xiàn)。10不同物種α珠蛋白基因簇重復(fù)序列分布經(jīng)生物信息學(xué)發(fā)現(xiàn)人類及其他四種動(dòng)物α珠蛋白基因簇中SINE含量豐富,SINE在α珠蛋白基因簇中分布明顯高于其在β珠蛋白基因簇中分布,α珠蛋白基因簇HBZ基因上下游100kb范圍內(nèi)的SINE基礎(chǔ)頻率明顯高于其在全基因組分布的平均值。這表明SINE在五個(gè)物種的α珠蛋白基因簇中可能發(fā)揮同樣作用,這與α珠蛋白基因表達(dá)可能有關(guān)。11基因大片段缺失導(dǎo)致的人類血紅蛋白病經(jīng)對(duì)人類α珠蛋白基因簇基因缺失數(shù)據(jù)的生物信息學(xué)分析發(fā)現(xiàn),很多類型的基因缺失突變可以導(dǎo)致人類血紅蛋白病,然而在眾多基因缺失病例中,我們發(fā)現(xiàn)唯獨(dú)沒(méi)有保留HBA1基因同時(shí)HBA1下游基因大面積缺失的病例。通過(guò)國(guó)際千人基因組基因數(shù)據(jù)庫(kù)(http://browser.1000genomes.org/)查詢了正常人HBA1下游基因變異數(shù)據(jù),同樣沒(méi)有發(fā)現(xiàn)保留HBA1基因但HBA1基因下游基因大面積缺失的數(shù)據(jù)。12根據(jù)實(shí)驗(yàn)研究和生物信息學(xué)分析結(jié)果,本文中提出了重復(fù)序列活化基因模型:重復(fù)序列連同其他非編碼序列使基因處于轉(zhuǎn)錄和非轉(zhuǎn)錄的臨界狀態(tài),重復(fù)序列所起的作用主要是抑制基因表達(dá),是沉默子,基因一旦轉(zhuǎn)錄,轉(zhuǎn)錄產(chǎn)物中的重復(fù)序列RNA形成網(wǎng)格(RNA networks)活化基因,形成轉(zhuǎn)錄的正反饋,即轉(zhuǎn)錄產(chǎn)物作為輸入激活輸出。結(jié)論1 AA序列具有增強(qiáng)子活性,能夠活化基因,促進(jìn)基因轉(zhuǎn)錄。2 AA序列可能通過(guò)非典型互補(bǔ)形成不穩(wěn)定莖環(huán)結(jié)構(gòu),發(fā)揮增強(qiáng)子活性。3 Alu元件正反組合活化基因必須同時(shí)滿足五個(gè)條件,否則引起基因沉默。這五個(gè)條件是:(1)存在正義和反義Alu組合;(2)細(xì)胞種屬來(lái)源依賴性:在He La中Alu能夠活化基因,在BHK21細(xì)胞中Alu不能活化基因;(3)Alu元件上游必須存在增強(qiáng)子;(4)足夠多的Alu拷貝數(shù);(5)穩(wěn)定轉(zhuǎn)染。提示Alu元件使基因沉默,然而其一旦轉(zhuǎn)錄正反適當(dāng)組合則有活化基因作用。4提出重復(fù)序列活化基因模型:基因組中的基因處于轉(zhuǎn)錄和非轉(zhuǎn)錄的臨界狀態(tài),基因一旦轉(zhuǎn)錄,轉(zhuǎn)錄產(chǎn)物中的重復(fù)序列有活化基因作用。
[Abstract]:......
【學(xué)位授予單位】:河北醫(yī)科大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:R392
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 ;Impact of copy number of distinct SV40PolyA segments on expression of a GFP reporter gene[J];Science China(Life Sciences);2010年05期
,本文編號(hào):2045372
本文鏈接:http://www.sikaile.net/yixuelunwen/jichuyixue/2045372.html
最近更新
教材專著